Помощь в учёбе, очень быстро...
Работаем вместе до победы

Раздел. 
Системы речевого общения

РефератПомощь в написанииУзнать стоимостьмоей работы

Третье свойство — разгрузка зрения и рук — важно для создания нового поколения систем оперативного человеко-машинного управления сложными объектами. К ним относятся, прежде всего, системы управления движением, энергетическими установками и другие АСУ ТП, САПР и ИСУ. В эпоху, когда интенсивность движения и сложность объектов становятся критическими, любая новая возможность повысить оперативность… Читать ещё >

Раздел. Системы речевого общения (реферат, курсовая, диплом, контрольная)

Основные положения

В системах искусственного интеллекта с элементами естественно-языкового общения (ЕЯ-общения) обычно предполагается, что в качестве средства коммуникации используется письменная речь. По понятным причинам это не всегда удобно, а во многих случаях и не эффективно. Использование устной речи как средства общения позволяет почти на порядок повысить скорость ввода информации, разгрузить зрение и освободить руки, осуществить речевое общение на значительном расстоянии и по телефону. Если не затрагивать общих проблем ЕЯ-общения, которые связаны с созданием преобразователей «смысл — текст» и «текст — смысл», то узкоспециальными проблемами, стоящими перед разработчиками систем речевого общения (СРО), становятся проблемы создания преобразователей «текст — речевой сигнал» и «речевой сигнал — текст». Первая из них называется проблемой синтеза речи, вторая — анализа и распознавания речи.

В системах ЕЯ-общения под текстом обычно понимают орфографический, или буквенный (как пишется), текст, в СРО — фонемный (как слышится). В создании преобразователей орфографического текста в фонемный и наоборот не существует особых проблем, хотя сложность таких преобразователей для разных языков (к примеру, русского и английского) будет различной. Поэтому, применительно к СРО, можно ограничиться проблемами разработки преобразователей «цепочка фонем — речевой сигнал» и «речевой сигнал — цепочка фонем». В речи фонема выступает в двух аспектах. С одной стороны, это элементарная смыслоразличительная единица письменной речи, с другой — абстрактное обозначение конкретного звука устной речи. Отметим сразу, что не существует счетного множества, а тем более одного-единственного звука речи, соотносимого с фонемой. Если учесть, что на речевой звук налагается целый ряд экстралингвистических факторов: индивидуальные особенности речи и голоса, эмоциональное и физиологическое состояние говорящего, электроакустические характеристики среды и тракта передачи, а также шумы, помехи и искажения, то сложность проблемы, стоящей перед создателями СРО, пожалуй, трудно переоценить.

Современные исследования в области СРО начаты в индустриально развитых странах в начале 60-х годов. Первые промышленные СРО появились в конце 70-х годов. К настоящему времени созданы разнообразные СРО для многих сфер применения. Это связано с осознанием потенциальными потребителями преимуществ СРО:

  • — удобство, простота и естественность процедуры общения, требующей минимума специальной подготовки;
  • — возможность использования для связи с информационной системой телекоммуникационных каналов;
  • — устранение ручных манипуляций с одновременным увеличением скорости ввода информации (в 3—5 раз по сравнению с клавиатурным вводом) и разгрузка зрения при получении информации.

Для иллюстрации того, как могут быть использованы или уже используются три указанных преимущества, приведем некоторые конкретные примеры применения СРО.

Первое и второе преимущества с наибольшим эффектом проявляются в информационных системах управления предприятием, организацией или отраслью. Однако пока они выполняют в основном информационные функции. Одной из причин такого положения является отсутствие массового оперативного контакта человека и системы. В результате чрезвычайно затрудняется выполнение основной функции системы — управление. С внедрением в данные системы речевой технологии общения они станут по-настоящему активным звеном управления. Круг пользователей системы в силу простоты и естественности общения с ЭВМ неизмеримо расширится. При этом человеко-машинное взаимодействие будет осуществляться с помощью локальной, городской, государственной или международной телекоммуникационной сети на значительном расстоянии. В любое время большая группа пользователей сможет одновременно общаться с системами для получения разного рода нормативно-справочной и другой правовой и коммерческой информации. Имея необходимую базу знаний — модель каждого конкретного производства, система будет способна по запросу пользователя дать необходимую консультацию по телефону в случае возникновения трудностей в той или иной сфере производства. Кроме того, система сможет выполнять функции диспетчера, обращаясь по телефону в необходимое время к конкретным специалистам за получением данных о ходе производства, предупреждая их о наступлении критических ситуаций, напоминая о сроках поставки изделий или выполнения разного рода обязательств, а также осуществлять учет и контроль. Несомненно, во всех этих случаях эффективная работа СРО возможна при условии, что она является составной частью систем искусственного интеллекта и современных информационных технологий.

Третье свойство — разгрузка зрения и рук — важно для создания нового поколения систем оперативного человеко-машинного управления сложными объектами. К ним относятся, прежде всего, системы управления движением, энергетическими установками и другие АСУ ТП, САПР и ИСУ. В эпоху, когда интенсивность движения и сложность объектов становятся критическими, любая новая возможность повысить оперативность управления и снизить риск аварии должна быть тщательно изучена и использована. Немедленное получение от ИСУ информации в речевой форме и немедленный ввод речевой команды, безусловно, будут важным дополнением к традиционным системам световой индикации и клавишного управления. При этом получение и передачу информации можно будет осуществлять не только с рабочего места оператора, но и на некотором удалении или даже во время движения.

Говорящие компьютеры с успехом применяют и в непроизводственной сфере, например при обучении родному языку или иностранным языкам. В дальнейшем по мере совершенствования техники машинного перевода появится уникальная возможность синхронного устного перевода как двуязычного, так и многоязычного.

Можно также отметить применение речевой технологии в медицинских целях. Появятся говорящие книги и компьютеры для слепых, управляемые голосом инвалидные коляски, приборы для генерации и восприятия речи глухонемых и др.

Основой для разработки современных СРО являются лингвоакустическая и информационная теории речеобразования и восприятия речи. Лингвистическая теория рассматривает фонетические и просодические характеристики речи, акустическая — акустические характеристики (признаки) фонем и просодем, информационная — структуру речевого сигнала. Эффективность СРО тем выше, чем полнее реализованы в ней принципы функционирования естественной речевой системы человека. При этом не обязательно, чтобы искусственные СРО копировали структурные особенности работы естественной системы. Важно, чтобы СРО как можно ближе была в функциональном отношении к естественной.

Показать весь текст
Заполнить форму текущей работой