Математическое моделирование семантической эквивалентности ?-грамматиками

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Содержание

1. МОДЕЛИРОВАНИЕ СЕМАНТИЧЕСКОЙ ЭКВИВАЛЕНТНОСТИ. ПОСТАНОВКА ЗАДАЧИ
- 1. 1. Постановка задачи на функциональном уровне
- 1. 2. Критерии адекватности формальной модели
- 1. 3. Анализ существующих подходов
- 1. 4. Выбор метода моделирования
- 1. 5. Концептуальная модель установления семантической эквивалентности и общая формальная постановка задачи
- 1. 6. Выводы
2. ПОСТРОЕНИЕ ФОРМАЛЬНОГО АППАРАТА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ГЛУБИННОГО СИНТАКСИСА И ИССЛЕДОВАНИЕ СВОЙСТВ ПРЕДЛОЖЕННОГО АППАРАТА
- 2. 1. Моделирование глубинного синтаксиса грамматиками деревьев
- 2. 2. Исследование проблем алгоритмической разрешимости для класса универсальных правильных синтаксических А-грамматик
- 2. 3. Исследование вопросов алгоритмической сложности для класса универсальных правильных синтаксических А-грамматик
- 2. 4. Расширенные правильные лексико-синтаксические А-грамматики
- 2. 5. Выводы
3. ПОСТРОЕНИЕ ИСЧИСЛЕНИЯ СИНОНИМИЧЕСКИХ ПРЕОБРАЗОВАНИЙ
- 3. 1. Содержательная интерпретация аппарата расширенных лексико-синтаксических А-грамматик в рамках концептуальной модели
- 3. 2. Моделирование системы перифразирования расширенными лексико-синтаксическими А-грамматиками
- 3. 3. Моделирование поверхностной синтаксической структуры деревом зависимостей
- 3. 4. Алгоритм считывания глубинно-синтаксической структуры с дерева синтаксического подчинения
- 3. 5. Выводы
4. ВОПРОСЫ МОДЕЛИРОВАНИЯ СЕМАНТИЧЕСКОЙ ЭКВИВАЛЕНТНОСТИ. АЛГОРИТМИЧЕСКАЯ ЧАСТЬ МОДЕЛИ
- 4. 1. Алгоритм установления семантической эквивалентности высказываний на ЕЯ
- 4. 2. Базовые глубинно-синтаксические структуры
- 4. 3. Пример реализации программного комплекса автоматизированного тестирования на основе предложенной модели семантической эквивалентности
- 4. 4. Выводы

Математическое моделирование семантической эквивалентности ?-грамматиками (реферат, курсовая, диплом, контрольная)

Тенденция увеличения производительности вычислительной техники при снижение ее стоимости способствует расширению сфер применения ЭВМ. Однако повсеместному использованию ЭВМ препятствует ряд факторов, образующих так называемую «проблему общения» [71, 72].

Развитие программирования показало, что общение пользователя с ЭВМважное звено в эффективности решения задач. Для человека идеальным было бы общение на обычном, естественном языке. Кроме того, естественный язык — это, пожалуй, единственная известная нам на сегодня моделирующая система, средствами которой можно описать многообразный окружающий мир. Отсюда большой интерес к анализу естественного языка (ЕЯ) как средства для описания действительности и средства коммуникации между человеком и системой [27].

Интерес к разработке систем общения на ЕЯ проявляется как со стороны научных дисциплин, так и со стороны технических, связанных с разработкой и реализацией на вычислительной технике моделей в виде систем общения, вопросно-ответных систем, систем машинного перевода и других, относящихся к классу интеллектуальных систем (ИС). Обеспечение процесса общения с ЭВМ на ЕЯ на данное время рассматривается как одна из важнейших задач, стоящих перед разработчиками ИС. Задачи исследования методов и разработки подобных систем в настоящее время образуют самостоятельное направление, получившее название «Обработка естественного языка» (Natural Language Processing) [71].

Несмотря на значительные успехи рассматриваемого направления, в настоящее время большинство систем, связанных с обработкой ЕЯ относится к экспериментальным системам, которые не могут быть использованы для решения задач реальной сложности [74]. Прежде всего такое положение обусловлено состоянием теоретических исследований проблем моделирования языка, в частности, отсутствием на настоящее время семантического описания структуры текстов и предложений.

Проведенное рассмотрение моделей общения и моделей языка позволяет констатировать отсутствие единого формального аппарата, который мог бы гарантировать истинность выдвигаемых теорий, принципов и методов. Это обстоятельство и сложность самой проблемы обработки ЕЯ не позволяют в настоящее время разработать и реализовать модель ЕЯ в полном объеме, претендуя на полноту и охватывая все нюансы, связанные с обработкой ЕЯ. Однако, при разумно выбранных ограничениях на язык и предметную область существующими методами можно разработать системы обработки ЕЯ, пригодные для практического применения при решении задач реальной степени сложности.

Решаемая в настоящей диссертационной работе проблема моделирования семантической эквивалентности высказываний на ЕЯ относится к вопросам обработки естественного языка и ориентирована на практическую реализацию в системах по установлению смысловой тождественности входной текстовой информации.

Областью непосредственного применения теоретических результатов настоящей работы является автоматизация обучения, более конкретноавтоматизированный контроль знаний. Важное преимущество автоматизированного обучения состоит во всеобщем и постоянном контроле и объективной оценке результатов, в отличии от выборочного периодического контроля, характерного для традиционного метода обучения [1]. Указанное преимущество обеспечивает, как правило, гораздо большую эффективность автоматизированного обучения по сравнению с традиционным.

Однако, рассматривая задачу установления семантической эквивалентности как задачу распознавания смыслов, практическая значимость построенной модели семантической эквивалентности не ограничивается отмеченной областью автоматизированного тестирования знаний. Любая система, функционирующая в естественных человеческих языках, либо обрабатывающая выразительные средства общения, такие как текст и голос, включает в качестве необходимого компонента модуль обработки ЕЯ с целью автоматического перевода с внешнего языкового представления на язык смыслов с процедурами классификации и объединения языковых оборотов, равнозначных по смыслу.

Учитывая обоснованное существование проблемы обработки естественных языков в плане распознавания смысла, отсутствие единых общепризнанных теоретических подходов и формальных средств описания семантики ЕЯ, а также практическую значимость и ориентацию проблемы установления смысловой эквивалентности на практическое применение, сформулируем главную цель работы следующим образом: разработка и исследование формальной математической модели семантической эквивалентности высказываний на естественном языке с целью практической реализации механизма установления тождественности смыслов высказываний с теоретическим обоснованием алгоритмической разрешимости этого механизма и оценкой вычислительной сложности соответствующей вычислительной задачи.

Диссертационная работа состоит из введения, четырех глав, заключения, приложения, списка используемых сокращений и библиографического списка.

Результаты работы имеют не только научную, но и практическую значимость. Использование для формального описания глубинного синтаксиса и системы перифразирования введенного математического аппарата расширенных лексико-синтаксических А-грамматик позволяет теоретически обосновать принципиальную возможность существования алгоритмического решения для задач анализа глубинно-синтаксических представлений естественно-языковых фраз и принадлежность этих задач к классу задач полиномиальной временной сложности.

Предложенные в работе алгоритмы позволяют эффективно решать задачи установления смысловой эквивалентности высказываний на естественном языке без существенного ограничения предметной области. Отсутствие в предлагаемых вычислительных схемах процедур обработки семантических представлений анализируемых высказываний, и, как следствие, отсутствие обращений к семантическо-русскому словарю, не только существенно упрощает алгоритмическую сложность механизма установления семантической эквивалентности, но и делает реализацию этого процесса принципиально возможной в силу отсутствия на настоящее время такого словаря для естественных языков. На современном этапе сведение текста на ЕЯ к его семантическому представлению без существенного ограничения предметной области не осуществимо прежде всего в связи с абсолютно недостаточной теоретической изученностью соответствующих процессов и неразработанностью конкретных вариантов семантического представления для большого объема лексики ЕЯ.

Практическое применение построенной модели семантической эквивалентности не ограничивается рассмотренной в качестве примера реализации областью автоматизации обучения. Учитывая современную тенденцию функционирования ЭВМ в естественных человеческих языках, при ведении диалога важно уметь осуществлять автоматический перевод с внешнего языкового представления на внутренний язык вычислительной задачи. С этой целью удобно использовать предложенный в работе формальный аппарат Л-грамматик с процедурами классификации и объединения языковых оборотов, равнозначных по смыслу.

Материалы работы основаны на публикациях [34, 35, 44−47], из них 4 опубликовано и 2 депонировано в ВИНИТИ. Полученные результаты апробированы в докладах на конференциях: 12-ой Международной научной конференции «Математические методы в технике и технологиях — ММТТ-12» (Великий Новгород, 1999), 3-ей Всероссийской с участием стран СНГ конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-3−97) (Нижний Новгород, 1997), в докладах на научных конференциях в рамках Дней Науки в НовГУ (Новгород, 1995), (Новгород, 1996), (Новгород, 1997).

Все научные и практические результаты получены автором самостоятельно.

Все теоретические положения диссертации доведены до вида алгоритмов и схем программ и проверены в ходе машинного эксперимента. Для подтверждения полученных теоретических положений был проведен машинный эксперимент по установлению семантической эквивалентности высказываний на естественном русском языке. Реализованы следующие необходимые подсистемы экспериментального программного комплекса: морфологический компонентреализует грамматический разбор входного предложениясинтаксический компонент — реализует синтаксический разбор входного предложения с анализом результатов в виде дерева подчиненияпреобразователь дерева синтаксического подчинения в глубинную синтаксическую структуру для анализируемого предложениясистема перифразирования — строит для заданной глубинносинтаксической структуры все возможные в рамках модели синонимические ГССмеханизм установления семантической эквивалентности.

В качестве входных данных перечисленных компонентов допускаются предложения русского языка, составленные из слов, принадлежащих словнику занесенного в базу данных фрагмента толково-комбинаторного словаря современного русского языка. Лексическая система реализованного фрагмента ТКС является замкнутой. В силу сложного строения схемы словарной статьи ТКС, требующей наличие нетривиальной процедуры обработки для автоматизированного занесения содержимого словаря в БД, а также представления исчерпывающим образом семантических и сочетаемостных соотношений заглавных слов статей с другими словами, реализованный фрагмент включает только 30 вокабул.

При практической реализации система, построенная на основе предложенной модели, будет отличаться от экспериментальной только количественными аспектами, так как ограничения модели не оказывают существенного влияния на возможности системы, связанные с областью ее применения в рамках обработки научного текста.

Завершая настоящую работу, следует наметить возможные направления дальнейших исследований. Учитывая результаты машинного эксперимента, и проблемы, связанные с этапом заполнения БД информацией из ТКС, в качестве приоритетного направления дальнейших исследований в рамках поставленной задачи следует выделить вопросы представления знаний о языке с учетом универсальной и характерной только для рассматриваемого типа словарей схемы словарной статьи ТКС, а также разработку процедуры эффективного поиска в ТКС. Кроме того, учитывая объем представленной в словаре лексики, а также намеченное авторами словаря его дальнейшее расширение и модификацию, актуальной является задача построения алгоритмов автоматического распознавания и классификации разнородных данных о языке (графическая и текстовая информация), представленных в ТКС.

ЗАКЛЮЧЕНИЕ

В заключении сформулируем положения, определяющие научные и практические результаты настоящей диссертационной работы.

Основные научные результаты состоят в следующем:

— разработана формальная концептуальная модель семантической эквивалентности высказываний на естественном языке;

— введен новый класс А-грамматик — расширенные лексико-синтаксические А-грамматики;

— сформулирована и доказана лемма о конечности языка, определяемого грамматикой класса расширенных лексико-синтаксических А-грамматик;

— сформулирована и доказана теорема об алгоритмической разрешимости проблем принадлежности, пустоты и эквивалентности для языка, определяемого грамматикой класса расширенных лексико-синтаксических А-грамматик;

— сформулирован и доказан ряд теорем об алгоритмической сложности вычислительных задач, формально описанных с использованием аппарата расширенных лексико-синтаксических А-грамматик;

— решена задача моделирования системы перифразирования, как частного случая преобразований УУ-деревьев, формальным аппаратом расширенных лексико-синтаксических А-грамматик: построено специальное исчисление в виде системы правил синонимических преобразований над глубинно-синтаксическими структурами фраз естественного русского языка с учетом разработанного для русского языка аппарата лексических функций;

— предложен алгоритм считывания глубинно-синтаксического, У/У-дерева с дерева синтаксического подчинения, построенный на модификации формального представления модели управления толково-комбинаторного словаря;

— разработан обобщенный алгоритм установления семантической эквивалентности высказываний на естественном русском языке на основе построенного исчисления синонимии.

Показать весь текст

Список литературы

Аванесов B.C. Композиция тестовых заданий. Учебная книга для преподавателей вузов, учителей школ, аспирантов и студентов педвузов. -М.: Адепт 1998.-217 с.
Авраменко B.C. и др. Математическое обеспечение диалоговых информационных систем. М.: Наука, 1990. — 192 с.
Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. -М.: Наука, 1974.-367 с.
Апресян Ю.Д., Богуславский И. М. и др. Лингвистическое обеспечение в системе машинного перевода третьего поколения. М.: Научный совет по комплексной проблеме «Кибернетика» АН, 1978. — 48 с.
Арсентьева Н.Г., Баландина H.A., Красовская А. И. О машинной реализации системы перифразирования. М.: Ин-т прикладной математики АН СССР, 1969. — 132 с.
Ахо А., Хопрофт Дж., Ульман Дж. Построение и анализ вычислительных алгоритмов: Пер. с англ. М.: Мир, 1979. — 536 с.
Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. В двух томах. Т. 2. Синтаксический анализ: Пер. с англ. -М.: Мир, 1978.-612 с.
Басакер Р., Саати Т. Конечные графы и сети. Пер. с англ. М.: Наука, 1973.-368 с.
Бауэр Ф.Л., Гооз Г. Информатика. В 2-х ч. Ч. 2: Пер. с нем. М.: Мир, 1990.-423 с.
Белоногов Г. Г., Новоселов А. П. Автоматизация процессов накопления, поиска и обобщения информации. М.: Наука, 1979. — 256 с.
Белоногов Г. Г., Богатырев В. И. Автоматизированные информационные системы. М.: Сов. радио, 1973. — 328 с.
Белоногов Г. Г., Котов Р. Г. Автоматизированные информационно-поисковые системы. М.: Сов. радио, 1968. — 182 с.
Берж К. Теория графов и ее применение: Пер. с фр. М.: Изд. ИЛ, 1962 -320 с.
Брауэр В. Введение в теорию конечных автоматов: Пер. с нем. М.: Радио и связь, 1987. — 393 с.
Виноград Т. Программа, понимающая естественный язык: Пер. с англ. -М.: Мир, 1976.-294 с.
Вирт Н. Алгортимы и структуры данных: Пер. с англ. М.: Мир, 1989. -360 с.
Вудс В.А. Сетевые грамматики для анализа естественных языков. Кибернетический сборник, Новая серия, вып. 13. М.: Мир, 1976. -с. 20 — 158.
Гилл А. Введение в теорию конечных автоматов: Пер. с англ. М.: Наука, 1966.-272 с.
Гинзбург ЕЛ. Словообразование и синтаксис. М.: Наука, 1979. — 264 с.
Гладкий A.B. Формальные грамматики и языки. М.: Главная ред физ,-мат. лит., 1973. — 368 с.
Гладкий A.B., Диковский А. Я. Теория формальных грамматик и языков. Труды 2-й Всесоюзн. конф. по программированию. — Новосибирск, 1970.-с. 43−70.
Гладкий A.B., Мельчук И. А. Грамматики деревьев. I. Опыт формализации преобразований синтаксических структур естественного языка, сб. «Информационные вопросы семиотики, лингвистики и автоматического перевода», вып. 1. — М., 1971. — стр. 16−41.
Гладкий A.B., Мельчук И. А. Элементы математической лингвистики. -М.: Наука, 1969. 192 стр.
Глушков В.М. и др. Алгебра. Языки. Программирование. Киев: Наук, думка, 1989.-367 с.
Граудина JT.K. Вопросы нормализации русского языка. Грамматика и варианты. М.: Наука, 1980. — 228 с.
Грин Д., Кнут Д. Математические методы анализа алгоритмов: Пер. с англ. -М.: Мир, 1987. 119 с.
Гринченко Г. А., Стогний A.A. Машинный интеллект и новые информационные технологии. Киев: Манускрипт, 1993. — 243 с.
Грис Д. Наука программирования: Пер. с англ. М.: Мир, 1984. — 416 с.
Гросс М., Лантен А. Теория формальных грамматик: Пер. с англ. М: Наука, 1971.-294 с.
Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи: Пер. с англ. М., Мир, 1982. — 416 с.
Дейт К. Введение в системы баз данных: Пер. с англ. М.: Главная ред. физ-мат. лит., 1980. — 464 с.
Джордж Ф. Основы кибернетики: Пер. с англ. — М.: Радио и связь, 1984. 272 с.
Евстигнеев В. А. Применение теории графов в программировании. М.: Наука. Главная ред. физ.-мат. лит., 1985 — 352 с.
Емельянов Г. М., Кречетова Т. В., Курашова Е. П. Вопросы семантического анализа в автоматизированных системах понимания речи. Тезисы доклада. Конференция РОАИ-3−97 Нижний Новгород, 1997.-5 с.
Емельянов Г. М., Кречетова Т. В., Курашова Е. П. Модель естественного языка для систем понимания речи. Новгород, Вестник НовГУ, серия «Естественные и технические науки», 1998. — с. 88−93.
Зыков A.A. Основы теории графов. М.: Наука, 1987. — 324 с.
Камерон П., Линт Д. Теория графов, теория кодирования и блок-схемы: Пер. с англ. М.: Наука, 1980.- 139 с.
Караулов Ю.Н. Общая и русская идеография. М.: Наука, 1976. — 355 с.
Карп P.M. Сводимость комбинаторных задач. Киб. сб. М.: Мир, 1975. -с. 16−38.
Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания. -М.: Изд-во МГУ, 1992. 336 с.
Кожина М.Н. Стилистика русского языка. М.: Просвещение, 1977. -223 с.
Кофман А. Введение в прикладную комбинаторику: Пер. с фр. М.: Наука, 1975.-479 с.
Кречетова Т.В. Вопросы моделирования семантической эквивалентности. Алгоритмическая часть модели. Великий Новгород, 1999. — 25 с. — Деп. в ВИНИТИ.
Кречетова Т.В. Формальный аппарат математического моделирования глубинного синтаксиса естественного языка. Великий Новгород, 1999. — 29 с. — Деп. в ВИНИТИ.
Котов В.Е., Сабельфельд В. К. Теория схем программ. М.: Наука. Гл. ред. физ.-мат. лит., 1991. — 248 с.
Кристофидес. Н. Теория графов. Алгоритмический подход: Пер. с англ. -М.: Мир, 1978.-432 с.
Кнут. Д. Искусство программирования для ЭВМ, т. 1. Основные алгоритмы: Пер. с англ. М.: Мир, 1976. — 736 с.
Кнут. Д. Искусство программирования для ЭВМ, т. 3. Сортировка и поиск: Пер. с англ. М.: Мир, 1978. — 844 с.
Кузнецов И.П. Механизмы обработки семантической информации. М.: Наука, 1978. -174 стр.
Кузнецов И.П. Кибернетические диалоговые системы. М.: Наука, 1976. -299 с.
Кук Д., Бейз Г. Компьютерная математика: Пер. с англ. М.: Наука, 1990.-384 с.
Кулагина О.С. Исследования по машинному переводу. М.: Наука, 1979. -324 с.
Льюис Ф., Розенкранц Д., Стирнз Р. Теоретические основы проектирования компиляторов: Пер. с англ. М.: Мир, 1979. — 654 с.
Любарский Ю.Я. Интеллектуальные информационные системы. М.: Наука, 1990.-227 с.
Мартин Дж. Организация баз данных в вычислительных системах: Пер. с англ. М.: Мир, 1980. — 662 с.
Мартынов В.В. Универсальный семантический код: УСК-3. Минск: Наука и техника, 1984. — 132 с.
Мартынов В.В. Универсальный семантический код (грамматика, словарь, тексты). Минск: Наука и техника, 1977. — 191 с.
Мельчук И. А. Опыт теории лингвистических моделей «смысл<^>текст»: Семантика, синтаксис. М.: Наука, 1974. — 314 с.
Минский M. Фреймы для представления знаний: Пер. с англ. М.: Энергия, 1979. — 152 стр.
Моделирование языковой деятельности в интеллектуальных системах. Под ред. Кибрика А. Е. и Нариньяни A.C. М.: Наука, 1987.
Налимов В.В. Вероятностная модель языка. О соотношении естественных и искусственных языков М.: Наука, 1974. — 272 с.
Нильсон Н. Искусственный интеллект. Методы поиска решений: Пер. с англ. М., Мир, 1973. — 270 с.
Нильсон Н. Принципы искусственного интеллекта: Пер. с англ. М.: Радио и связь, 1985. — 373 с.
Павиленис Р.И. Проблема смысла: Современный логико-философский анализ языка. М.: Мысль, 1983. — 286 с.
Пападимитриу X., Стайглиц К. Комбинаторная оптимизация. Алгоритмы и сложность: Пер. с англ. М.: Мир, 1985. — 512 с.
Попов Э.В., Фирдман Г. Р. Алгоритмические основы интеллектуальных роботов и ИИ. М.: Наука, 1976. — 455 с.
Попов Э.В. и др. Искусственный интеллект. В 3-х кн. — М.: Радио и связь, 1990.
Попов Э.В. Общение с ЭВМ на естественном языке. М.: Наука. Главная ред. физ.-мат.лит., 1982. — 360 с.
Поспелов Г. С. Искусственный интеллект основа новой информационной технологии / АН СССР. — М.: Наука, 1988.-27 8с.
Поспелов Г. С., Поспелов Д. А. Искусственный интеллект прикладные системы. — М.: Знание, 1985. — 48 с.
Поспелов Д.А. Логико-лингвистические модели в системах управления. -М.: Энергоиздат, 1981. -233 с.
Пратт Т. Языки программироания: Разработка и реализация: Пер. с англ. -М.: Наука, 1979.-574 с.
Представление знаний в человеко-машинных и робототехнических системах. отчет РГ-18 КНВВТ, 1984.
Представление и использование знаний: Пер. с япон./Под ред. X. Уэно, М.Исидзука. М.: Мир, 1989. — 220 с.
Рейуорд-Смит В. Теория формальных языков. Ввод, курс: Пер. с англ. -М.: Радио и связь, 1988.- 127 с.
Слэйгл Дж. Искусственный интеллект. Подход на основе эвристического программирования: Пер. с англ. М.: Мир, 1973. — 319 с.
Трахтенброт Б.А. Алгоритмы и вычислительные автоматы. М.: Сов. радио, 1974.-200 с.
Тузов В.А. Математическая модель языка. Л.: Изд-во Ленингр. ун-та, 1984.- 176 с.
Уинстон П. Искусственный интеллект: Пер. с англ. М.: Мир, 1980. -519 с.
Флорес А. Структуры и управление данными: Пер. с англ. М.: Наука, 1982.-319 с.
Харари Ф. Теория графов: Пер. с англ. М.: Мир, 1973. — 300 с.
Хомский Н. Аспекты теории синтаксиса. Пер. с англ. М.: Изд. Моск. ун-та, 1972.-260 с.
Хомский Н. Язык и мышление. Пер. с англ. М.: Изд. Моск. ун-та, 1972. — 122 с.
Хомский Н. Формальные свойства грамматик. Кибернетический сборник. Вып. 2. — М., 1966. — с. 121−130.
Шенк Р. Обработка концептуальной информации: Пер. с англ. М.:

Заполнить форму текущей работой