Помощь в учёбе, очень быстро...
Работаем вместе до победы

Математическое моделирование семантической эквивалентности ?-грамматиками

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Завершая настоящую работу, следует наметить возможные направления дальнейших исследований. Учитывая результаты машинного эксперимента, и проблемы, связанные с этапом заполнения БД информацией из ТКС, в качестве приоритетного направления дальнейших исследований в рамках поставленной задачи следует выделить вопросы представления знаний о языке с учетом универсальной и характерной только для… Читать ещё >

Содержание

  • 1. МОДЕЛИРОВАНИЕ СЕМАНТИЧЕСКОЙ ЭКВИВАЛЕНТНОСТИ. ПОСТАНОВКА ЗАДАЧИ
    • 1. 1. Постановка задачи на функциональном уровне
    • 1. 2. Критерии адекватности формальной модели
    • 1. 3. Анализ существующих подходов
    • 1. 4. Выбор метода моделирования
    • 1. 5. Концептуальная модель установления семантической эквивалентности и общая формальная постановка задачи
    • 1. 6. Выводы
  • 2. ПОСТРОЕНИЕ ФОРМАЛЬНОГО АППАРАТА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ГЛУБИННОГО СИНТАКСИСА И ИССЛЕДОВАНИЕ СВОЙСТВ ПРЕДЛОЖЕННОГО АППАРАТА
    • 2. 1. Моделирование глубинного синтаксиса грамматиками деревьев
    • 2. 2. Исследование проблем алгоритмической разрешимости для класса универсальных правильных синтаксических А-грамматик
    • 2. 3. Исследование вопросов алгоритмической сложности для класса универсальных правильных синтаксических А-грамматик
    • 2. 4. Расширенные правильные лексико-синтаксические А-грамматики
    • 2. 5. Выводы
  • 3. ПОСТРОЕНИЕ ИСЧИСЛЕНИЯ СИНОНИМИЧЕСКИХ ПРЕОБРАЗОВАНИЙ
    • 3. 1. Содержательная интерпретация аппарата расширенных лексико-синтаксических А-грамматик в рамках концептуальной модели
    • 3. 2. Моделирование системы перифразирования расширенными лексико-синтаксическими А-грамматиками
    • 3. 3. Моделирование поверхностной синтаксической структуры деревом зависимостей
    • 3. 4. Алгоритм считывания глубинно-синтаксической структуры с дерева синтаксического подчинения
    • 3. 5. Выводы
  • 4. ВОПРОСЫ МОДЕЛИРОВАНИЯ СЕМАНТИЧЕСКОЙ ЭКВИВАЛЕНТНОСТИ. АЛГОРИТМИЧЕСКАЯ ЧАСТЬ МОДЕЛИ
    • 4. 1. Алгоритм установления семантической эквивалентности высказываний на ЕЯ
    • 4. 2. Базовые глубинно-синтаксические структуры
    • 4. 3. Пример реализации программного комплекса автоматизированного тестирования на основе предложенной модели семантической эквивалентности
    • 4. 4. Выводы

Математическое моделирование семантической эквивалентности ?-грамматиками (реферат, курсовая, диплом, контрольная)

Тенденция увеличения производительности вычислительной техники при снижение ее стоимости способствует расширению сфер применения ЭВМ. Однако повсеместному использованию ЭВМ препятствует ряд факторов, образующих так называемую «проблему общения» [71, 72].

Развитие программирования показало, что общение пользователя с ЭВМважное звено в эффективности решения задач. Для человека идеальным было бы общение на обычном, естественном языке. Кроме того, естественный язык — это, пожалуй, единственная известная нам на сегодня моделирующая система, средствами которой можно описать многообразный окружающий мир. Отсюда большой интерес к анализу естественного языка (ЕЯ) как средства для описания действительности и средства коммуникации между человеком и системой [27].

Интерес к разработке систем общения на ЕЯ проявляется как со стороны научных дисциплин, так и со стороны технических, связанных с разработкой и реализацией на вычислительной технике моделей в виде систем общения, вопросно-ответных систем, систем машинного перевода и других, относящихся к классу интеллектуальных систем (ИС). Обеспечение процесса общения с ЭВМ на ЕЯ на данное время рассматривается как одна из важнейших задач, стоящих перед разработчиками ИС. Задачи исследования методов и разработки подобных систем в настоящее время образуют самостоятельное направление, получившее название «Обработка естественного языка» (Natural Language Processing) [71].

Несмотря на значительные успехи рассматриваемого направления, в настоящее время большинство систем, связанных с обработкой ЕЯ относится к экспериментальным системам, которые не могут быть использованы для решения задач реальной сложности [74]. Прежде всего такое положение обусловлено состоянием теоретических исследований проблем моделирования языка, в частности, отсутствием на настоящее время семантического описания структуры текстов и предложений.

Проведенное рассмотрение моделей общения и моделей языка позволяет констатировать отсутствие единого формального аппарата, который мог бы гарантировать истинность выдвигаемых теорий, принципов и методов. Это обстоятельство и сложность самой проблемы обработки ЕЯ не позволяют в настоящее время разработать и реализовать модель ЕЯ в полном объеме, претендуя на полноту и охватывая все нюансы, связанные с обработкой ЕЯ. Однако, при разумно выбранных ограничениях на язык и предметную область существующими методами можно разработать системы обработки ЕЯ, пригодные для практического применения при решении задач реальной степени сложности.

Решаемая в настоящей диссертационной работе проблема моделирования семантической эквивалентности высказываний на ЕЯ относится к вопросам обработки естественного языка и ориентирована на практическую реализацию в системах по установлению смысловой тождественности входной текстовой информации.

Областью непосредственного применения теоретических результатов настоящей работы является автоматизация обучения, более конкретноавтоматизированный контроль знаний. Важное преимущество автоматизированного обучения состоит во всеобщем и постоянном контроле и объективной оценке результатов, в отличии от выборочного периодического контроля, характерного для традиционного метода обучения [1]. Указанное преимущество обеспечивает, как правило, гораздо большую эффективность автоматизированного обучения по сравнению с традиционным.

Однако, рассматривая задачу установления семантической эквивалентности как задачу распознавания смыслов, практическая значимость построенной модели семантической эквивалентности не ограничивается отмеченной областью автоматизированного тестирования знаний. Любая система, функционирующая в естественных человеческих языках, либо обрабатывающая выразительные средства общения, такие как текст и голос, включает в качестве необходимого компонента модуль обработки ЕЯ с целью автоматического перевода с внешнего языкового представления на язык смыслов с процедурами классификации и объединения языковых оборотов, равнозначных по смыслу.

Учитывая обоснованное существование проблемы обработки естественных языков в плане распознавания смысла, отсутствие единых общепризнанных теоретических подходов и формальных средств описания семантики ЕЯ, а также практическую значимость и ориентацию проблемы установления смысловой эквивалентности на практическое применение, сформулируем главную цель работы следующим образом: разработка и исследование формальной математической модели семантической эквивалентности высказываний на естественном языке с целью практической реализации механизма установления тождественности смыслов высказываний с теоретическим обоснованием алгоритмической разрешимости этого механизма и оценкой вычислительной сложности соответствующей вычислительной задачи.

Диссертационная работа состоит из введения, четырех глав, заключения, приложения, списка используемых сокращений и библиографического списка.

Результаты работы имеют не только научную, но и практическую значимость. Использование для формального описания глубинного синтаксиса и системы перифразирования введенного математического аппарата расширенных лексико-синтаксических А-грамматик позволяет теоретически обосновать принципиальную возможность существования алгоритмического решения для задач анализа глубинно-синтаксических представлений естественно-языковых фраз и принадлежность этих задач к классу задач полиномиальной временной сложности.

Предложенные в работе алгоритмы позволяют эффективно решать задачи установления смысловой эквивалентности высказываний на естественном языке без существенного ограничения предметной области. Отсутствие в предлагаемых вычислительных схемах процедур обработки семантических представлений анализируемых высказываний, и, как следствие, отсутствие обращений к семантическо-русскому словарю, не только существенно упрощает алгоритмическую сложность механизма установления семантической эквивалентности, но и делает реализацию этого процесса принципиально возможной в силу отсутствия на настоящее время такого словаря для естественных языков. На современном этапе сведение текста на ЕЯ к его семантическому представлению без существенного ограничения предметной области не осуществимо прежде всего в связи с абсолютно недостаточной теоретической изученностью соответствующих процессов и неразработанностью конкретных вариантов семантического представления для большого объема лексики ЕЯ.

Практическое применение построенной модели семантической эквивалентности не ограничивается рассмотренной в качестве примера реализации областью автоматизации обучения. Учитывая современную тенденцию функционирования ЭВМ в естественных человеческих языках, при ведении диалога важно уметь осуществлять автоматический перевод с внешнего языкового представления на внутренний язык вычислительной задачи. С этой целью удобно использовать предложенный в работе формальный аппарат Л-грамматик с процедурами классификации и объединения языковых оборотов, равнозначных по смыслу.

Материалы работы основаны на публикациях [34, 35, 44−47], из них 4 опубликовано и 2 депонировано в ВИНИТИ. Полученные результаты апробированы в докладах на конференциях: 12-ой Международной научной конференции «Математические методы в технике и технологиях — ММТТ-12» (Великий Новгород, 1999), 3-ей Всероссийской с участием стран СНГ конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-3−97) (Нижний Новгород, 1997), в докладах на научных конференциях в рамках Дней Науки в НовГУ (Новгород, 1995), (Новгород, 1996), (Новгород, 1997).

Все научные и практические результаты получены автором самостоятельно.

Все теоретические положения диссертации доведены до вида алгоритмов и схем программ и проверены в ходе машинного эксперимента. Для подтверждения полученных теоретических положений был проведен машинный эксперимент по установлению семантической эквивалентности высказываний на естественном русском языке. Реализованы следующие необходимые подсистемы экспериментального программного комплекса: морфологический компонентреализует грамматический разбор входного предложениясинтаксический компонент — реализует синтаксический разбор входного предложения с анализом результатов в виде дерева подчиненияпреобразователь дерева синтаксического подчинения в глубинную синтаксическую структуру для анализируемого предложениясистема перифразирования — строит для заданной глубинносинтаксической структуры все возможные в рамках модели синонимические ГССмеханизм установления семантической эквивалентности.

В качестве входных данных перечисленных компонентов допускаются предложения русского языка, составленные из слов, принадлежащих словнику занесенного в базу данных фрагмента толково-комбинаторного словаря современного русского языка. Лексическая система реализованного фрагмента ТКС является замкнутой. В силу сложного строения схемы словарной статьи ТКС, требующей наличие нетривиальной процедуры обработки для автоматизированного занесения содержимого словаря в БД, а также представления исчерпывающим образом семантических и сочетаемостных соотношений заглавных слов статей с другими словами, реализованный фрагмент включает только 30 вокабул.

При практической реализации система, построенная на основе предложенной модели, будет отличаться от экспериментальной только количественными аспектами, так как ограничения модели не оказывают существенного влияния на возможности системы, связанные с областью ее применения в рамках обработки научного текста.

Завершая настоящую работу, следует наметить возможные направления дальнейших исследований. Учитывая результаты машинного эксперимента, и проблемы, связанные с этапом заполнения БД информацией из ТКС, в качестве приоритетного направления дальнейших исследований в рамках поставленной задачи следует выделить вопросы представления знаний о языке с учетом универсальной и характерной только для рассматриваемого типа словарей схемы словарной статьи ТКС, а также разработку процедуры эффективного поиска в ТКС. Кроме того, учитывая объем представленной в словаре лексики, а также намеченное авторами словаря его дальнейшее расширение и модификацию, актуальной является задача построения алгоритмов автоматического распознавания и классификации разнородных данных о языке (графическая и текстовая информация), представленных в ТКС.

ЗАКЛЮЧЕНИЕ

.

В заключении сформулируем положения, определяющие научные и практические результаты настоящей диссертационной работы.

Основные научные результаты состоят в следующем:

— разработана формальная концептуальная модель семантической эквивалентности высказываний на естественном языке;

— введен новый класс А-грамматик — расширенные лексико-синтаксические А-грамматики;

— сформулирована и доказана лемма о конечности языка, определяемого грамматикой класса расширенных лексико-синтаксических А-грамматик;

— сформулирована и доказана теорема об алгоритмической разрешимости проблем принадлежности, пустоты и эквивалентности для языка, определяемого грамматикой класса расширенных лексико-синтаксических А-грамматик;

— сформулирован и доказан ряд теорем об алгоритмической сложности вычислительных задач, формально описанных с использованием аппарата расширенных лексико-синтаксических А-грамматик;

— решена задача моделирования системы перифразирования, как частного случая преобразований УУ-деревьев, формальным аппаратом расширенных лексико-синтаксических А-грамматик: построено специальное исчисление в виде системы правил синонимических преобразований над глубинно-синтаксическими структурами фраз естественного русского языка с учетом разработанного для русского языка аппарата лексических функций;

— предложен алгоритм считывания глубинно-синтаксического, У/У-дерева с дерева синтаксического подчинения, построенный на модификации формального представления модели управления толково-комбинаторного словаря;

— разработан обобщенный алгоритм установления семантической эквивалентности высказываний на естественном русском языке на основе построенного исчисления синонимии.

Показать весь текст

Список литературы

  1. B.C. Композиция тестовых заданий. Учебная книга для преподавателей вузов, учителей школ, аспирантов и студентов педвузов. -М.: Адепт 1998.-217 с.
  2. B.C. и др. Математическое обеспечение диалоговых информационных систем. М.: Наука, 1990. — 192 с.
  3. Ю.Д. Лексическая семантика. Синонимические средства языка. -М.: Наука, 1974.-367 с.
  4. Ю.Д., Богуславский И. М. и др. Лингвистическое обеспечение в системе машинного перевода третьего поколения. М.: Научный совет по комплексной проблеме «Кибернетика» АН, 1978. — 48 с.
  5. Н.Г., Баландина H.A., Красовская А. И. О машинной реализации системы перифразирования. М.: Ин-т прикладной математики АН СССР, 1969. — 132 с.
  6. Ахо А., Хопрофт Дж., Ульман Дж. Построение и анализ вычислительных алгоритмов: Пер. с англ. М.: Мир, 1979. — 536 с.
  7. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. В двух томах. Т. 2. Синтаксический анализ: Пер. с англ. -М.: Мир, 1978.-612 с.
  8. Р., Саати Т. Конечные графы и сети. Пер. с англ. М.: Наука, 1973.-368 с.
  9. Ф.Л., Гооз Г. Информатика. В 2-х ч. Ч. 2: Пер. с нем. М.: Мир, 1990.-423 с.
  10. Г. Г., Новоселов А. П. Автоматизация процессов накопления, поиска и обобщения информации. М.: Наука, 1979. — 256 с.
  11. Г. Г., Богатырев В. И. Автоматизированные информационные системы. М.: Сов. радио, 1973. — 328 с.
  12. Г. Г., Котов Р. Г. Автоматизированные информационно-поисковые системы. М.: Сов. радио, 1968. — 182 с.
  13. К. Теория графов и ее применение: Пер. с фр. М.: Изд. ИЛ, 1962 -320 с.
  14. В. Введение в теорию конечных автоматов: Пер. с нем. М.: Радио и связь, 1987. — 393 с.
  15. Т. Программа, понимающая естественный язык: Пер. с англ. -М.: Мир, 1976.-294 с.
  16. Н. Алгортимы и структуры данных: Пер. с англ. М.: Мир, 1989. -360 с.
  17. В.А. Сетевые грамматики для анализа естественных языков. Кибернетический сборник, Новая серия, вып. 13. М.: Мир, 1976. -с. 20 — 158.
  18. А. Введение в теорию конечных автоматов: Пер. с англ. М.: Наука, 1966.-272 с.
  19. ЕЛ. Словообразование и синтаксис. М.: Наука, 1979. — 264 с.
  20. A.B. Формальные грамматики и языки. М.: Главная ред физ,-мат. лит., 1973. — 368 с.
  21. A.B., Диковский А. Я. Теория формальных грамматик и языков. Труды 2-й Всесоюзн. конф. по программированию. — Новосибирск, 1970.-с. 43−70.
  22. A.B., Мельчук И. А. Грамматики деревьев. I. Опыт формализации преобразований синтаксических структур естественного языка, сб. «Информационные вопросы семиотики, лингвистики и автоматического перевода», вып. 1. — М., 1971. — стр. 16−41.
  23. A.B., Мельчук И. А. Элементы математической лингвистики. -М.: Наука, 1969. 192 стр.
  24. В.М. и др. Алгебра. Языки. Программирование. Киев: Наук, думка, 1989.-367 с.
  25. JT.K. Вопросы нормализации русского языка. Грамматика и варианты. М.: Наука, 1980. — 228 с.
  26. Д., Кнут Д. Математические методы анализа алгоритмов: Пер. с англ. -М.: Мир, 1987. 119 с.
  27. Г. А., Стогний A.A. Машинный интеллект и новые информационные технологии. Киев: Манускрипт, 1993. — 243 с.
  28. Д. Наука программирования: Пер. с англ. М.: Мир, 1984. — 416 с.
  29. М., Лантен А. Теория формальных грамматик: Пер. с англ. М: Наука, 1971.-294 с.
  30. М., Джонсон Д. Вычислительные машины и труднорешаемые задачи: Пер. с англ. М., Мир, 1982. — 416 с.
  31. К. Введение в системы баз данных: Пер. с англ. М.: Главная ред. физ-мат. лит., 1980. — 464 с.
  32. Ф. Основы кибернетики: Пер. с англ. — М.: Радио и связь, 1984. 272 с.
  33. В. А. Применение теории графов в программировании. М.: Наука. Главная ред. физ.-мат. лит., 1985 — 352 с.
  34. Г. М., Кречетова Т. В., Курашова Е. П. Вопросы семантического анализа в автоматизированных системах понимания речи. Тезисы доклада. Конференция РОАИ-3−97 Нижний Новгород, 1997.-5 с.
  35. Г. М., Кречетова Т. В., Курашова Е. П. Модель естественного языка для систем понимания речи. Новгород, Вестник НовГУ, серия «Естественные и технические науки», 1998. — с. 88−93.
  36. A.A. Основы теории графов. М.: Наука, 1987. — 324 с.
  37. П., Линт Д. Теория графов, теория кодирования и блок-схемы: Пер. с англ. М.: Наука, 1980.- 139 с.
  38. Ю.Н. Общая и русская идеография. М.: Наука, 1976. — 355 с.
  39. P.M. Сводимость комбинаторных задач. Киб. сб. М.: Мир, 1975. -с. 16−38.
  40. А.Е. Очерки по общим и прикладным вопросам языкознания. -М.: Изд-во МГУ, 1992. 336 с.
  41. М.Н. Стилистика русского языка. М.: Просвещение, 1977. -223 с.
  42. А. Введение в прикладную комбинаторику: Пер. с фр. М.: Наука, 1975.-479 с.
  43. Т.В. Вопросы моделирования семантической эквивалентности. Алгоритмическая часть модели. Великий Новгород, 1999. — 25 с. — Деп. в ВИНИТИ.
  44. Т.В. Формальный аппарат математического моделирования глубинного синтаксиса естественного языка. Великий Новгород, 1999. — 29 с. — Деп. в ВИНИТИ.
  45. В.Е., Сабельфельд В. К. Теория схем программ. М.: Наука. Гл. ред. физ.-мат. лит., 1991. — 248 с.
  46. . Н. Теория графов. Алгоритмический подход: Пер. с англ. -М.: Мир, 1978.-432 с.
  47. . Д. Искусство программирования для ЭВМ, т. 1. Основные алгоритмы: Пер. с англ. М.: Мир, 1976. — 736 с.
  48. . Д. Искусство программирования для ЭВМ, т. 3. Сортировка и поиск: Пер. с англ. М.: Мир, 1978. — 844 с.
  49. И.П. Механизмы обработки семантической информации. М.: Наука, 1978. -174 стр.
  50. И.П. Кибернетические диалоговые системы. М.: Наука, 1976. -299 с.
  51. Кук Д., Бейз Г. Компьютерная математика: Пер. с англ. М.: Наука, 1990.-384 с.
  52. О.С. Исследования по машинному переводу. М.: Наука, 1979. -324 с.
  53. Ф., Розенкранц Д., Стирнз Р. Теоретические основы проектирования компиляторов: Пер. с англ. М.: Мир, 1979. — 654 с.
  54. Ю.Я. Интеллектуальные информационные системы. М.: Наука, 1990.-227 с.
  55. Дж. Организация баз данных в вычислительных системах: Пер. с англ. М.: Мир, 1980. — 662 с.
  56. В.В. Универсальный семантический код: УСК-3. Минск: Наука и техника, 1984. — 132 с.
  57. В.В. Универсальный семантический код (грамматика, словарь, тексты). Минск: Наука и техника, 1977. — 191 с.
  58. И. А. Опыт теории лингвистических моделей «смысл<^>текст»: Семантика, синтаксис. М.: Наука, 1974. — 314 с.
  59. M. Фреймы для представления знаний: Пер. с англ. М.: Энергия, 1979. — 152 стр.
  60. Моделирование языковой деятельности в интеллектуальных системах. Под ред. Кибрика А. Е. и Нариньяни A.C. М.: Наука, 1987.
  61. В.В. Вероятностная модель языка. О соотношении естественных и искусственных языков М.: Наука, 1974. — 272 с.
  62. Н. Искусственный интеллект. Методы поиска решений: Пер. с англ. М., Мир, 1973. — 270 с.
  63. Н. Принципы искусственного интеллекта: Пер. с англ. М.: Радио и связь, 1985. — 373 с.
  64. Р.И. Проблема смысла: Современный логико-философский анализ языка. М.: Мысль, 1983. — 286 с.
  65. X., Стайглиц К. Комбинаторная оптимизация. Алгоритмы и сложность: Пер. с англ. М.: Мир, 1985. — 512 с.
  66. Э.В., Фирдман Г. Р. Алгоритмические основы интеллектуальных роботов и ИИ. М.: Наука, 1976. — 455 с.
  67. Э.В. и др. Искусственный интеллект. В 3-х кн. — М.: Радио и связь, 1990.
  68. Э.В. Общение с ЭВМ на естественном языке. М.: Наука. Главная ред. физ.-мат.лит., 1982. — 360 с.
  69. Г. С. Искусственный интеллект основа новой информационной технологии / АН СССР. — М.: Наука, 1988.-27 8с.
  70. Г. С., Поспелов Д. А. Искусственный интеллект прикладные системы. — М.: Знание, 1985. — 48 с.
  71. Д.А. Логико-лингвистические модели в системах управления. -М.: Энергоиздат, 1981. -233 с.
  72. Т. Языки программироания: Разработка и реализация: Пер. с англ. -М.: Наука, 1979.-574 с.
  73. Представление знаний в человеко-машинных и робототехнических системах. отчет РГ-18 КНВВТ, 1984.
  74. Представление и использование знаний: Пер. с япон./Под ред. X. Уэно, М.Исидзука. М.: Мир, 1989. — 220 с.
  75. Рейуорд-Смит В. Теория формальных языков. Ввод, курс: Пер. с англ. -М.: Радио и связь, 1988.- 127 с.
  76. Дж. Искусственный интеллект. Подход на основе эвристического программирования: Пер. с англ. М.: Мир, 1973. — 319 с.
  77. .А. Алгоритмы и вычислительные автоматы. М.: Сов. радио, 1974.-200 с.
  78. В.А. Математическая модель языка. Л.: Изд-во Ленингр. ун-та, 1984.- 176 с.
  79. П. Искусственный интеллект: Пер. с англ. М.: Мир, 1980. -519 с.
  80. А. Структуры и управление данными: Пер. с англ. М.: Наука, 1982.-319 с.
  81. Ф. Теория графов: Пер. с англ. М.: Мир, 1973. — 300 с.
  82. Н. Аспекты теории синтаксиса. Пер. с англ. М.: Изд. Моск. ун-та, 1972.-260 с.
  83. Н. Язык и мышление. Пер. с англ. М.: Изд. Моск. ун-та, 1972. — 122 с.
  84. Н. Формальные свойства грамматик. Кибернетический сборник. Вып. 2. — М., 1966. — с. 121−130.
  85. Р. Обработка концептуальной информации: Пер. с англ. М.:
Заполнить форму текущей работой