Методы и алгоритмы обнаружения семантических ошибок в гипертекстовых информационных ресурсах на основе онтологических моделей
Диссертация
Предложена методика раздельного хранения семантики ГИР и его естественного текста, позволяющая установить связь между фрагментом семантики и фрагментом текста, его породившим. Эта связь является необходимым звеном для перехода от нарушений семантической целостности семантической сети к смысловым ошибкам в текстах на естественном языке. На сегодняшний день разработано большое количество моделей… Читать ещё >
Содержание
- ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ И ОБЗОР МОДЕЛЕЙ ОНТОЛОГИЙ
- 1. 1. Гипертекстовый информационный ресурс (ТИР)
- 1. 1. 1. Понятие гипертекста
- 1. 1. 2. Понятие информационного ресурса
- 1. 1. 3. Классификация ГИР
- 1. 2. Ошибки в ГИР
- 1. 2. 1. Понятие ошибки
- 1. 2. 2. Классификация ошибок
- 1. 2. 3. Обнаружение ошибок
- 1. 3. Представление смысла
- 1. 4. Обзор моделей онтологий
- 1. 4. 1. Семантическая сеть, RDF
- 1. 5. Формулировка задачи автоматизации обнаружения семантических ошибок в ГИР
- 1. 1. Гипертекстовый информационный ресурс (ТИР)
- Выводы
- ГЛАВА 2. ОБЩАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СЕМАНТИКИ ГИР
- 2. 1. Представление семантики ГИР на основе стандарта RDF
- 2. 1. 1. Интерпретация семантической сети
- 2. 1. 2. Следование семантических сетей
- 2. 1. 3. Понятие семантической целостности
- 2. 2. Онтология как математическое описание семантики предметной области
- 2. 2. 1. Классы объектов
- 2. 2. 2. Свойства и отношения между объектами
- 2. 2. 3. Ограничения на классах
- 2. 3. Расширения модели онтологий
- 2. 3. 1. Контекстные свойства
- 2. 3. 2. Семантические правила
- 2. 3. 3. Операция «расширения» семантической сети
- 2. 4. Возможные парадоксы в семантической сети представления ГИР
- 2. 4. 1. Понятие парадокса
- 2. 4. 2. Парадоксы ограничений классов
- 2. 4. 3. Парадоксы свойств
- 2. 1. Представление семантики ГИР на основе стандарта RDF
- 3. 1. Основные операции
- 3. 1. 1. Структуры данных
- 3. 1. 2. Алгоритмическая поддержка объектов и свойств
- 3. 1. 3. Базовые алгоритмы
- 3. 2. Алгоритм расширения семантический сети
- 3. 2. 1. Преобразование сети условий
- 3. 2. 2. Алгоритм выполнения расширительных правил
- 3. 2. 3. Формирование семантической сети на основе естественных текстов ГИР
- 3. 3. Алгоритм проверки семантической целостности сети
- 3. 3. 1. Выполнение проверочных правил
- 3. 3. 2. Алгоритм поиска объектов-парадоксов
- 3. 3. 3. Формирование отчета об обнаруженных парадоксах
- 3. 4. Архитектура информационной системы
- 3. 4. 1. Общая технологическая схема
- 3. 4. 2. Программные модули системы
- 3. 4. 3. Интерфейс пользователя
- 4. 1. Базовая онтология веб-сайтов
- 4. 1. 1. Иерархия классов
- 4. 2. Ограничения — правила
- 4. 2. 1. Правило: контекстные свойства
- 4. 2. 2. Правило: даты в диапазоне
- 4. 3. Настройка ИС на примере A3 Урал
- 4. 4. Взаимодействие с ИС
- 4. 4. 1. Ввод документов
- 4. 4. 2. Обнаружение, исследование и устранение парадоксов
Список литературы
- A.B. Поликахин, А. Ю. Савин. Гипертекст: сущность, состояние, проблемы, перспективы // М.: ИПЕ АЕН РФ, 1993.- 127 с.
- А.П.Веревченко. Информационные ресурсы: определение, основные понятия, параметры, особенности открытого потока информации, помехи, возникающие в каналах поступления информации. http://www.mai.ru/~gr08×07/vap/verin010.htm.
- Автоматическая Обработка Текста, http://www.aot.ru.
- Александров Е.А. Основы теории эвристических решений: Подход к изучению естественного и построению искусственного интеллекта. М.: Сов. Радио, 1975. 256 с.
- Бондаренко М.Ф., Маторин С. И., Соловьёва Е. А. Особенности теории и практики решения сложных проблем на основе онтологий // Искусственный интеллект. 2000. — N3. — С. 25−33.
- Брудно В.А. Базы данных с неполной информацией / В. А. Брудно, Д. П. Скворцов, В. К. Финн, М. Ш. Цаленко // Семиотика и информатика. -М.ВИНИТИ, 1985. Вып. 25
- Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на С++, 2-е изд./Пер. с англ. М.: Изд-во «Бином», СПб.: «Невский диалект», 2000. — 560 с.
- Валиков А. Технология XSLT. СПб.- БХВ, 2002. — 544 с.
- Веревченко А.П., Горчаков В. В., Иванов И. В., Голодова О. В. Информационные ресурсы для принятия решений. Учебное пособие. М.: Академический Проект- Екатеринбург: Деловая книга, 2002. 560 с.
- Г. Верников. Стандарт онтологического исследования IDEF5 http://www.cfin.ru/vernikov/idef/idef5.shtml.11 .Г. Верников. Стандарты моделирования IDEF5 и ABC http://www.cfin.ru/vernikov/idef/index.shtml.
- Гаврилова Т.А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. /Учебник. Спб.: Питер, 2001.-384 с.
- Н.Головин Б. Н. Основы культуры речи. М. М., Высшая школа, 1980-с. 10
- Горбатов В.А. Логическое управление информационными процессами/ В. А. Горбатов, П. Г. Павлов, В. Н. Четвериков. М.: Энергоатомиздат 1984. -304с.
- Городецкий В.И. Информационные технологии и многоагентные системы // Проблемы информатизации. 1998. Вып. 1. С. 3 14.
- Д.Л.Кречман. Визуализация гипертекста. Сб. статей «Пользовательский интерфейс: исследование, проектирование, реализация» No 3, 1993, стр. 2632.
- Дворак Д. Дамоклов меч информационной перегрузки // PC Magazine Russian Edition, № 5, 1995, С. 84−85
- Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений: Пер. с англ./Под ред. H.H. Моисеева, С. А. Орловского. М.: Мир, 1976. 165 с.
- Искусственный интеллект: В 3-х кн. Кн. 2. Модели и методы: Справочник/Под редакцией Д. А. Поспелова. М.:Радио и связь, 1990. -304с.
- Калиниченко Л.А. Стандарты ОМС: Язык определения интерфейсов в ГОЬ архитектуре СОЮЗА/ Л. А. Калиниченко, М.Р. Когаловский// СУБД. 1996. — № 2, стр. 115−129
- Капустин В.А. Основы поиска информации в Интернете. Методическое пособие. СПб.: Институт «Открытое общество». Санкт-Петербургское отделение, 1998. — 13с.
- Клоксин У. Программирование на языке Пролог. М.: Мир, 1987. — 336 с.
- Кнут Д. и др. Сематика языков программирования:Сб.статей/Пер. с англ.-М.:Мир, 1980.-394 с.
- Кнут Д.Э. Искусство программирования. Т. 1. Основные алгоритмы. М.: Издательский дом «Вильяме», 2000.
- Кнут Д.Э. Искусство программирования. Т. 2. Получисленные алгоритмы. М.: Издательский дом «Вильяме», 2000.
- Кнут Д.Э. Искусство программирования. Т. 3. Сортировка и поиск. М.: Издательский дом «Вильяме», 2000.
- Кодц Э.Ф. Расширение реляционной модели для лучшего отображения семантики// СУБД. 1996. — № 5−6
- Колчин А.Ф. Методология разработки интеллектуальных систем // Сб. научных трудов «Проектирование технологических машин». М.: МГТУ «СТАНКИН», 1997. -Вып. 7
- Логический словарь: ДЕФОРТ/ Под ред. A.A. Ивина, В. Н. Переверзева, В. В Петрова. М.: Мысль, 1994. — 380 с.
- Мальцев А.И. Алгоритмы и рекурсивные функции. М.: Наука, 1965. -368с.
- Мельников A.B., Хлопотов М. В. Обеспечение достоверности информационного ресурса промышленного предприятия// АСУ-1111−2003 Сборник трудов международной научно-практической конференции /Москва, 2003.
- Мельников A.B., Хлопотов М. В. Онтологии: Семантическое программирование (на англ.)/ Материалы. 6-й Международной конференции по проблемам информатики и информационных технологий CSIT2004.-Будапешт, Венгрия, 2004, — Т.-1.- С.108−110.
- Мельников A.B., Хлопотов М. В. Поддержание достоверности гипертекстового информационного ресурса (на англ.)/Материалы 5-й Международной конференции по проблемам информатики и информационных технологий CSIT2003.- Уфа, УГАТУ, 2003.- T.-I.- С. 197.
- Мельников A.B. Система обработки информации и управления: архитектура и программное обеспечение / Сб.науч. тр. Юж.-Уральского гос. ун-та.-Челябинск, Изд. ун-та, 1998.- 147 с.
- Мельников М. Apache и PHP-удобные технологии // Интернет-Технологии.-2001.-N 6. — С. 32−36.
- Нариньяни A.C., Иванов Д. А., Седреев С. В., Фролов С. А. Недоопределенное календарное планирование: новые возможности. Информационные технологии. 1997, N 1.
- Нариньяни A.C., Телерман В. В., Ушаков Д. М., Швецов И. Е. Программирование в ограничениях и недоопределенные модели. Информационные технологии. Москва, «Машиностроение». 1998, N 7. С. 13−22.
- Ожегов Сергей Иванович. Словарь русского языка: 70 000 слов: 23-е изд., испр./ АН СССР, Ин-т рус. яз.-Под ред.Н. Ю. Шведовой М.:Рус.яз., 1991−915с. -27 см45.0зхаркан. Э. Машины баз данных и управление базами данных: Пер с англ. М.: Мир, 1989. -696 с.
- Плоткин Б.И. Универсальная алгебра, алгебраическая логика и базы данных. -М.: Наука, 1991.-116с.
- Попов Э.В. Онтологии и реинжиниринг. Седьмая научно-практическая конференция «Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями 2004"//М.: МЭСИ, 2004с. стр 16−19
- Попов Э.В., Фридман Г. Р. Алгоритмические основы интеллектуальных роботов и искусственного интеллекта. М.: Наука, 1976. 456 с.
- Расширяемый язык разметки (XML) 1.0 (вторая peдaкция).http://www.rol.ru/news/it/helpdesk/xmlO 1 .htm.
- Россеева О.И., Загорулько Ю. А. Организация эффективного поиска на основе онтологий. // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. -Т.2. -Аксаково, 2001. -с.ЗЗЗ-342.
- Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989. — 192с.
- Сизов В. MySQL, PHP и Microsoft Office // Интернет-Технологии.-2001 .-N 6. -С. 85.
- Соловьёва Е.А., Маторин С. И. О моделировании понятийных знаний: системный бионический подход // НТИ. Сер. 2. 1989. -N3. — С. 2−8.
- Субботин Д. Гипертекстовая технология отечественный опыт // Человек и Компьютер, 1992-№ 15(32)
- Субботин М.М. Новая информационная технология создание и обработка гипертекстов. Научно-техническая информация. Сер. 2 -1998 — № 5
- Федеральный закон от 04.07.1996. № 85-ФЗ «Об участии в международном информационном обмене» (Ст.2).
- Философский словарь/ под ред. И. Т. Фролова -4-е изд. -М.: Политиздат, 1981,-445 е.
- Хлопотов М.В. Обеспечение достоверности Internet-pecypcoB // Современные проблемы атомной энергетики. Сборник трудов международной научно-практической конференции/Снежинск, 2003, стр. 208−212
- Хлопотов М.В. Представление контекстных свойств отношений в RDF и онтологиях// Электронный журнал «Исследовано в России», 2004// http://zhurnal.ape.relarn.ru/articles/2004/198.pdf
- Хлопотов М.В. Представление парадоксальной семантики в семантической сети гипертекстового информационного ресурса// Электронный журнал «Исследовано в России», 2004// http://zhurnal.ape.relarn.ru/articles/2004/197.pdf
- Хлопотов М.В. Применение RDF для описания структуры информационных ресурсов. / Интеллект, логистика, системология. Сборник научных трудов. Вып. 7 Под ред. Р. П. Чапцова. Челябинск: Издание ЧНЦ РАЕН, РУО МАИ, ЧРО МАНПО, ЧРО МААНОИ, 2002. — 207 с.
- Эдди Сандра Э. XML: Справочник/ Пер. с англ. С. Тамбовский -СПб. Литер, 2000.-477 с.
- Эпштейн B. JL Гипертекст новая парадигма информатики, //Автоматика и Телемеханика, / No 11, 1991.
- Chris Waterson. RDF In Mozilla: Frequently asked questions http://www.mozilla.org/rdf/doc/faq.html.
- Crystal D. Language and the Internet. Cambridge Univ. Press. 2001. — 272 p.
- David Hyatt. XUL and RDF: The Implementation of the Application Object Model http://www.mozilla.org/xpfe/xulrdf.htm.71 .Extensible Markup Language (XML) 1.0 (Third
- Edition).http://www.w3.org/TR/2004/REC-xml-20 040 204/.
- Florescu D., Levy A., Mendelzon A. Database Techniques for the World-Wide Web: A Survey // SIGMOD Record. 1998. V. 27. № 3.
- Freshmeat: Software directory http://freshmeat.net/.
- G. Makeev, H. Schweppe, N.I. Yussupova. Suffix trees for querying XML databases. / In proc. CSIT'2003, UFA//Ufa:USATU Publishers, 2003. p.79
- Hypertext markup language. http://www.w3.org/MarkUp/.
- Hypertext transfer protocol. http://www.w3.org/Protocols/.
- I.A. Yussupova, В. Konig-Ries, D.V.Popov, N.I. Vainerman. Suffix trees for querying XML databases. / In proc. CSIT'2003, UFA//Ufa:USATU Publishers, 2003. p. 100
- IDEF5 Method Report http://ww.idef.com/Downloads/pdmdef5.pdf.
- IDEF5 Overview, http://www.idef.com/idef5.html.
- J. Rice, A. Farquhar, P. Piernot, & T. Gruber. Using the Web as an Application Interface. Knowledge Systems Laboratory, KSL-95−69, September 1995. CHI '96 Proceedings: Conference on Human Factors in Computing Systems, 1996, Vancouver, ВС, Canada
- Karp, P. D., & Gruber, Т. R. (1995). A Generic Knowledge-base Access Protocol. Proceedings of the International Joint Conferences on Artificial Intelligence, Montreal.
- Kumar D.R. Professional PHP Web development solutions. Wrox Press. 2002. -613
- Ludwig, В., Bucher, К., and Goerz, G. 2002. Corega Tabs: Mapping Semantics onto Pragmatics. In Proceedings of the KI-2002 Workshop on Applications of Description Logics ADL'02, Aachen, Germany, September 16−20, 2002.
- Melnikov A. V, Khlopotov M.V. Keeping hypertext information resource up-to-date. /Inproc. CSIT'2003, UFA//Ufa:USATU Publishers, 2003. p. 197
- Melnikov A. V, Khlopotov M.V. Ontology: The Semantic Programming / In proc. CSIT'2003, Budapest, Hungary//Ufa:USATU Publishers, 2004. p.84
- Microsoft Corp. http://www.microsoft.com/
- Mozilla Communityhttp://www.mozilla.org/.
- Mozilla в России http://www.mozilla.ru/.
- Nelson, T.N. A file structure for the complex, the changing, and the indeterminate // in: ACM 20th National Conference Proceedings (Clevelend, Ohio, 196)
- OWL Web Ontology Language Reference. http://www.w3.org/TR/owl-ref/.
- OWL Web Ontology Language Semantics and Abstract Syntax, http://www.w3 .org/TR/owl-semantics/.
- Pease, A., and Niles, I. 2002. IEEE Standard Upper Ontology: A Progress Report. Knowledge Engineering Review, Special Issue on Ontologies and Agents, 17, 65−70.
- RDF Semantics. http://www.w3.org/TR/rdf-mt/.
- RDF Vocabulary Description Language 1.0: RDF Schema, http://www.w3 .org/TR/rdf-schema/.
- RDF/XML Syntax Specification (Revised).http://www.w3.org/TR/rdf-syntax-grammar/.
- Redland DRF Application Framework http://librdf.org/.
- Sablotron: XSLT, DOM and XPath processor. http://www.gingerall.com/charlie/ga/xml/psab.xml.
- Suggested Upper Merged Ontology http://ontology.teknowledge.com/.
- Surina OWL Processor, http://www.w3 .org/2003/08/surnia/.
- T. R. Gruber. A translation approach to portable ontologies. Knowledge Acquisition, 5(2): 199−220, 1993.
- The Web Application Gateway, http://wag.javazen.org/.
- Valikov A., Kazakos W. Design approaches to structure-based XML. Storage in relational data bases // Forschungszentrum Informatik Ufa, USATU, 2001.-p.79.
- Watt D.A. Programming language syntax and semantics. Prentice-Hall. 1991. — 389 p.
- World Wide Web Consortium http://www.w3.org/.
- С 2001 по 2004 гг. Хлопотов М. В. занимался разработкой технологии анализа смысловых ошибок в Интернет представительствах коммерческих организаций.
- Директор ООО «Парамон Онлайн»
- С 2001 по 2004 гг. Хлопотов М. В. по заказу ЗАО «Интерсвязь» занимался разработкой информационной системы для выявления смысловых ошибок на Веб-сайтах предприятий и организаций.
- В процессе разработки сайта ОАО «Автомобильный завод «Урал» проведены испытания инструментального комплекса, предназначенного для выявления смысловых ошибок и основанного результатах диссертационной работы Хлопотова М.В.
- Методика предложена для дальнейшего использования на заводе.
- Заместитель директора центра информационных технологий1. А. Евгеньев