Технологии, модели и алгоритмы поиска в архивах медицинских данных с использованием контекстно-временной онтологии
Диссертация
Разработанная технология представления элементов МИС в неструктурированных текстовых массивах медицинских электронных записей с использованием дополнительных характеристик онтологических связей и предложенная методика энтропийной оценки неопределенности запроса позволяет осуществлять достаточно точный и полный смысловой поиск в медицинских документах, «слабо» чувствительный к языку, на котором… Читать ещё >
Содержание
- ТАБЛИЦА СОКРАЩЕНИЙ
- ГЛАВА 1. ДИФФЕРЕНЦИАЦИЯ ТРЕБОВАНИЙ К СБОРУ ДАННЫХ ДЛЯ ИНФОРМАТИЗАЦИИ МЕДИКО-БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ
- 1. 1. Характеристика медико-биологических исследований
- 1. 2. Специфика электронной медицинской информации
- 1. 3. Анализ технологий информационного поиска
- 1. 4. Выводы по главе
- ГЛАВА 2. МОДЕЛИРОВАНИЕ СЕМАНТИКО-ЭНТРОПИЙНОГО ПОИСКА С ИСПОЛЬЗОВАНИЕМ КОНТЕКСТНО-ВРЕМЕННОЙ ОНТОЛОГИИ
- 2. 1. Описание основных понятий семантико-энтропийного поиска
- 2. 2. Построение модели интерпретации смысла текстов документов и запроса с учетом контекста и времени
- 2. 3. Метод расчета меры соответствия текстов документов и запроса
- 2. 4. Метод расчета оценки эффективности этапов обучения и поиска
- 2. 5. Описание работы алгоритма выбора документов
- 2. 6. Выводы по главе
- ГЛАВА 3. РАЗРАБОТКА ТЕХНОЛОГИИ ИНФОРМАЦИОННОГО ПОИСКА В АРХИВАХ МЕДИЦИНСКИХ ДАННЫХ
- 3. 1. Проектирование архитектуры информационно-поисковой системы
- 3. 2. Обучение системы
- 3. 3. Интерпретация и анализ результатов поиска
- 3. 4. Гибридизация учетных медицинских информационных систем
- 3. 5. Выводы по главе
- ГЛАВА 4. ОЦЕНКА ЭФФЕКТИВНОСТИ РАЗРАБОТАННОЙ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЫ
- 4. 1. Результаты разработки информационно-поисковой системы
- 4. 2. Описание численных экспериментов
- 4. 3. Оценка модели семантико-энтропийного поиска
- 4. 4. Выводы по главе
Список литературы
- Аветисян Р.Д., Аветисян Д. О. Теоретические основы информатики. -М.: Вильяме, 2002. — 168 с.
- Алефелъд Г., Херцбергер Ю. Введение в интервальные вычисления / Пер. с англ. М.: Мир, 1987. — 356 с.
- Андриенко Е.В. Исследование и разработка методов и моделей поиска адекватной информации в полнотекстовых базах данных : Диссертационная работа к.т.н.: 05.13.17 / Таганрог, 2004. 211 с.
- Барсегян A.A. Технологии анализа данных: Data Mining, Visual mining, Text Mining, OLAP / Барсегян A.A., Куприянов М. С., Степаненко В. В., Холод И. И. СПб.: БХВ-Петербург, 2007. — 384 с.
- Белякин А.Ю., Козадой Ю. В., Мусин Г. Ш. Единое информационное пространство лечебно-профилактического учреждения. Вопросы интеграции и защиты данных // Информатизация образования и науки. 2010. -№ 1(5). — С. 72 — 87.
- Бледное A.M. Применение векторной модели представления текстовой информации для пополнения базы знаний // Вестник ИжГТУ, 2006. № 4. — С. 56 — 60.
- Бойцов И. Системы поиска по массивам неструктурированной информации. URL: http://www.trtu.hl2.ru/p220.htm (дата обращения: 15.04.2003).
- БрукингА. Экспертные системы. Принципы работы и примеры / Пер. с англ. / Брукинг А., Джонс П., Кокс Ф. и др.- под ред. Р.Форсайта. М.: Радио и связь, 1987. — 224 с.
- Бураковский В.И. Компьютерная технология интенсивного лечения: контроль, анализ, диагностика, лечение, обучение / Бураковский В. И., Бокерия JI.A., Газизова Д. Ш., Лищук В. А., Люде М. Н., Работников B.C., Соколов М. В., Цховребов С. В. М., 1995. — 85 с.
- Воройский Ф.С. Индексирование документов в АБИС // Библиотека, 1996. № 9. — С. 42 — 44.
- Гаврилова Т.А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. Учебник. СПб.: Питер, 2000. — 384 с.
- Гладун А., Рогушина Ю. Семантическая википедия как источник онтологий для интеллектуальных поисковых систем // Book 2 Advanced Research in Artificial Intelligence, 2008. C. 172 178.
- Глазунов В.А. Многокритериальный подход к проблемам виртуальности и выбора научной теории / Концепция виртуальных миров и научное познание. Институт философии РАН. СПб.: Изд. Русского христианского гуманитарного института, 2000. — С. 186 — 196.
- Глазунов В.А., Чистоходова Л. И. Моделирование творческого процесса / В кн.: Искусственный интеллект: междисциплинарный подход. Под ред. д.ф.н. Д. И. Дубровского и чл.-корр. РАН В. А. Лекторского. М.: ИнтеЛЛ, 2006. — С. 259 — 263.
- Глазунова О.В., Глазунов В. А., Дремайлов А. В. Разработка алгоритмов идентификации параметров объектов музейного хранения / Научно-технические проблемы развития Московского мегаполиса.
- Московская конференция молодых ученых. Тезисы докладов. — М.: ИМАШ РАН, 2002. С. 68.
- ГОСТ 7.25−2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления. -М.: Изд-во стандартов, 2001. 14 с.
- ГОСТ 7.59−2003. Индексирование документов. Общие требования к систематизации и предметизации. М.: Изд-во стандартов, 2005. — 8 с.
- ГОСТ 7.66−92. Система стандартов по информации, библиотечному и издательскому делу. Индексирование документов. Общие требования к координатному индексированию. М.: Изд-во стандартов, 1992. — 14 с.
- ГОСТ 7.73−96. Система стандартов по информации, библиотечному и издательскому делу. Поиск и распространение информации. Термины и определения. М.: Изд-во стандартов, 1997. — IV. — 15 с.
- ГОСТ 7.74−2002. Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения. М.: Изд-во стандартов, 2002. — 11 с.
- ГОСТ Р 52 636−2006. Электронная история болезни. Общие положения. М.: Изд-во стандартов, 2008. — 20 с.
- Граванова Ю. Защита информации в медицинских системах с точки зрения ILM. URL: http://www.cnews.ru/reviews/free/national2006/articles/ilm/ (дата обращения: 06.05.2010).
- Гусев A.B. Медицинские информационные системы: Монография / Гусев A.B., Романов Ф. А., Дуданов И. П., Воронин A.B. Петрозаводск: ПетрГУ. — 404 с.
- Гусев A.B. Обзор рынка медицинских информационных систем // Второй международный форум MedSoft 2006. URL: http://www.armit.ru (дата обращения: 28.11.2009).
- Доброе Б.В., Иванов В. В., Лукашевич Н. В., Соловьев В. Д. Онтологии и тезаурусы: Учебно-методическое пособие. — Казань: Казанский государственный университет, 2006. 198 с.
- Дюбуа Д., ПрадА. Теория возможностей. Приложение к представлению знаний в информатике / Пер. с фр. М.:Радио и связь, 1990.-288 с.
- Евдокименков В.Н. Компьютерные технологии сбора, обработки и анализа данных медико-биологических исследований: Учебное пособие. М.: МАИ, 2005. — 436 с.
- Захаров A.A., Нестерова O.A., Олейников Е. А. Алгоритм информационного поиска в медицинских архивах на основе контекстно-временной онтологии // Вестник Тюменского государственного университета. — Тюмень: ТюмГУ, 2010. № 6. — С. 177 — 182.
- Захаров A.A., Нестерова O.A., Олейников Е. А. Проблемы информационного поиска для научных исследований в медицинских информационных системах // Вестник Тюменского государственного университета. Тюмень: ТюмГУ, 2009. — № 6. — С. 215−219.
- Иванов В.В. Модели и методы интеграции структурированных текстовых описаний на основе онтологий : Диссертационная работа к. ф-м н.: 05.13.11 / Казань, 2009. 145 с.
- Иванов В.К., Иванов К. В. Введение в информационно-поисковые системы: Методические указания. Тверь: ТГТУ, 2005.
- Иванова И.В. Некоторые подходы к индексированию документов ключевыми словами. URL: http://rlst.org.by/bulletin/bulletin0616.htm (дата обращения: 13.06.2010).
- Информационно-поисковый тезаурус. Русская версия тезауруса EUROVOC. В 3-х томах. М.: Издание Государственной Думы, 2001.
- Казначеев В.П., Баевский P.M., Берсенева А. П. Донозологическая диагностика в практике массовых обследований населения. М.: Медицина, 1992.-208 с.
- Какорина Е.П., Михайлова ПЛ., Хальфин P.A. Статистический учет и отчетность учреждений здравоохраниния. М.: МЦФЭР, 2005. — 386 с.
- Карпенко А.П. Меры важности концептов в семантической сети онтологической базы знаний Электронный ресурс. // Наука и образование: электронное научно-техническое издание, 2010. URL: http://technomag.edu.ru/doc/151 142.html (дата обращения: 20.11.2010).
- Карпенко А.П. Оценка релевантности документов онтологической базы знаний Электронный ресурс. // Наука и образование: электронное научно-техническое издание, 2010. URL: http://technomag.edu.ru/doc/157 379.html (дата обращения: 20.11.2010).
- Клипов 77. Немного о неопределенности и нечеткости в онтологиях. URL: http://shcherbak.net/2009/03/nemnogo-o-neopredelennosti-i-nechetkosti-v-ontologiyax/ (дата обращения: 20.01.2010).
- Когаловский М. Р. Перспективные технологии информационных систем. М.: ДМК Пресс, 2003. — 288 с.
- Коганов A.B. Понятие энтропии в структуре моделей времени. URL: http://www.chronos.msu.ru/RREPORTS/koganovtezisy.htm (дата обращения: 27.07.2010).
- Кокрен У. Методы выборочного исследования. М.: Статистика, 1976. — 440 с.
- Косинов Д.И. Использование статистической информации при выявлении схожих документов // Интернет-математика 2007: Сборник работ участников конкурса научных проектов по информационному поиску. -Екатеринбург, 2007. С. 205 207.
- Красилъников И.А., Мусийчук Ю. И. Анализ предложений различных фирм в области медицинских информационных технологий // 2 международный форум MedSoft 2006. URL: http://www.armit.ru (дата обращения: 28.11.2009).
- Кузина И. Новые поколения поисковых машин // Изд. «Открытые системы», 1997. URL: http://www.osp.ru/cw/1997/32/23 154/ (дата обращения: 28.11.2009).
- Лищук В.А. Интеллектуальное обеспечение диагностики и лечения нарушений кровообращения // Лекции по сердечнососудистой хирургии. Под ред. JI.A. Бокерия. В 2-х томах. М.: НЦССХ им. А. Н. Бакулева РАМН, 1999.-Т.1.-348 с.
- Лищук В.А. Информатизация клинической медицины // Научно-методический журнал «Клиническая информатика и телемедицина», 2004. № 1. — С. 17−27.
- Лищук В.А., Гаврилое А. В., Данилевич А. И., Шевченко Г. В. Информатизация клинической медицины: все течет ничто не меняется? // Журнал «Информационные технологии в здравоохранении», январь-февраль 2002. — № 1 — 2. — С. 4 — 11.
- Миркин Б.Г. Анализ качественных признаков и структур. М.: Статистика, 1980. — 316 с.
- Молодченков А.И. Формализация описания лечебно-диагностических процессов. Нечеткие системы и мягкие вычисления: сб. статей Третьей Всероссийской научной конференции: В 2-х томах. -Волгоград, 2009. Т. 1. — С. 103- 109.
- Мордвинов В.А. Онтология моделирования и проектирования семантических информационных систем и порталов : Справочное пособие. -М.: МИРЭА, 2005.-237 с.
- Москин Н.Д. Теоретико-графовые модели структуры фольклорных текстов, алгоритмы поиска закономерностей и их программная реализация : Диссертационная работа к.т.н.: 05.13.18 / Петрозаводск, 2006. 121 с.
- Назаренко Г. И., Замиро Т. Н., Михеев А. Е., Гулиев Я. И., ХаткевичМ.И. Проблемы создания медицинских информационных систем.
- Поддержка мультипликативных структур ЛПУ в МИС // Врач и информационные технологии. М.: Менеджер здравоохранения, 2007. — № 4. -С. 48−50.
- Назаренко Г. И., Осипов Г. С. Основы теории медицинских технологических процессов. М.: ФИЗМАТЛИТ, 2005. -4.1. — 144 с.
- Назаренко Г. И., Осипов Г. С. Основы теории медицинских технологических процессов. Исследование медицинских технологических процессов на основе интеллектуального анализа данных. М.: ФИЗМАТЛИТ, 2006. — 4.2. — 144 с.
- Некипелова ИМ. Проблемы описания и вопросы моделирования семантики слова в базах данных // Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам. -Ижевск: ИжГТУ, 2006. С. 140 147.
- Некрестъянов И.С. Тематико-ориентированные методы информационного поиска : Диссертационная работа к.ф.-м.н.: 05.13.11 / СПб., 2000. 88 с.
- Нестерова O.A., Олейников Е. А. Некоторые подходы к решению проблемы интеграции данных результатов обследований на различном медицинском оборудовании // Вестник Тюменского государственного университета. Тюмень: ТюмГУ, 2007. — № 5. — С. 111−115.
- Ноженкова Л.Ф. Применение технологии оперативной аналитической обработки данных в задачах здравоохранения. URL: http://www.government.nnov.ru/data/objects/29 538/novozhenkova.doc (дата обращения: 06.05.2010).
- Норенков И.П. Интеллектуальные технологии на базе онтологий // Информационные технологии. М.: Новые технологии, 2010. -№ 1.-С. 17−23.
- Оре О. Теория графов / Пер. с англ. М.: Либроком, 2009. — 354 с.
- ОрловА.И. Теория принятия решений. Учебное пособие.- М.: Март, 2004. 656 с.
- Реброва О.Ю. Применение методов интеллектуального анализа данных для решения задачи медицинской диагностики // Новости искусственного интеллекта, 2004. -№ 3. -С. 16 — 80.
- Рынков А.Ю., Близняков A.A., Хоръкова Н. Ю., Нестерова O.A. Риск тромбоэмболических осложнений и адекватность применения варфарина при фибрилляции предсердий неклапанной этиологии // Вестник аритмологии. -СПб., 2010.-№ 62.-С. 41 -44.
- Скороходъко Э.Ф. Семантические сети и автоматическая обработка текста. Киев: Наукова думка, 1983. — 218 с.
- Сэлтон Г. Автоматическая обработка, хранение и поиск информации: Пер. с англ. / Под ред. А. И. Китова. М.: Советское радио, 1973. — 560 с.
- Тавровский В.М. Автоматизация лечебно-диагностического процесса. Тюмень: Вектор Бук, 2009. — 464 с.
- Урсул А.Д. Природа информации. М.: Политиздат, 1968. — 287 с.
- УэноХ., Исидзука М. Представление и использование знаний / Пер. с.яп. М.: Мир, 1989. — 220 с.
- Целых Ю.А. Теоретико-графовые методы анализа нечетких социальных сетей Электронный ресурс. URL: http://swsys.ru/print/articlep rint. php?id=742 (дата обращения: 28.11.2009).
- Чугреев B.JI. Модель структурного представления текстовой информации и метод ее тематического анализа на основе частотно-контекстной классификации : Диссертационная работа к.т.н.: 05.13.01 / СПб., 2003. 156 с.
- Шарапов Р.В., Шарапова Е. В., Саратовцева O.A. Модели информационного поиска // Вестник Московского городского педагогическогоуниверситета. Серия «Информатика и информатизация образования». Казань: Фолиантъ, 2007. — № 1. — С. 326 — 329.
- Шеменков П.С. Разработка и исследование модели нейросетевого метода анализа текстовых документов : Диссертационная работа к.т.н.: 05.13.18/СПб., 2009, — 153 с.
- Шрейдер Ю.А. Информация и метаинформация // Научно-техническая информация. Сер. 2. Информационные процессы и системы, 1974. № 4. — С. 3 — 10.
- Эльянов М.М. Медицинские информационные технологии: Каталог. М.: Третья медицина, 2007. — Вып.7. — 300 с.
- Эльянов М.М. Медицинские информационные технологии: цивилизованный рынок или «зоопарк» // Информационные технологии в медицине- 2002: сб. тезисов. М.: ВК ВВЦ «Наука и образование», 2002. С. 54 58.
- Эльянов М.М. Медицинские информационные технологии: Каталог. М.: ТДДС-Столица — 8, 2010. — Вып. 10. — 300 с.
- Bahl L.R., Baker J.K., Jelinek F., Mercer R.L. Perplexity a measure of the diculty of speech recognition tasks. Program of the 94th Meeting of the Acoustical Society of America J. Acoust. Soc. Am., vol. 62 p. S63, 1977. Suppl. no. 1.
- BunkeH. Graph matching: theoretical foundations, algorithms, and applications // Proc. Vision Interface. Montreal, 2000. Pp. 82 — 88.
- Chakrabarti S. Mining the Web. Discovering Knowledge from Hypertext Data. Morgan Kaufmann Publishers, 2003. 345 p.
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze Schutze. Introduction to Information Retrieval. Cambridge UP. Online edition ©, 2009. 544 p.
- Davies J., Studer R, Warren P. Semantic Web Technologies: Trends and Research in Ontology-based Systems. Wiley, 2006. — 326 p.
- Deerwester S., Dumais S.T., Furnas G.W., Landauer T.K., Harshman R. Indexing by Latent Semantic Analysis, Journal of the American Society for Information Science 41, 1990. Pp. 391 407.
- Dempster, Arthur P. A generalization of Bayesian inference, Journal of the Royal Statistical Society, Series B, Vol. 30, 1968. Pp. 205 247.
- Faloutsos C., Oard D. A survey of Information Retrieval and Filtering Methods. Technical Report, College Park, MD: University of Maryland Computer Science Dept., College Park- 1996.
- Gruber T.R. A Translation Approach to Portable Ontology Specification. Knowledge Acquisition, 1993. Vol.5, № 2. — Pp. 199 — 220.
- Gupta M.M. Cognition, perception and uncertainty I I Fuzzy logic in knowledge-based systems, decision and control / Ed. Gupta M.M., Yamakawa T. -Elsevor Science Publishers B. V, 1988. Pp. 3 10.
- Joyce T., Needham R.M. The Thesaurus Approach to Information Retrieval // American Documentation, 1958. vol.9, issue 3. — Pp. 192 — 197.
- Lewis D., Sparck Jones K. Natural Language Processing for Information Retrieval. Communications of the ACM, Jan. 1996. № 39(1) — Pp. 92 — 101.
- LIV (Legislative Indexing Vocabulary). Congressional Research Service. The Library of Congress. Twenty-first-Edition, 1994. 546 p.
- Robertson S.E., Sparck Jones K. Relevance weighting of search terms, Journal of the American Society for Information Science, 1976. № 27. — Pp. 129 — 146.
- Vakkari P. Cognition and Changes of Search Terms and Tactics During Task Performance: A Longitudinal Study // Proc. of the RIAO 2000 Conference. -Paris, 2000. Pp. 894 907.
- Рис. 1. Структурная схема комплексного системного подхода к процессуисследования .8
- Рис. 2. Совокупность проблем различных технологий и направлений, определяющих цель исследования.17
- Рис. 3. Структурная схема информационно-поисковой системы в общемвиде.34
- Рис. 4. Представление семантической сети в виде ориентированноговзвешенного мультиграфа.52
- Рис. 5. Этапы алгоритма семантико-энтропийного поиска.62
- Рис. 6. Концептуальная модель информационно-поисковой системы.68
- Рис. 7. Схема многоуровневой архитектурной модели информационнопоисковой системы .70
- Рис. 8. Общая структура базы данных поисковых образов .75
- Рис. 9. График изменения значений оценок информационно-поисковойсистемы по запросам коллекции .102
- Рис. 10. Графическое представление триплетов запроса и документов .104
- Рис. 11. График динамики значений коэффициентов точности и полноты в зависимости от этапов обучения .105