Моделирование процессов понимания речи с использованием латентно-семантического анализа
Диссертация
Определены основные свойства предлагаемой модели понимания речи: модель должна представлять собой структурированный определенным образом набор ситуаций, подобных фреймам, которые активируются и могут корректироваться по мере поступления новой информации. Процесс понимания состоит из двух этапов: дограмматического (или имеющего латентную грамматику, т. е. включенную в лексические единицы… Читать ещё >
Содержание
- Глава 1. Предварительные определения и замечания
- 1. 1. Эмпирический и рационалистический подходы к моделированию понимания
- 1. 2. Определение основных понятий, необходимых для построения модели понимания
- 1. 2. 1. Язык и речь
- 1. 2. 2. Коммуникация
- 1. 2. 3. Код
- 1. 2. 4. Информация
- 1. 3. Некоторые обоснования возникновения языка, фило- и онтогенез
- 1. 4. Роль правого и левого полушарий в речевосприятии
- 1. 5. Понимание речи
- 1. 5. 1. Семиотические аспекты понимания
- 1. 5. 2. Лингвистические аспекты понимания
- 1. 5. 3. Нейрофизиологические аспекты понимания
- 1. 5. 4. Определение понимания речи для моделирования процессов понимания
- 1. 6. Знание и понимание
- 1. 7. Предварительные
- выводы
- Глава 2. Обзор моделей, используемых в современных автоматических системах понимания речи
- 2. 1. Вероятностные модели понимания
- 2. 1. 1. N-граммные модели или модели на НММ
- 2. 1. 2. Модели, основанные на деревьях решений
- 2. 2. Фреймовые модели понимания
- 2. 3. Модели, основанные на теории формальных языков
- 2. 4. Другие языковые модели понимания
- 2. 4. 1. Топологическая модель Р. Тома
- 2. 4. 2. Нейросетевые модели
- 2. 4. 3. Ситуационные модели
- 2. 5. Краткая классификация моделей понимания
- 2. 1. Вероятностные модели понимания
- Глава 3. Выбор, анализ и обоснование метода моделирования
- 3. 1. Обзор методов и алгоритмов классификации / кластеризации текстов
- 3. 1. 1. STC
- 3. 1. 2. Scatter/Gather
- 3. 1. 3. Алгоритм K-means
- 3. 1. 4. SOM
- 3. 1. 5. LSA/LSI
- 3. 2. Обоснование выбора метода моделирования
- 3. 1. Обзор методов и алгоритмов классификации / кластеризации текстов
- Глава 4. Латентно-семантический анализ и сферы его применения
- 4. 1. Описание работы JICA
- 4. 2. Области применения JICA
- 4. 2. 1. Рубрикация текстов (Тематическая классификация и кластеризация документов)
- 4. 2. 2. Индексация текстовых корпусов, системы поиска
- 4. 2. 3. Анализ связности дискурса и когерентности текста
- 4. 2. 4. Представление и проверка знаний
- 4. 2. 5. Использование JICA в когнитивных моделях, понимание текста
- 5. 1. Общее описание модели
- 5. 2. Программное обеспечение, использовавшееся для исследований JICA, и этапы исследования
- 5. 3. Материал для тестирования
- 5. 4. Подготовка базы
- 5. 4. 1. Сегментация текста на термы
- 5. 4. 2. Расчет весовых функций
- 5. 4. 3. Определение тематик документов
- 5. 4. 4. Выбор порога для сингулярных элементов диагональной матрицы при SVD-анализе
- 5. 4. 5. Выбор критерия ограничения величины весовых функций при получении ассоциативного словаря
- 5. 5. Результаты тестирования на базе русской речи
- 5. 5. 1. Векторный метод
- 5. 5. 2. SVD-анализ
Список литературы
- Бахтин М.М. К методологии гуманитарных наук / Бахтин М. М. Эстетика словесного творчества. М.: «Искусство», 1979.
- Бехтерева Н.П. Магия творчества и психофизиология: факты, соображения, гипотезы. СПб.: РАН- ИМЧ, 2006.
- Ван Дейк Т. А., Кинтч В. Стратегии понимания связанного текста // Новое в зарубежной лингвистике / Гл. ред. В. А. Звегинцева. Вып. 13. М.: «Прогресс», 1988. С. 153−211.
- Венцов А.В., Касевич В. Б. Проблемы восприятия речи. М.: «УРСС», 2003.
- Венцов А.В., Касевич В. Б., Ягунова Е. В. Корпус русского языка и восприятие речи // Научно-техническая информация. Сер. 2. 2003. № 6. С.25−32.
- Выготский Л.С. Мышление и речь. М.: «Лабиринт», 2005.
- Выготский JT.C. Вопросы детской психологии. СПб.: «СОЮЗ», 2006.
- Ю.Галунов В. И. Бионическая модель системы распознавания речи // Исследование моделей речеобразования и речевосприятия / Под ред. В. И. Галунова. Д., 1981. С.36−52.
- Галунов В.И. Язык и системы автоматического понимания речи // Восприятие языкового значения. Межвузовский сборник / Калининград: КГУ, 1980. С. 10−21.
- Галунов В.И., Евдомаха А. В., Кочанина Ю. Л., Остроухов А. В., Разумихин Д. В., Соловьев А. Н. Коллекция речевых баз данных // XXXIII Международная Филологическая Конференция 2005. Тезисы докладов. СПб.: Изд-во СПбГУ, 2005а. С.15−16.
- Галунов В.И., Соловьев А. Н. Современные проблемы в области распознавания речи // Информационные технологии и вычислительные системы. Вып. 2. М., 2004. С.41−45.
- Голуб Дж., Ван Лоун Ч. Матричные вычисления. М.: «Мир», 1999.
- Демьянков В.З. Фреймовая семантика // Краткий словарь когнитивных терминов / Кубрякова Е. С., Демьянков В. З.,
- ПанкрацЮ.Г., Лузина Л. Г. Под ред. Е. С. Кубряковой. М.: Филологический факультет МГУ, 1996. С. 189−191.
- Кант И. Критика чистого разума. М.: «Наука», 2000.
- Кириченко К.М., Герасимов М. Б. Обзор методов кластеризации текстовых документов // Компьютерная лингвистика и интеллектуальные технологии. Сб. научных статей / Под ред. А. С. Нариньяни. М.: Наука, 2001. Т. 2. С.161−165.
- Колмогоров А.Н. Автоматы и жизнь // Квант. Вып. 64. М.: Наука, 1988. С.43−62.
- Колмогоров А.Н., Прохоров А. В. Статистика и теория вероятностей в исследовании русского стиха // Симпозиум по комплексному изучению художественного творчества. М., 1963. — С.23.
- Крылов С.А. Делимитация тактов в русском письменном тексте // Труды международной конференции «Корпусная лингвистика-2006». СПб.: Изд-во СПбГУ, 2006. С.54−55.
- Крылов С.А., Ягунова Е. В. Квантитативный подход к выделению инвентарных единиц языка // Вторая международная конференция по когнитивной науке. Тезисы докладов. Т. 1. СПб., 2006. С.329−330.
- Ламб С.М. О нейрокогнитивной лингвистике // Лекции по когнитивным наукам / Вып. 6. Ред. В. Д. Соловьев. Казань: Отечество, 2003.
- Лотман Ю.М. О двух моделях коммуникации в системе культуры // Лотман Ю. М. Статьи по семиотике и типологии культуры. Т. 1. / Таллинн: «Александра», 1992а. С.76−90.
- Лотман Ю.М. О семиосфере // Лотман Ю. М. Статьи по семиотике и типологии культуры. Т. 1. / Таллинн: «Александра», 1992b. С. 1125.
- Мартемьянов Ю.С. Логика ситуаций. Строение текста. Терминологичность слов. М.: «Языки славянской культуры», 2004.
- Мартин Н., Ингленд Дж. Математическая теория энтропии. М.: «Мир», 1988.
- Масленникова Е. Фреймовое представление семантики текста // Лингвистический вестник. Вып. 2. Ижевск: УМО «Sancta lingua», 2000.-C.l 14−124.
- Мельчук И.А. Опыт теории лингвистических моделей «Смысл-текст». М.: «Языки русской культуры», 1999.
- Митрофанова О.А. Измерение семантической информации в тексте на основе анализа латентных связей // Труды Международной конференции «MegaLing-2005»: Прикладная лингвистика в поиске новых путей. СПб., 2005. С.80−89.
- Некрестьянов И.С. Тематико-ориентированные методы информационного поиска / Диссертация на соискание степени к. ф-м.н. СПбГУ, 2000.
- Николис Дж. Хаотическая динамика лингвистических процессов и образование паттернов в поведении человека. Новая парадигма селективной передачи информации // Синергетическая парадигма. М.: «Прогресс-Традиция», 2000. С.426−434.
- Николис Дж. Динамика иерархических систем. Эволюционное представление. М.: «Мир», 1989.
- Павилёнис Р.И. Проблема смысла: Современный логико-философский анализ языка. М.: «Мысль», 1983.
- Пятигорский А. Мышление и наблюдение. Рига: «Liepnieks Ritups», 2002.
- Разумихин Д.В. Использование нейронных сетей на уровне семантики в системе распознавания речи // Сборник докладов IV Всероссийской конференции «Нейрокомпьютеры и их применение -2001». М.: Радиотехника, 2001b. С.208−211.
- Разумихин Д.В. Разработка системы понимания устной речи в диалоге // Компьютерная лингвистика и интеллектуальные технологии. Сб. научных статей. Т. 2. / Под ред. А. С. Нариньяни. М.: Наука, 2001а. С.323−329.
- Разумихин Д.В., Соловьев А. Н. Системы автоматического распознавания речи с различными моделями организации диалога //
- Сб. научных сообщений XIII сессии Российского акустического общества. М.: ГЕОС, 2003. С. 141−144.
- Соловьев А.Н. Возможность интерпретации семиотических механизмов естественного языка // Обработка текста и когнитивные технологии. Сб. научных статей / Под ред. Соловьева В. Д. Казань: Отечество, 2002. С.233−245.
- Соловьев А.Н., Галунов В. И. Мышление, язык и системы автоматического понимания речи // Вторая международная конференция по когнитивной науке. Тезисы докладов. Т. 2. СПб., 2006. — С.437−439.
- Соссюр Ф. Курс общей лингвистики. М.: УРРС, 2004.
- Том Р. Топология в лингвистике // Успехи математических наук. 1975. Т. XXX. Вып. 1.-С.199−221.
- Ухтомский А. Доминанта. СПб.: «Питер», 2002.
- Филлмор Ч. Фреймы и семантика понимания // Новое в зарубежной лингвистике. Вып. XXIII. Когнитивные аспекты языка / Гл. ред. Звегинцев В. А. М.: «Прогресс», 1988. С.52−92.
- Холоденко А.Б. О построении статистических языковых моделей для систем распознавания русской речи // Интеллектуальные системы. 2002. Т. 6. Вып. 1−4. С.381−394.
- Черниговская Т.В., Балонов Л. Я., Деглин В. Л. Билингвизм и функциональная асимметрия мозга // ТЕКСТ И КУЛЬТУРА. Труды по знаковым системам XVI. Тарту, 1983. С.62−83.
- Черниговская Т.В., Деглин В. Л. Проблема внутреннего диалогизма (нейрофизиологическое исследование языковой компетенции) // Ученые записки Тартуского Университета. Труды по знаковым системам. Вып. 17. Тарту, 1984. С.62−83.
- Щерба Л.В. О трояком аспекте языковых явлений и об эксперименте в языкознании // Языковая система и речевая деятельность. Л., 1974. С.24−39.
- Ягунова Е.В. Опорные элементы в восприятии текста // Вторая международная конференция по когнитивной науке. Тезисы докладов. Т. 1. СПб., 2006. С.489−491.
- Якобсон Р. Два вида афатических нарушений и два полюса языка // Язык и бессознательное. М.: «Гнозис», 1996. — С.27−52.
- Якобсон Р. Лингвистика и поэтика // Сб. Структурализм: «за» и «против». М.: «Прогресс», 1975. С.193−203.
- Arbib М.А. The mirror system, imitation, and the evolution of language // Imitaion in animals and artifacts / Eds. Nahaniv C., Dautenhahn K. Cambridge (MA): The MIT press, 2002. P.229−280.
- Bestgen Y., Cabiaux A.F. L’analyse semantique latente et 'identification des metaphores // Actes de la 9eme Conference annuelle sur le traitement automatique des langues naturelles. Nancy: INRIA, 2002. P.331−337.
- Black E., Jelinek F., Lafferty J., Magerman D.M., Mercer R., Roukos S. Towards History-Based Grammars: Using Richer Models for Probabilistic Parsing // Proceedings of the 5th DARPA Speech and Natural Language Workshop. Harriman, NY, 1992. P.31−37.
- Brown P.F., Delia Pietra V.J., de Souza P.V., Lai J.C., Mercer R.L. Class-Based N-Gram Models of Natural Language // Computational Linguistics. 1992. 18(4).-P.467−479.
- Chomsky N. On nature and language. New York: Cambridge University Press, 2002.
- Colin Ph. Levels of representation in the electrophysiology of speech perception // Cognitive Science: A Multidisciplinary Journal. 2001. Vol. 25. No. 5.-P.711−731.
- Cristianini N., Shawe-Taylor J., Lodhil H. Latent Semantic Kernels // Journal of Intelligent Information Systems. March 2002. V. 18. N. 2−3. -P.127−152.
- Deacon T.W. The Symbolic Species: The Co-Evolution of Language and the Brain. New York: Norton W.W. & Company, 1997.
- Deerwester S., Dumais S.T., Furnas G.W., Landauer Т.К., Harshman R. Indexing by Latent Semantic Analysis // Journal of the American Society for Information Science. 1990. 41(6). -P.391−407.
- Denhiere G., Lemaire B. A Computational Model of a Child Semantic Memory // Proceedings of the 26th Annual Meeting of the Cognitive Science Society. 2004a. P.297−302.
- Denhiere G., Lemaire B. Modelisation des effets contextuels par l’analyse de la s6mantique latente // J.M.C.Bastien (ed.) Actes des Deuxiemes
- Journees d’etude en Psychologie Ergonomique (EPIQUE 2003). Roquencourt: INRIA, 2003. -P.289−294.
- Denhiere G., Lemaire B. Representing children’s semantic knowledge from a multisource corpus // Proceedings of the 14th Annual Meeting of the Society for Text and Discourse, Chicago, August 1−4 2004b. P.10−13.
- Denhiere G., Lemaire В., Bellissens C., Jhean-Larose S. Psychologie cognitive et comprehension de texte: une demarche theorique et expdrimentale // S. Porhiel, D. Klinger (eds.). L’unite texte. Pleyben: Perspectives, 2004. -P.74−95.
- Dessus P. Verification semantique de liens hypertextes avec LSA Hypertext Links Semantic Verification with LSA. // J.-P.Balpe, A. Lelu, S. Natkin, I. Saleh (eds.). Hypertextes, hypermedias et internet (H2PTM'99). Paris: Hermes, 1999. P. 119−129.
- Foltz P.W. Latent Semantic Analysis for text-based research. Behavior Research Methods // Instruments and Computers. 1996. 28−2. P. 197 202.
- Foltz P.W., Kintsch W., Landauer Т.К. The measurement of textual coherence with Latent Semantic Analysis // Discourse Processes. 1998. 25, 2−3. P.285−307.
- Galunov V.I., Kochanina J.L., Soloviev A.N., Evdomakha A.V., Razumikhin D.V., Tropf H., Hoege H. Wideband speech database for Russian // International workshop «Speech and Computer» Proceedings. SPb., 2002. -P.l 13−117.
- Given T. Bio-Linguistics: The Santa Barbara lectures. Amsterdam/ Philadelphia: John Benjamins Publishing Company, 2002.
- Hofmann T. Probabilistic Latent Semantic Indexing // Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval, 1999. P.50−57.
- Jakobson R. Essai de linguistique gёnёrale. Paris: Minuit, 1963.
- Kintsch W. Metaphor comprehension: a Computational Theory // Psychonomic Bulletin & Review. 2000. 7(2). P.257−266.
- Kintsch W. On the notions of theme and topic in psychological process models of text comprehension // M. Louwerse & W. van Peer (eds.). Thematics: Interdisciplinary Studies. Amsterdam: Benjamins, 2002. -P.157−170.
- Kintsch W. Predication // Cognitive Science. 2001. 25−2. P. 173−202.
- Kintsch W. The role of knowledge in discourse comprehension: A construction-integration model // Psychological Review. 1988. Vol. 95. № 2. — P.163−182.
- Kintsch W., Bowles A.R. Metaphor comprehension: what makes a metaphor difficult to understand? // Metaphor and Symbol. 2002. 17. -P.249−262.
- Kintsch W., Patel V.L., Ericsson K.A. The role of long-term working memory in text comprehension // Psychologia. 1999. 42. P. 186−198.
- Kohonen Т., Kaski S., Lagus K., Salojarvi J., Honkela J., Paatero V., Saarela A. Self Organization of a Massive Document Collection // IEEE Trans. Neural Networks. May 2000. Vol. 11. No. 3. P.574−585.
- Landauer Т.К., Dumais S.T. A solution to Plato’s problem: The Latent Semantic- Analysis theory of the acquisition, induction, and representation of knowledge // Psychological Review. 1997. 104. -P.211−240.
- Landauer Т., Foltz P., Laham D. An introduction to latent semantic analysis // Discourse Processes. 1998. 25. P.259−284.
- Lemaire В., Bianco M. Contextual Effects on Metaphor Comprehension:Experiment and Simulation // Proc. of the 5th International Conferenceon Cognitive Modeling (ICCM'2003), Bamberg, Germany 2003. P.153−158.
- Lemaire В., Denhiere G. Cognitive Models based on Latent Semantic Analysis // Tutorial given at the 5th International Conference on Cognitive Modeling (ICCM'2003), Bamberg, Germany, April 9 2003. -P.23−25.
- Magerman D.M. Statistical Decision-Tree Models for Parsing // Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics. Cambridge, MA, 1995. — P.276−283.
- Marslen-Wilson W., Tyler L.K. Processing structure of sentence perception // Nature. 1975. 257. P.784−786.
- Menning H., Zwitserlood P., Schoning S., Hihn H., Bolte J., Dobel C., Mathiak K., Lutkenhoner B. Pre-attentive detection of syntactic and semantic errors // Neuroreport. 2005. 16. P.77−80.
- Pelleg D., Moore A. X-means: Extending K-means with Efficient Estimation of the Number of Clusters // Proceedings of the Seventeenth International Conference on Machine Learning, June 29-July 02, 2000. -P.727−734.
- Pinker S., Jackendoff R. The faculty of language: what’s special about it? // Cognition. 2005. 95. -P.201−236.
- Pulvermiiller F. Brain reflections of word and their meaning // Trends in Cognitive Sciences. 2001. Vol. 5. No 12. P.517−524.
- Pulvermiiller F., Assadollahi R., Elbert T. Neuromagnetic evidence for early semantic access in word recognition // European Journal of Neuroscience. 2001. Vol. 13. -P.201−205.
- Pulvermiiller F., Shtyrov Y. Automatic processing of grammar in the human brain as revealed by the mismatch negativity // Neurolmage. 2003. 20. P.159−172.
- Pulvermiiller F., Shtyrov Y. Language outside the focus of attention: The mismatch negativity as a tool for studying higher cognitive processes // Progress in Neurobiology 2006. 79. P.49−71.
- Pulvermiiller F., Shtyrov Y., Ilmoniemi R.J. Brain Signatures of Meaning Access in Action Word Recognition // Journal of Cognitive Neuroscience. 2005. 17:6. -P.884−892.
- Rizzolatti G., Arbib M.A. Language within our grasp // Trends in Neurosciences. 1998. 21. P. 188−194.
- Shestakova A., Brattico E., Soloviev A., Klucharev V., Huotilainen M. Orderly cortical representation of vowel categories presented by multiple exemplars // Brain Research: Cognitive Brain Research. 2004. 21. -P.342−350.
- Shtyrov Y., Hauk O., Pulvermiiller F. Distributed neuronal networks for encoding category-specific semantic information: the mismatch negativity to action words // European Journal Neuroscience. 2004. 19. -P.1083−1092.
- Shtyrov Y., Pulvermuller F., Naatanen R., Ilmoniemi R.J. Grammar Processing Outside the Focus of Attention: an MEG Study // Journal of Cognitive Neuroscience. 2003. 15:8. P. l 195−1206.
- Soloviev A.N., Victorova K.O., Razumikhin D.V. About using non-informational functions in model of speech communication // International workshop «Speech and Computer» Proceedings. SPb., 2002. — P.27−31.
- Ukkonen E. Constructing Suffix Trees On-Line in Linear Time // Proceedings of the IFIP 12th World Computer Congress on Algorithms, Software, Architecture Information Processing '92, Volume 1. Amsterdam, The Netherlands, 1992. — P.484−492.
- Wolfe M.B.W., Schreiner M.E., Rehder В., Laham D., Foltz P.W., Kintsch W., Landauer Т.К. Learning from text: Matching readers and texts by Latent Semantic Analysis // Discourse Processes. 1998. 25. -P.309−336.
- Zwaan R.A. The Immersed Experiencer: Toward an Embodied Theory Of Language Comprehension // The Psychology of Learning and Motivation. 2004. Vol. 44. -P.611−619.
- Zwaan R.A., Madden C.J. Updating Situation Models // Journal of Experimental Psychology: Learning, Memory, and Cognition. 2004. Vol. 30. No. 1. -P.283−288.
- Zwaan R.A., Radvansky G.A. Situation Models in Language Comprehension and Memory // Psychological Bulletin. 1998. Vol. 123. No. 2. P.162−185.