Метод тематического связанного ранжирования для задач автоматического сводного реферирования научно-технических информационных сообщений
Диссертация
В XX столетии аналитическая деятельность получила широкое распространение и превратилась в профессиональную деятельность. Во многих странах существуют информационно-аналитические отделы и службы в государственных органах, компаниях, банках, политических партиях. Объём информации, необходимой и используемой в аналитической деятельности, и далее принятии решений, достигает десятков и сотен… Читать ещё >
Содержание
- Глава 1. Современное состояние проблемы автоматического сводного реферирования текста
- 1. 1. Актуальность задачи автоматического реферирования текста
- 1. 2. Реферат и аннотация
- 1. 3. Постановка задачи реферирования текста
- 1. 4. Обзор методов автоматического реферирования текста
- 1. 5. Современные системы автоматического реферирования текста
- 1. 6. Особенности сводного автоматического реферирования
- 1. 7. Обзор методов сводного автоматического реферирования
- 1. 8. Современные системы автоматического сводного реферирования
- 1. 9. Постановка задачи исследования диссертационной работы
- 1. 10. Выводы по Главе 1
- Глава 2. Разработка метода тематического связанного ранжирования для задач сводного реферирования
- 2. 1. Метод Manifold Ranking
- 2. 2. Использование метода Manifold Ranking для задачи сводного реферирования
- 2. 3. Использование метода Manifold Ranking для задачи сводного реферирования новостных кластеров на русском языке
- 2. 4. Подбор параметров метода Manifold Ranking
- 2. 5. Модифицированный метод Manifold Ranking
- 2. 6. Подход к описанию модели кластера документа на основе тематической связности
- 2. 7. Метод тематического связного ранжирования
- 2. 7. 1. Ранжирование на основе меры лексической близости предложений
- 2. 7. 2. Ранжирование на основе меры лексической близости предложений с учетом более сложных лингвистических критериев
- 2. 7. 3. Ранжирование с учетом нелинейности текста, как связной структуры на основе метода Manifold Ranking
- 2. 7. 4. Метод построения графа тематической связности
- 2. 7. 5. Метод формирования сводного реферата на основе графа тематической связности
- 218. Выводы по Главе 2
- Глава 31. Разработка алгоритма- автоматического сводного реферирования научно-технических Информационных сообщений
- 3. 1. Обобщенный алгоритм автоматического сводного реферирования научно-технических информационных сообщений
- 3. 2. Выбор способа формулировки тем
- 3. 2. 1. Использование заголовков документов в качестве формулировок основных тем коллекции документов
- 3. 2. 2. Использование шаблонных фраз как формулировок основных тем коллекции документов
- 3. 3. Предварительный анализ текста
- 3. 4. Модель и алгоритм вычисления TF-меры с учетом связей понятий по тезаурусу
- 3. 5. Алгоритм формирования связного текста сводного реферата на основе графа тематической связности
- 3. 6. Выводы по Главе 3
- 4. 1. Основные подходы к функциональной оценке качества систем реферирования
- 4. 2. Экспертные ручные оценки качества реферирования
- 4. 3. Метрика ROUGE-RUS
- 4. 3. 1. Метрика ROUGE-N
- 4. 3. 2. Метрика ROUGE-L
- 4. 3. 3. Метрика ROUGE-RUS для кластеров на русском языке
- 4. 4. Описание эксперимента по оценке
- 4. 5. Достоверность экспертных оценок и корреляция между критериями
- 4. 6. Результаты оценки
- 4. 7. Оценка производительности
- 4. 8. Выводы по Главе 4
- 5. 1. Общая концепция организации программного комплекса автоматического сводного реферирования
- 5. 2. Программный комплекс для автоматического сводного реферирования «MDS Evaluation»
- 5. 3. Архитектура ПК «MDS Evaluation»
- 5. 4. Пользовательский интерфейс ПК «MDS Evaluation»
- 5. 5. Пример работы ПК «MDS Evaluation»
- 5. 6. Оценка эффективности ПК «MDS Evaluation»
- 5. 7. Выводы по Главе 5
Список литературы
- Автоматическая обработка текста Электронный ресурс. // Режим доступа: http://aot.ru/
- Алексеров, Ф.Т. Методы обработки интервальных экспертных оценок Текст. / Ф. Т. Алексеров, В. Бауман, В. И. Вольский // Автоматика и телемеханика. -1984. -№ 3.-С. 127−133.
- Алыгулиев, P.M. Автоматическое реферирование документов с извлечением информативных предложений Текст. / Р. М. Алыгулиев // Вычислительные технологии. 2007. — Т. 12, № 5. — С. 5−15.
- Белоногов, Г. Г. Компьютерная лингвистика и перспективные информационные технологии Текст.: монография / Г. Г. Белоногов, Ю. П. Калинин, А. А. Хорошилов. М.: Русский мир, 2004. — 246 с.
- Берзон, В.Е. Об одном подходе к проблеме автоматического реферирования и автоматического свертывания индексируемых текстов Текст. / В. Е. Берзон //НТИ. Сер. 2. -1971. № 10. — С. 16−21.
- Берзон, В.Е. Синтаксические сверхфразовые связи и их инженерно— лингвистическое моделирование Текст.: монография / В. Е. Берзон, Э. М. Добрускина. Кишинев: Штиинца. -1986. -168 с.
- Бешелев, С.Д. Математико-статистические методы экспертных оценок Текст.: монография / С. Д. Бешелев, Ф. Г. Гурвич. М.: Статистика, 1980. — 263 с.
- Блюменау, Д.И. Проблемы свёртывания научной информации Текст.: монография / Д. И. Блюменау. Л.: Наука, 1982. — 166 с.
- Блюменау, Д.И. Индикаторный метод компьютерного свертывания в процессе обучения аналитико-синтетической переработке информации Текст. / Д. И. Блюменау, JI.H. Афанасова // Научные и технические библиотеки. 2001. № 12. С. 2941.
- Богословская, И.В. Объективность структуры текста и субъективность процесса понимания Текст. / И. В. Богословская // Теория языка и межкультурная коммуникация. -№ 1 (7), Курск, 2010.
- Болдырев, H.H. Когнитивная семантика Текст.: монография / H.H. Болдырев. Тамбов: Изд-во Тамб. ун-та, 2001. — 123 С.
- Большакова, E.H. Структурирование и извлечение знаний, представленных в научных текстах Текст. / Е. И. Большакова, Н. В. Баева, Н. Э Васильева // Труды 9 -ой Национальной конф. по искусственному интеллекту. М.: Физматлит, 2004. -С. 45 -51.
- Большакова, Е.И. Лексико-синтаксические шаблоны в задачах автоматической обработки текстов Текст. / Е. И. Большакова, Н. В. Баева, Н. Э. Васильева //Труды межд. конф. Диалог 2007. М.: Издательский центр РГГУ, 2007. — С. 70−75.
- Бондаренко, Г. В. Распределение повторов в связном тексте как основа для обнаружения суперсинтаксических единиц Текст. / Г. В. Бондаренко // НТИ, 1975. сер.2, № 12, С. 20—31.
- Бондаренко, Г. В. Использование структурных закономерностей текста при автоматической обработке информации Текст. / Г. В. Бондаренко, О. И. Яровенко //НТИ, 1984. сер.2, № 3, С. 23—29.
- Браславский, П. И. eXtragon: экспериментальная система для автоматического реферирования веб-документов Текст. / П.И. Браславский, И.С. Колычев //Труды РОМИП 2005. СПб, 2005. — С. 40−53.
- Браславский, П.И. Автоматическое реферирование веб-документов с учетом запроса Текст. / П. И. Браславский, И. С. Колычев // Интернет-математика 2005. М.: Яндекс, 2005. — С. 485−501.
- Буч, Г. Объектно-ориентированный анализ и проектирование Текст.: монография / Г. Буч.- Изд-во Вильяме, 2008. 560 с. ч
- Валгина, Н. С. Теория текста Текст. / Н. С. Валгина // Учебное пособие. — М.: Изд-во МГУП «Мир книги», 1998. — 210 с.
- Гаврилова, Т. А Базы знаний интеллектуальных систем Текст.: монография / Т! А. Гаврилова, В. Г. Хорошевский. СПб.: Питер, 2000. — 384 с.
- Гальперин, И.Р. Текст как объект лингвистического исследования. Текст. / И. Р. Гальперин // М.: Наука, 1981. 140 с.
- Гиляревский, P.C. Методы автоматизированного фрагментирования текста, отражающиеся на характеристике внутреннего состава фрагментов Текст. / P.C. Гиляревский, С. И. Гиндин // Семиотика и информатика. М.: ВИНИТИ, 1977. Т.9. -С.35−84.
- Гладкий, A.B. Формальные грамматики и языки Текст.: монография /
- A. В. Гладкий. М.: Наука, — 1973. — 368 с.
- Голуб, И. Б. Стилистика русского языка Текст. / И. Б. Голуб // М.: Рольф, 2001
- Горский, В.Г., Метод согласования кластеризованных ранжировок Текст. / В. Г. Горский, А. И. Орлов, A.A. Гриценко // Автоматика и телемеханика. -2000. № 3. С. 59−167.
- Горькова, В.И. Реферат в системе научной коммуникации. Направления совершенствования лингвистических и структурных характеристик Текст. /
- B. И. Горькова, Э. А. Ворохов // М.: ВИНИТИ, 1987. — 323 с. (Итоги науки и техники. Сер. Информатика/ ВИНИТИ, Т. 11). — С. 43.
- Губин, М.В. Эффективный алгоритм формирования контекстно-зависимых аннотаций Текст.' / М. В. Губин, А. И. Меркулов //Труды межд. конф. Диалог 2005. М.: Наука, 2005. — С. 116−120.
- Гусев, В.Д. Выявление аномалий в распределении лексических единиц по тексту Текст. / В. Д. Гусев, JI.A. Мирошниченко, Н. В. Саломатина // Вестник СПбГУ, сер. 9. Вып. 3. Санкт-Петербург, 2005. — С. 64−69.
- Гусев, В.Д. Тематический анализ и квазиреферирование текста с использованием сканирующих статистик / В. Д. Гусев, JI.A. Мирошниченко, Н. В. Саломатина // Труды междунар. конф. Диалог-2005, Звенигород, 1—7 июня 2005. М.: Наука, 2005.-С. 121−125.
- Дейк, Т.А. ван Стратегии понимания связного текста Текст. / Т.А. ван Дейк, В. Кинч // Новое в зарубежной лингвистике. М.: Прогресс, 1988. — Вып. 23. -С. 153−211.
- Дейк, Т.А. ван Язык. Познание. Коммуникация Текст.: монография / Т.А. ван Дейк, под ред. В. И. Герасимова. М.: Прогресс, 1989. — 310 с.
- Доронин, А. И. Бизнес-разведка Текст. / А. И. Доронин -М.: Издательство Ось-89, 2003.
- Дридзе, Т.М. Понятие и метод установления содержательной структуры текста применительно к учебному тексту Текст. / Т. М. Дридзе // Психолингвистическая и лингвистическая природа текста и особенности его восприятия. — Киев, 1979. -С. 27−39.
- Емашова, O.A. Функциональные стили русского языка и их влияние на задачу автоматического реферирования текстов / O.A. Емашова, М. Г. Мальковский //
- Труды межд. конф. Диалог 2007. (http://www.dialog21.ru/dialog2007/materials/html/25.htm).
- Ефимеико, И.В. Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий Текст. И. В. Ефименко // Труды 10-ой конф. по искусственному интеллекту.- М.: Физматлит, 2006, Т 1. — С. 81−87.
- Жинкин, Н. И. Язык. Речь. Творчество Текст. / Н. И. Жинкин // М.:1998.
- Жолкова, А.И. К вопросу о реферировании научно-технической периодики в реферативном журнале ВИНИТИ Текст. / А. И. Жолкова // НТИ. Сер. 1. -1970. № 5. — С. 24.
- Заболеева-Зотова, A.B. Лингвистическое обеспечение автоматизированных систем Текст.: монография / A.B. Заболеева-Зотова, В. А. Камаев. М.: Высшая школа, 2008. — 245с.
- Зализняк А. А. Грамматический словарь русского языка. Словоизменение. М., 1977- 3-е изд. М., 1987.
- Зубов, A.B. Автоматическое построение табличного реферата группы текстов одной тематики / А. В. Зубов.// Материалы конференции «Диалог-2005». -(http://www.dialog-l.ru/Archive/2005/Zubov%20A/ZubovA.htm).
- Зубов, A.B. Информационные технологии в лингвистике Текст.: монография / А. В. Зубов. М.: Академия, 2004. — 208 с.
- Кулагина, О.С. Исследования по машинному переводу Текст.: монография / О. С. Кулагина. М.: Наука, 1979. — 320 с.
- Ландэ, Д.В. Сканер системы контент-мониторинга InfoStream Текст. / Д. В. Ландэ // Открытые информационные и компьютерные интегрированные технологии: Сб. науч. трудов. Харьков: НАКУ «ХАИ», 2005. — Вып. 28 — С. 53−58.
- Ландэ, Д. В. Феномены современных информационных потоков Текст. / Д. В. Ландэ, А. Б. Литвин // «Сети и бизнес». 2001. — № 1. — С. 14−21.
- Ларичев, О.И. Теория и методы принятия решений Текст.: монография / О. И. Ларичев М.: Логос, 2006. — 392 с.
- Лахути, Д.Г. Формализованное реферирование с использованием словесных клише (маркеров) Текст. / Д. Г. Лахути, Д. И. Блюменау, Н. И. Гендина // НТИ. Сер.2. 1981. № 2. — С.16−20.
- Лахути, Д. Г. Вопросы отладки и оценки дескрипторных поисковых систем Текст. / Д. Г. Лахути // Семантические проблемы информатики. М., 1971. — С. 6−37.
- Лахути, Д. Г. Средства и процедура концептуальной интерпретации входных сообщений на естественном языке систем Текст. /Д .Г. Лахути, В.Ш. Ру-башкин // Известия АН СССР: Техническая кибернетика. -1987. № 2. — С. 49−59.
- Лахути, Д. Г. Автоматизированные документально-фактографические информационные системы Текст. / Д .Г. Лахути // Итоги науки и техники. Сер. Информатика. 1988. — Т. 12. — С. 56−79.
- Лахути, Д. Г Экстрагирование как один из подходов к автоматизации реферирования Текст. / Д. Г. Лахути, Д. И. Блюменау, И.С. Добро-нравов // Теория и практика механизации библ. и информ.-библиогр. процессов. Л., 1982. — С 108 -128.
- Леонов, В. П. О методах автоматического реферирования (США 19 581 974 гг.) Текст. / В. П. Леонов // Научно-техническая информация, сер.2. 1975. -№ 6.- С.16−20.
- Леонтьева, H. H. Семантика связного текста и единицы информационного анализа Текст. / H. Н. Леонтьева // Научно-техническая информация, Сер.2 -М., 1981.- № 1. -С. 5−11.
- Литвак, Б. Г. Экспертная информация: методы получения и анализа Текст.: учеб. пособие для вузов / Б. Г. Литвак. М.: Радио и связь, 1982. — 350 с.
- Литвиненко, А. О. Описание структуры дискурса в рамках теории риторической структуры Текст. / А. О. Литвиненко //Труды Межд. семинара Диалог 2001 по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Т.1. — С. 159−168.
- Лукашевич, Н. В. Автоматическое построение аннотаций на основе тематического представления текста Текст. / Н. В. Лукашевич //Труды международного семинара Диалог'97. М.: 1997 С. 188−191.
- Лукашевич, Н. В., Добров, Б. В. Исследования тематической структуры текста на основе большого лингвистического ресурса Текст. / Н. В. Лукашевич, Б. В. Добров // Труды международного семинара «Диалог 2000». М.: 2000. Том 2,1. С.252−258. «
- Лукашевич, Н. В. Обработка потока новостей на основе больших лингвистических ресурсов Текст. / Н. В. Лукашевич, Б. В. Добров, C.B. Штернов // Интернет-математика 2005. Автоматическая обработка веб-данных. М.: — 2005. — С. 461 484.
- Лукашевич, Н. В Представление знаний в системе автоматической обработки текстов Текст. / Н. В. Лукашевич, А. Д. Салий // НТИ. Сер.2. 1997. — N3. — С. 15−23.
- Макаров, М.Л. Основы теории дискурса Текст.: монография / М. Л. Макаров. М.: Гнозис, 2003. — 280 с.
- Макконнелл, С. Совершенный код Текст.: монография / С. Макконнелл. Издательство: Питер Русская редакция, 2007. — 896 с.
- Мак Кьюин, К. Дискурсивные стратегии для синтеза текста на естественном языке Текст./ К. Мак Кьюин // Новое в зарубежной лингвистике: М.: -1989. — Вып. XXIV. — С. 311 — 356.
- Мальцев, А. Н. Алгоритмы и рекурсивные функции Текст.: монография / А. Н. Мальцев // М.: Наука, 1986. — 366 с.
- Марчук, Ю. Н. Проблемы машинного перевода Текст.:монография / Ю. Н. Марчук // М.: Наука, 1983. — 231 с.
- Марчук, Ю.Н. Компьютерная лингвистика Текст. :Учеб.пособие / Ю. Н. Марчук // ACT, Восток-Запад, 2007. 226 с.
- Материалы Лаборатории информационно-системного анализа ГПНТБ СО РАН Электронный ресурс. // Режим доступа: http://www.spsl.nsc.ru/win/ecol/index.html
- Мельчук, И. А Опыт теории лингвистических моделей «Смысл-Текст"Г Семантика, синтаксис Текст. / И. А. Мельчук // М.:Наука, 1999. — 314 с.
- Мелюхин, И. С. Состояние информационно-аналитической деятельности в России Текст. / И. С. Мелюхин / Журнал «Информационное общество» Вып. № 6, -М. ИРИО. -1994. С. 55−64.
- Мецлер, А. А. Структурные связи в тексте (парентезные конструкции) Текст. / А. А. Мецлер // Кишинев, «Штиинца», 1987. — 140с.
- Михайлов, А.И. Основы научной информации. Текст. / А. И. Михайлов, А. И. Черный, Р. С. Гиляревский // М.: Наука, 1965. — 655 с.
- Михаилян, А. Некоторые методы автоматического анализа естественного языка, используемые в промышленных продуктах- / А. Михаэлян. 2001. -(http://www.citforum.ru/programming/digest/avtestlang.shtml).
- Нелюбин, Л.Л. Компьютерная лингвистика и машинный перевод Текст.: Метод. пособие / Л. Л. Нелюбин. М.: ВЦП, 1991. — 151 с.
- Новиков, А.И. Семантика текста и её формализация Текст. / А. И. Новиков // М., Наука, 1983. — С. 211.
- Овсянников, А. А. Подход к фильтрации сообщений СМИ на основе модели процесса оценки качества Текст. / А. А. Овсянников, К. В. Елецкий // Информационные системы и технологии. 2010. Т. 584. № 1−57. С. 68−74.
- Орлов, А.И. Современная прикладная статистика Текст. / А. И. Орлов // Заводская лаборатория. 1998. Т. 64. — № 3. — С.52−60.
- Панкова, JI.A. Организация экспертизы и анализ экспертной информации Текст.: монография / JL А. Панкова, А. М. Петровский, М. В. Шнецдерман. М.: Наука, 1984. — 120 с.
- Пащенко, Н.А. Проблемы автоматизации индексирования и реферирования Текст. / Н. А. Пащенко, JI.B. Кнорина, Т. В. Молчанова // Итоги науки и техники. Сер. Информатика. —М.: ВИНИТИ, 1983. -Т.7. С. 7−164.
- Пиотровский, Р.Г. Текст, машина, человек Текст.: монография / Р. Г. Пиотровский. Л.: Наука, 1975. — 327с.
- Пиотровский, Р.Г. Инженерная лингвистика и теория языка Текст.: монография / Р. Г. Пиотровский. Л.: Наука, 1979. — 112 С.
- Попов, Э. В. Общение с ЭВМ на естественном языке Текст.: монография / Э. В. Попов. М.: Наука, 1982. — 360 с.
- Попов, М.Ю. Визуализация семантической структуры и реферирование текстов на естественном языке Электронный ресурс. / М. Ю. Попов, А. В. Заболеева-Зотова, С. А. Фоменков. (http://www.dialog-21 .ru/Archive/2003/Popov.htm).
- Поспелов, Д.А. Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов Текст. / Д. А. Поспелов // Новости искусственного интеллекта Вып. 4, 1994 — С. 70 — 90.
- Поспелов, Д.А. Логико-лингвистические модели в системах управления Текст. монография./ Д. А. Поспелов. М., 1981.- 232 с.
- Преображенский, А.Б. Состояние развития систем естественноязыкового общения Текст. / А. Б. Преображенский // Сб. Искусственный интеллект. М.:Радио и связь, 1990. — Т.1. — С.32−64.
- Ровинская, М. Точка как Проблема. Материалы Международной Конференции Диалог. 2000.
- Рождественская, Н.В. Дискурс как высшая единица коммуникативного акта./ Н. В. Рождественская (www.zsu.zp.ua/herald/articles/1955.pdf).
- Рыков, А.С. Методы системного анализа: Многокритериальная * и нечеткая оптимизация, моделирование и экспертные оценки Текст.: Учеб. пособие / А. С. Рыков. М.: Экономика, 1999. — 216 с.
- Сборник руководящих материалов по научно-технической информации в области строительства и архитектуры. М.: ЦИНИС, 1972. — С. 18.
- Свидетельство об официальной, регистрации программы для ЭВМ № 2 010 612 817. Многопользовательский программный* комплекс для ручного и автоматического сводного реферирования и оценки качества сводного реферирования. (MDS Evaluation) / С. Д. Тарасов. 2010.
- Свидетельство об официальной регистрации программы для ЭВМ № 2 010 612 816. Расширение языка РНР для работы с матрицами и векторами. (РНР
- Math Extension) / С. Д. Тарасов. 2010.» «
- Севбо, И.П. Структура связного текста и автоматизация реферирования Текст.монография / И. П. Севбо М.: Наука, 1969. — 135 с.
- Севбо, И.П. Сквозной анализ как шаг к структурированию текстовых знаний Текст. / И. П. Севбо. // НТИ. Сер. 2. 1989. — № 2. — С. 26−32.
- Сегалович, И. В. Как работают поисковые системы Текст. / И. В. Сегалович // Мир Internet. 2002. № 10. С. 24−32.
- Селезнев, К. Е Обработка текстов на естественном языке / К. Е. Селезнев // Открытые системы. 2003. — № 12.-(http://www.osp.ru/os/2003/12/183 694).
- Система стандартов по информации, библиотечному и издательскому делу. Реферат и аннотация. Общие требования Текст.: ГОСТ 7.9−95.
- Скороходько, Э.Ф. Семантические связи в лексике и текстах Текст. / Э. Ф. Скороходько // Вопросы информационной теории и практики. М.: — 1977. — № 23. — С. 42 — 45.
- Скороходько, Э.Ф. Семантические сети и автоматическая-обработка текста Текст.: монография / Э. Ф. Скороходько. Киев: Наукова думка, 1983. — 219 с.
- Сляднева, Н. А. Информационно-аналитическая деятельность: проблемы и перспективы Текст. / Н. А. Сляднева // Информ.-аналит. журн. 2001. № 2. С. 14−25.
- Сляднева, Н. А. Информационная аналитика эзотерическое искусство или современная профессия? Электронный ресурс. / Н. А. Сляднева // http://www.fact.ru/www/arhiv7s6.htm. (дата обращения: 01.07.2010).
- Совпель, И. В. Инженерно-лингвистические принципы, методы и алгоритмы автоматической переработки текста Текст.: монография / И. В. Совпель. -Минск: Вышэйш. шк., 1991. — 236 с.
- Солтон Д. Динамические библиотечно-информационные системы Текст.: монография / Д. Солтон М.: Мир, 1979. — 557 с.
- Ступин, B.C. Система автоматического реферирования методом симметричного реферирования Текст. / B.C. Ступин // Компьютерная лингвистика и интеллектуальные технологии. Труды межд. конференции «Диалог 2004» М.: Наука, 2004. — С. 579−591.
- Тарасов, С.Д. Современные методы автоматического реферирования Текст. / С. Д. Тарасов // Научно-технические ведомости СПБГПУ. — СПб: СПБГПУ, 2010. № 6 (113). — С. 59−74.
- Тарасов, С.Д. Метод тематического связанного ранжирования для задач автоматического сводного реферирования сообщений Текст. / С. Д. Тарасов // Научно-технические ведомости СПБГПУ. СПб: СПБГПУ, 2010. — № 2 (97). — С. 140 144.
- Тарасов, С.Д. Метод тематического ранжирования в задачах автоматического сводного реферирования Текст. / С. Д. Тарасов // Искусственный интеллект и принятие решений. М.: ИСА РАН, 2010. — № 2. — С. 36−41.
- Тарасов, С.Д. Автоматическое составление обзорных рефератов Текст. / С. Д. Тарасов // Информационные и автоматизированные системы: Юбилейный сборник трудов кафедры «Информационные системы и компьютерные технологии». -СПб.: БГТУ, 2008. С. 95−98.
- Manifold Ranking на основе метрики автоматической оценки качества обзорного реферирования ROUGE-RUS Текст. / С. Д. Тарасов // Труды XI Всероссийской научной конференции Электронные библиотеки. Перспективные методы и технологии, iка. М. Школа-Пресс, 1996
- Тревгода, С.А. Технология автоматического реферирования технического текста Текст. / О. Ю. Сабинин, С. А. Тревгода // Известия СПбГЭТУ «ЛЭТИ». -2008.- № 7. -С. 25−34.
- Тункель, В. Д. К вопросу об устной передаче речевого сообщения? Текст. / В. Д. Тункель // Автореферат диссертации на соискание ученой степеникандидата филологических наук. — М., 1964. —20с.
- Тураева, З.Я. Лингвистика текста. Текст. / З. Я. Тураева // М.: ПРОСВЕЩЕНИЕ, 1986. 128 с.
- Хан, У. Системы автоматического реферирования // У. Хан, И. Мани // ' Открытые системы. (http://www.osp.ru/os/2000/12/067.htm).
- Хэллидей, М.А. К. Когезия в английском языке. Текст. / М.А.К. Хэл-лидей, Р. Хасан // Исследования по теории текста: реферативный сборник. М., 1979. -С. 108−115.
- Щавелев, Л. В. Способы аналитической обработки данных для поддерж-< ки принятия решений Электронный ресурс. / Л. В. Щавелев // Системы управлениябазами данных. 1998 № 04−05. (http://www2.osp.ru/dbms/1998/04−05/03.htm)
- Щеглов, С. Н. Современные Технологии Построения Систем Поддержки Принятия Решений Текст. / С. Н. Щеглов // Известия Южного федерального «университета. Технические науки. 2008 № 4. С. 106−111.
- Шемакин, Ю. И. Тезаурус в автоматизированных системах управления и информации Текст. / Ю. И. Шемакин // М: Военное изд-во министерства обороны СССР, 1974.- 192 с.
- Юганов В. И. К вопросу об актуальном членении текста Текст. / В. И. Юганов // Предложение и текст в семантическом аспекте. Межвуз. темат. сб. под ред. С. А. Сусов. Калинин, изд-во КГУ, 1978. — С. 154−160.
- Яцко, В.А. Симметричное реферирование: теоретические основы и методика Текст. / В. А. Яцко // НТИ. Сер. 2. 2002. — № 5. — С. 18−28.
- Allan, J. Introduction to topic detection and tracking. Текст. / J. Allan,// Event-based Information Organization, Kluwer Academic Publishers, Boston, 2002. -С. 116.
- Barzilay M., Elhadad R. Using lexical chains for text summarization Текст. / M. Barzilay, R. Elhadad // In Proceedings of the ACL/EACL-97 Workshop on Intelligent Scalable Text Summarization. Madrid, Spain, 1997. — C. 10−17.
- Barzilay, R., Elhadad, N., McKeown, K. R. Inferring strategies for sentence ordering in multidocument news summarization. Текст. / R. Barzilay, T. Elhadad, K. R. McKeown // Journal of Artificial Intelligence Research, 17, 2002. C. 35−55.
- Boguraev, В., Kennedy, С. Salience-based Content Characterization of Text Documents. Текст. / В. Boguraev, С. Kennedy // In Mani, I., and Maybury, M., eds., Proceedings of the ACL/EACL, 1997. C. 2−9.
- Borko, H. Abstracting concepts and methods Текст. / H. Borko, C. L. Bernier // New-York: Academic Press, 1970. — 250 c.
- Brandow, R., Mitze, K., Rau, L.F. Automatic Condensation of Electronic Publications by Sentence Selection. Текст. / R. Brandow, K. Mitze, and L. F. Rau. // Information Processing & Management, 31(5), 1995. C. 675−685.
- Braun, R. K., Kaneshiro, R. Exploiting Topic Pragmatics For New Event Detection In TDT-2004. Текст. / R. K. Braun, R. Kaneshiro // DARPA Topic Detection and Tracking Workshop, Gaithersburg, 2004. C. 189−192.
- Brin, S., Page, L. The anatomy of a large scale hypertextual web search engine Текст. / S. Brin, L. Page // In Proc. 7th International World Wide Web Conf., 1998.
- Brunn, M., Chali, Y., Pinchak, C. J. Text summarization using lexical chains. Текст. / M. Brunn, Y. Chali, C. J. Pinchak. // In Proceedings of DUC2001 Conference, New Orleans, Louisiana, USA, 2001. C. 135−140.
- Carbonell, J. G., Goldstein, J. The use of MMR, diversity based reranking for reordering documents and producing summaries. Текст. / J. G. Carbonell, J. Goldstein // In Research and Development in Information Retrieval, 1998. — C. 335−336.
- Connel, M., Feng, A., Kumaran, G., Raghavan, H., Shah, C., Allan, J. Umass at TDT2004. Текст. / M. Connel, A. Feng, G. Kumaran, H. Raghavan, C. Shah, J. Allan. //
- Proc. DARPA Topic Detection and Tracking Workshop Report, Gaithersburg, December 2004.
- Conroy J.M., O’leary D.P., Text summarization via hidden Markov models, Proceedings of the 24th annual international ACM SIGIR conference on Research and development in. information retrieval, p.406−407, 2001.
- Corston-Oliver, S. Computing Representations of the Structure of Written Discourse Текст. / S. Corston-Oliver // Ph.D. dissertation. University of California, Santa Barbara, U.S.A.
- Danes, F. Cognition and emotion in discourse interaction Текст. / F. Danes // XIV International Congress of Linguistics: Preprints of the Plenary Session Papers. Berlin, 1987. — C. 272−291.
- Dijk, T.A. van. Semantic Macro-Structures and Knowledge Frames in Discourse Comprehension. Текст. / T.A. van Dijk // Cognitive Processes in Comprehension, M.A. Just and P.A. Carpenter, eds., Lawrence Erlbaum, Hillsdale, N.J., 1977, C. 3−32.
- Dobzynska, T. Tekst. Proba syntezy Текст. / Т. Dobzynska //- Warszawa, 1983, C. 24−56.
- Edmundson, H.P. New Methods in Automatic Extracting. Текст. / H.P. Edmundson. // Journal of the Association for Computing Machinery, 16(2), April 1969. C. 264−285.
- Evans, D.K., Klavans, J.L., McKeown, K.R. Columbia Newsblaster: Multilingual News Summarization on the Web. Текст. / D.K. Evans, J.L. Klavans, K.R. McKeown // In Proceedings of NAACL/HLT, 2004. C. 1−4.
- Glaser, B. G., Strauss, A. L. The discovery of grounded theory- strategies for qualitative research. Текст. / В. G. Glaser, A. L. Strauss // Aldine de Gruyter, New York, 1967.-271 c.
- Grimes J.E. The Thread of Discourse. Текст. / J.E. Grimes // The Hauge, Paris: Moution. 1975. — 346 c.
- Grosz B.J., Sidner C.L. Attention, intentions, and structure of discourse Текст. / B.J. Grosz, C.L. Sidner // Computational Linguistics. 1986 — № 12 — C. 203 226.
- Haliday A.K., Hasan R. Cohesion in English. Текст. / A.K. Haliday, R. Hasan // England, Londin: Longman. 1976. — 221 c.
- Hearst, M. TextTiling: Segmenting Text into Multi-Paragraph Subtopic Passages. Текст. / M. Hearst // Computational Linguistics, 23 (1), 1997. C. 33−64.
- Hirao Т., Isozaki H., Maeda E., Matsumoto Y. Extracting Important Sentences with Support Vector Machines. // In Proc. of the 19th International Conference on Computational Linguistics, vol. 1. 2002. — C. 1−7.
- Hobbs J.R. Summaries from structure Текст. / J.R. Hobbs // In Working Notes of the Dagstuhl Seminar on Summarizing Text for Intelligent Communication Dagstuhl, Germany. — 1993. — C. 13−17.
- Hobbs J.R. On the relation between informational and intentional perspectives on discourse Текст. / J.R. Hobbs // Computational and Conversational Discourse. Burning rssues An Interdisciplinary Account — Heidelberg, — Germany. — 1996. — C. 139−157.
- Hovy E.H. Planning coherent multisententional text Текст. / E.H. Hovy // In Proceedings of the 26th Annual Meeting of the Association for Computational Linguistics -Buffalo, New-York. 1988. — C. 163−169.
- Hovy, E., Lin, C-Y. Automated Text Summarization in SUMMARIST. Текст. / E. Hovy, C-Y. Lin. // In I. Mani and M.T. Maybury, editors, Advances in Automatic Text Summarization. The MIT Press, 1999. C. 81−94.
- Hutchins, J. Summarization: Some Problems and Methods. / J. Hutchins // Proc. Informatics 9: Meaning The Frontier of Informatics, K.P. Jones, ed., Aslib, London, 1987, -C. 151−173.
- Hutchins, J. The first public demonstration of machine translation: the Georgetown-IBM system, 7th January 1954. Электронный ресурс. / J. Hutchins // Paper presented at the AMTA Conference. Режим доступа: http://www.hutchinsweb.me.uk/GU-IBM-2005.pdf
- Iatsko V. Linguistic Aspects of Summarization. Текст. / V. Iatsko // In Philologie im Netz. Вып. 18. — 2001. — С. 33−46. (http://www.fu-berlin.de/phin/phinl8/pl8t3.htm).
- Jang, D., Myaeng, S.H. Development of a document summarization system for effective information services. Текст. / D. Jang, S.H. Myaeng // In RIAO-97 Computer-Assisted Information Searching on Internet, 25th-27th June 1997. C. 101−111.
- Lin, C.-Y. ROUGE: A Package for Automatic Evaluation of Summaries. Information Sciences Institute Текст. / C.-Y. Lin // University of Southern California. 2004.
- Kleinberg, J. Authoritative sources in a hyperlinked environment Текст. / J. Kleinberg // Journal of the ACM 46 (5). C. 604−632.
- Kolla, M., Tech, B. Automatic text summarization using lexical chains: algorithms and experiments. Текст. / M. Kolla, B. Tech // Jawaharlal Nehru Technological University, 2002. 80 c.
- Kupiec, Т., Pedersen J., Chen F. A trainable document summarizer. Текст. / Т. Kupiec, J. Pedersen, F. Chen // In Proceedings of the 18th ACM/SIGIR Annual Conference on Research and Development in Information Retrieval, Seattle, WA, 1995. C. 6873.
- Lehnert, W. G. Plot Units and Narrative Summarization. Текст. / W. G. Lehnert // Cognitive Science, (4), 1981. C. 293−331.
- Luhn, H.P. The automatic creation of literature abstracts. Текст. H.P. Luhn// IBM Journal of Research and Development Вып. 2. — 1958. — С. 159−165.
- Mani, I., Bloedorn, E. Summarizing similarities and differences among related documents. Текст. / I. Mani, E. Bloedorn // Information Retrieval, 1(1), 1999. C. 3567.
- Mani, I. Automatic summarization (Natural Language Processing) Текст. / I. Mani //John Benjamins Publishing Company, 2001. 285 c.
- Mani, I., Maybury M. T. Advances in automatic text summarization Текст. /1. Mani, M. T. Maybury // The MIT Press, 1999. 434 c.
- Mann W.C., Thompson S.A. Rhetorical structure theory: Toward a functional theory of text organization Текст. / W.C. Mann, S.A. Thompson // Text № 8(3). — 1988. -C. 243−281.
- Marcu D. Discourse trees are good indicators of importance in text Текст. / D. Marcu // Advances in automatic text summarization Cambridge, The MIT Press. -1999. — C. 123 — 136.
- Maybury, M.T. Generating summaries from event data. Текст. / M.T. Maybury // Information Processing & Management, 31(5), 1995. C. 735−751.
- McKeown, K. R., Robin, J., Kukich, K. Generating concise natural language summaries. Текст. / К. R. McKeown, J. Robin, K. Kukich // Information Processing & Management, 31(5), 1995. C. 702−733.
- McKeown, K. R., Barzilay, R. Tracking and summarizing news on a daily basis with Columbia’s NewsBlaster Текст. / К. R. McKeown, R. Barzilay, D. Evans, V. Hatzivassiloglou, J. L. Klavans, A. Nenkova, C. Sable, B. Schiffman, S. Sigelman // In
- Proceedings of Human Language Technology Conference (HLT 2002), (San Diego, CA, Mar. 2002).194: Maizell, R.E. Abstracting scientific and technical literature Текст. / R. E. Maizell // New-York: Willey, 1971. — 297 c.
- Miller, K. Five papers on WordNet CSL Report 43 Текст. / G, R. Beckwith, С. Fellbaum, D. Gross, К. Miller // Cognitive Science Laboratory, Princeton’University, Princeton, NJ.
- Morris, J., Hirst, G. Lexical cohesion computed by thesaural relations as an indicator of the structure of a text. Текст. / J. Morris, G. Hirst // Computational Linguistics, 17(1), 1991.-C. 21−48.
- Nomoto, T., MatsumotoY. The diversity-based approach to open-domain text summarization. Текст. / T. Nomoto, Y. Matsumoto // In Information Processing & Management, 39, 2003. C. 363−389.
- Ohbuchi, R., Shimizu, T. Ranking on semantic manifold for shape-based 3d model retrieval Текст. / R. Ohbuchi, T. Shimizu // In MIR' 08. 2008. — C. 411−418.
- О’Neil, E.J., OT4eil, P.E., Weikum, G., An Optimality Proof of the LRU-K Page Replacement Algorithm, Journal of the ACM 46(1), 1999
- PHP Morphy Электронный ресурс. // Режим доступа: http ://phpmorphy. sourcefo r ge. ne t/do ku wiki/
- Polanyi L. The linguistic structure of discourse. Текст. L. Polanyi // Technical report CSLI-96−200, Center for study of language and information. Stanford, CA. -1996. — 45 c.
- Pollock, J.J., Zamora, A. Automatic abstracting research at Chemical Abstracts Service. Текст. / J.J. Pollock, A. Zamora // Journal of Chemical Information and Computer Sciences, (15), 1975. C. 226−233.
- Radev, D. R., Jing, H., Budzikowska, M. Centroid-based summarization of multiple documents: sentence extraction, utility-based evaluation, and user studies. Текст.
- D. R. Radev, H. Jing, M. Budzikowska // In ANLP/NAACL Workshop on Summarization, Seattle, WA, April 2000. C. 21−29.
- Rijsbergen C. J. Information retrieval. Текст. / С. J. Rijsbergen. Butterworths, London. — 1979. — 325c.
- Roweis, S. Т., Saul, L. K. Nonlinear dimensionality reduction by locally linear embedding Текст. / S. T. Roweis, L. K. Saul // Science, 290:2323.2326, 2000
- Salton, G., Singhal, A., Mitra, M., Buckley, C. Automatic Text Structuring and Summarization. Текст. / G. Salton, A. Singhal, M. Mitra, C. Buckley // Information Processing &Management, 33(2), 1997. C. 193−207.
- Salton, G., The SMART Retrieval System Experiment in Automatic Document Processing Текст. / G. Salton // Prentice-Hall, Englewood Cliffs, New Jersey (1971).
- Segal, E. M. The role of interclausal connectives in narrative structuring. Текст. E. M. Segal // Discourse processes. 1991. — C. 27−54.
- Silber, G., McCoy, K. Efficiently computed lexical chains as an intermediate representation for automatic text summarization //. Computational Linguistics. 2002. 28 (4). P.487−496.
- Smith, К. E. Hypertext linking to the future Текст. / К. E. Smith // Online. — 1988. — Vol. 12, N 2. — C. 32 -40.
- Spark-Jones. K. A Statistical Interpretation of Term Specificity and Its Application Текст. / К. Spark-Jones // In Retrieval Journal of Documentation, 1972.
- Strzalkowski, Т., Stein, G. C., Wang, J., Wise, G.B. A robust practical text summarizer. Текст. / Т. Strzalkowski, G. C. Stein, J. Wang, G. B. Wise // In: Advances in Automatic Text Summarization, COLING-ACL, 1999. C. 137−154.
- Tenenbaum, J. В., de Silva, V., Langford, J. C. Global geometric framework for nonlinear dimensionality reduction / J. B. Tenenbaum, V. de Silva, J. C. Langford // Science, 290:2319.2323, 2000.
- Teufel, S., Moens, M. Argumentative classification of extracted sentences as a first step towards flexible abstracting. Текст. / S. Teufel, M. Moens // Mani, M. May-bury (eds), Advances in automatic text summarization, MIT, 1999. C. 155−171.
- Teufel, S., Moens, M. Sentence Extraction and rhetorical classification for flexible abstracts. Текст. / S. Teufel, M. Moens // AAA! Spring Symposium on Intelligent Text summarization, 1998. C. 89−97.
- The Matrix Template Library Электронный ресурс. // Режим доступа: http://www.osl.iu.edu/research/mtl/
- Toffler, A. Third Wave. Текст. / A. Toffler // Bantam Boob. N.Y. -1991. -544 c.
- Wan, X., Yang, J., Xiao, J. Manifold-Ranking Based Topic-Focused Multi-Document Summarization Электронный ресурс. / X. Wan, J. Yang, J. Xiao // DUC 2003. C. 2903−2908. http://www.ijcai.org/papers07/Papers/IJCAI07−467.pdf
- Weil, B.H. Standards for writing abstracts Текст. / B.H.Weil // J. Amer. Soc. Inf. Sci. 1970. — Vol. 21, N 5. — P. 2784.
- Yang, Ch. C., Wang, F. L. Fractal Summarization for Mobile Devices to Access Large Documents on the Web. Текст. / Ch. C. Yang, F. L. Wang, // In Proceedings of the WWW2003, Budapest, Hungary, 2003. C.134−139.
- Zipf, G. K. Human behavior and the principle of least effort Текст. / G. K. Zipf//Wesley, Cambridge, MA, 1949.
- Zhou, D. Ranking on data manifolds Текст. / D. Zhou, J. Weston, A. Gretton, O. Bousquet, B. Schlkopf// In Proceedings ofNIPS'2003.
- Zhu, X., Guo, J., Cheng, X. Recommending Diverse and Relevant Queries with A Manifold Ranking Based Approach Текст. / X. Zhu, J. Guo, X. Cheng // Workshop on Query Representation and Understanding in the 33rd International ACM SIGIR Conference, 2010.