Помощь в учёбе, очень быстро...
Работаем вместе до победы

Заключение. 
Анализ метода выявления синонимических рядов, соответствующих одинаковым понятиям

РефератПомощь в написанииУзнать стоимостьмоей работы

Исследование выполняется при финансовой поддержке РГНФ (проект № 13−04−12 020 «Новый открытый электронный тезаурус русского языка») и научной группы «Разработка методов анализа, обработки, визуализации и прогнозирования многомерных данных для современных информационных систем» Уральского федерального университета им. первого Президента России Б. Н. Ельцина. опрос носитель русский тезаурус. Важно… Читать ещё >

Заключение. Анализ метода выявления синонимических рядов, соответствующих одинаковым понятиям (реферат, курсовая, диплом, контрольная)

Проведённый опрос носителей русского языка позволил сделать вывод о качестве предлагаемого метода определения синсетов, отражающих одинаковые концепции. Оценка точности метода получена на основе точности критерия эквивалентности синсетов, который формулируется следующим образом: синсеты, содержащие хотя бы пару одинаковых слов, разделяют общий смысл. Точность этого критерия составляет 73%. На основании этой оценки и количества эквивалентных синсетов в тезаурусе YARN можно сказать, что до 25% его синсетов описывают понятия, представленные в ресурсе неуникальным образом.

Важно отметить, что проведённый анализ качества был осуществлён без привлечения специалистов из числа профессиональных лексикографов. За счёт получения трёх оценок на один синсет и их последующего мажорирования оказалось достаточно участия одних лишь носителей языка.

Проведённое исследование выявило необходимость в очистке синсетов тезауруса YARN от синсетов-дубликатов. В этой связи метод повышения качества синсетов, созданных с помощью краудсорсинга, является предметом дальнейших исследований.

Благодарности

Исследование выполняется при финансовой поддержке РГНФ (проект № 13−04−12 020 «Новый открытый электронный тезаурус русского языка») и научной группы «Разработка методов анализа, обработки, визуализации и прогнозирования многомерных данных для современных информационных систем» Уральского федерального университета им. первого Президента России Б. Н. Ельцина. опрос носитель русский тезаурус.

Показать весь текст
Заполнить форму текущей работой