Помощь в учёбе, очень быстро...
Работаем вместе до победы

Обоснование выбора методов поставленных задач и сравнение с методами других решений

РефератПомощь в написанииУзнать стоимостьмоей работы

Для задачи выявления фонетического сходства применяются также фонетические алгоритмы, такие как Soundex, Metaphone, NYSIIS и другие. Принцип этих алгоритмов заключается в том, что слова кодируются определенным образом в зависимости от самого алгоритма, и затем результаты кодирования сравниваются между собой. Фонетические алгоритмы эффективны в поисковых системах, программах для исправления… Читать ещё >

Обоснование выбора методов поставленных задач и сравнение с методами других решений (реферат, курсовая, диплом, контрольная)

Для задачи выявления фонетического сходства применяются также фонетические алгоритмы, такие как Soundex, Metaphone, NYSIIS и другие. Принцип этих алгоритмов заключается в том, что слова кодируются определенным образом в зависимости от самого алгоритма, и затем результаты кодирования сравниваются между собой. Фонетические алгоритмы эффективны в поисковых системах, программах для исправления опечаток и грамматических ошибок. Однако зачастую они ошибочно считают разные слова одинаковыми из-за того, что данные слова получили один и тот же код в результате преобразований. Поэтому в этой работе используется модель Gradient Boosting, так как она позволяет создавать гибкие решения с возможностью добавления собственных параметров, и данный алгоритм является одним из наиболее эффективных в машинном обучении. Выбор создания модели отбора слов с помощью алгоритма машинного обучения обусловлен тем, что модель позволяет его производить в зависимости от различных параметров, каждый из которых по-разному влияет на итоговый результат.

В качестве примера программа составляет предложение или фразу для запоминания слов. Задачи данного типа часто реализуются с помощью нейросетей или цепей Маркова. Нейросеть — это математическая модель, реализующая биологическую сеть нейронов живых организмов. Нейросети используются в различных задачах — компьютерное зрение, распознавание образов, методы кластеризации и в других, в том числе и для генерации текста. Нейросети не являются алгоритмом в обычном смысле, они могут обучаться. Несмотря на то, что искусственные нейронные сети перспективны для решения задач наподобие генерации, на данный момент результаты их работы далеки от идеала, так как зачастую при формировании предложения не учитываются сложные правила грамматики языка и правильного употребления слов, если только это не действительный алгоритм. Цепи Маркова с математической точки зрения — это цепочка с конечным количеством случайных событий, где вероятность каждого зависит лишь от состояния на настоящий момент. Следующее слово в предложении выбирается случайно из списка связанных с данной n-граммой слов. Соответственно сгенерированные предложения Марковской цепью маловероятно могут быть грамматически правильными и иметь реальный смысл. Несмотря на то, что задача генерации осмысленного текста является одной из самых сложных задач программирования, для того чтобы получившееся предложение было правильно построено, программа содержит определенные шаблоны, слова в словосочетаниях сравниваются посредством Word2Vec для того, чтобы сгенерированный текст имел больший смысл.

Показать весь текст
Заполнить форму текущей работой