Помощь в учёбе, очень быстро...
Работаем вместе до победы

Отклонение оценки слова от средней оценки отзывов

РефератПомощь в написанииУзнать стоимостьмоей работы

Для решения основной задачи классификации отзывов в данной работе использовалась только средняя оценка каждого слова без учета ее отклонения от средней оценки по корпусу. Ki — число словоупотреблений леммы в i-ом отзыве (если не употребляется, тогда 0). Где — рассматриваемая лемма,. N — общее количество отзывов,. Бездарный -3.542 заворожить 1.802. Ахинея -4.943 фильм-шедевр 2.065. Блеклый -1.817… Читать ещё >

Отклонение оценки слова от средней оценки отзывов (реферат, курсовая, диплом, контрольная)

Для вычисления данной характеристики использовалась пользовательская оценка (от 1 до 10), сохраненная для каждого отзыва. С помощью этих оценок, для каждого слова вычислялась его средняя оценка (т.е. брались оценки тех отзывов, где оно встретилось, и их сумма разделялась на количество таких отзывов). Разность средней оценки для каждого слова и средней оценки отзывов по всему корпусу и является отклонением. Таким образом, мы получаем суммарную оценочную ориентацию для каждого слова.

Отклонение оценки слова от средней оценки отзывов.

.

где — рассматриваемая лемма,.

n — общее количество отзывов,.

mi — оценка i-го отзыва,.

ki — число словоупотреблений леммы в i-ом отзыве (если не употребляется, тогда 0).

Приведем несколько примеров слов с их отклонениями от средней оценки. Если отклонение положительное, то и слово положительное, если отрицательное, то и слово соответственно отрицательное.

ахинея -4.943 фильм-шедевр 2.065.

бездарный -3.542 заворожить 1.802.

блеклый -1.817 любимейший 1.661.

тупой -1.783 офигенный 1.602.

зловещий -1.010 овация 1.498.

Для решения основной задачи классификации отзывов в данной работе использовалась только средняя оценка каждого слова без учета ее отклонения от средней оценки по корпусу.

Признак встречаемости существительных после оценочных прилагательных

Для подсчета этой характеристики были взяты первые двести прилагательных из выдачи классификатора после предварительной классификации. Количество оценочных прилагательных среди этих двухсот слов составило 90%. Далее для каждого прилагательного были найдены существительные, которые следуют непосредственно за ним и не разделены знаками препинания.

Для каждого такого существительного подсчитана его частота появления после вышеуказанных двухсот прилагательных. На основе полученных значений и была сформирована новая характеристика. Ее смысл заключается в том, что существительные, которые часто следуют за оценочными прилагательными, наиболее вероятно не являются оценочными, а скорее всего, среди них достаточно большое количество атрибутов объекта, на который составлен отзыв [Popescu et al., 2005].

Показать весь текст
Заполнить форму текущей работой