Помощь в учёбе, очень быстро...
Работаем вместе до победы

Атрибуция «Романа с кокаином»: лингвостатистическое исследование

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Научная новизна работы состоит в том, что в ней впервые осуществляется атрибуция «Романа с кокаином» методами математического анализа художественных текстов. Гипотеза о возможном авторстве В. Набокова была выдвинута Н. А. Струве на основании филологического (литературоведческого и лингвистического) анализа текста «Романа с кокаином», выявившего наличие пересечений с произведениями В. Набокова… Читать ещё >

Содержание

  • Глава 1. Атрибуция как филологическая проблема
    • 1. 1. История вопроса атрибуции литературных произведений
    • 1. 2. Атрибуция и стилистика
  • Глава 2. Методы атрибуции художественных текстов
    • 2. 1. Филологические методы атрибуции
    • 2. 2. Лингвоматематические методы и аспекты атрибуционного анализа
    • 2. 3. Атрибуция художественных текстов методами теории распознавания образов. .. бб
  • Глава 3. Атрибуция романа М. Агеева «Роман с кокаином»
    • 3. 1. История вопроса
    • 3. 2. Формирование атрибуционной гипотезы
    • 3. 3. Формирование априорных классов и определение
    • V. у — ч координат эталонов агфиорных классов
      • 3. 4. Отбор информативных параметров и определение координат объектов
      • 3. 5. Процедура атрибуции и интерпретация результатов

Атрибуция «Романа с кокаином»: лингвостатистическое исследование (реферат, курсовая, диплом, контрольная)

Проблемы, связанные с определением авторства, существуют не только в литературе, но и в других областях науки и искусства: искусствоведении, криминалистике, психологии, т. е. проблема атрибуции не ограничивается рамками филологических проблем. Если говорить о литературном творчестве, то анонимные и псевдонимные произведения существуют в любой литературе. Достаточно вспомнить поиски автора «Слова о полку Игореве» и других древнерусских текстов «Повести временных лет», «Сказания о Борисе и Глебе», «Жития Сергия Радонежского» и др., споры о принадлежности некоторых анонимных произведений перу М. В. Ломоносова, А. Д. Кантемира, А. Н. Радищева,.

Н.М.Карамзина, А. С. Грибоедоваисследование текстов, приписываемых А. С. Пушкину, а также анализ и разоблачение многих ложных атрибуций, связанных с творчеством поэта. В XIX веке широкое распространения получило псевдонимное критико-литературное творчество, которое связывалось с деятельностью Н. А. Добролюбова, В. Г. Белинского, А. И. Герцена, Н. Г. Чернышевского,.

Н.А.Некрасова, Ф. М. Достоевского. Атрибуции произведений XX века связаны с именами А. П. Чехова, В. В. Маяковского, М. А. Булгакова. Пожалуй, никто из литературоведов, историков и писателей не оставил без внимания проблему авторства «Тихого Дона», вопрос об авторстве которого возник еще при жизни М.Шолохова.

Особую актуальность проблема атрибуции приобретает в связи с изданием полных собраний сочинений писателей.

— 5.

Для признания принадлежности произведения какому-то конкретному автору необходимо, чтобы аргументы характеризовали его с трех сторон: биографической, идеологической и стилистической (Берков, 1958). В. В. Виноградов выделил одиннадцать принципов атрибуции анонимных и псевдонимных произведений, разделив их на группу объективных и субъективных. В качестве объективных были выделены лингвостатистические. Проблема описания индивидуально-авторских стилей входит как важнейшая задача в теорию функциональной стилистики. Главной задачей в процессе атрибуционного анализа художественных произведений является выявление специфических признаков языка анонимного или псевдонимного автора и сопоставление их со специфическими признаками всех предполагаемых авторов. Однако изучение отдельных элементов стиля, вырванных из структуры языка, не дает истинного представления об индивидуальном авторском стиле. «Изучение стиля должно быть комплексным и системным.. .. Необходимо вскрыть функции всех языковых средств в структуре литературного произведения» (Виноградов, 1961), следовательно, необходим анализ языковых единиц всех уровней, кроме этого, надо учитывать возможность изменения стиля с течением времени и в зависимости от жанра произведения.

До 7 0-х годов в практике атрибуции господствовали историко-документальные и филологические методы исследования, во многом базирующиеся на субъективном восприятии и анализе литературного произведения исследователем. В последнее время атрибуция проводится с применением математического аппарата, что в совокупности с документальными данными и литературоведческим анализом дает веские.

— б доказательства, ¦ объективно подтверждающие или опровергающие атрибуционную гипотезу.

Роман с кокаином" - предмет исследования данной работы — впервые был опубликован в 1934 году, автором значился некто М.Агеев. Высказывались различные предположения относительно имени писателя, скрывшегося под псевдонимом, но современникам романа не удалось раскрыть тайну его автора. В 80-е годы «Роман с кокаином» снова попадает в центр внимания литераторов: в 1983 году Н. А. Струве на основании содержательного и лингвистического анализа романа высказал и развил версию, согласно которой автором «Романа с кокаином» является В.Набоков. Это предположение вызвало много споров и, возможно, подтолкнуло историков к поиску документальных источников, а литераторов — к более подробному исследованию стиля М.Агеева. Были найдены документы, согласно которым автором «Романа с кокаином» был назван М. Леви, Ив. Толстой провел интересный анализ употребления метафор в романе, связав выбор художественных средств выражения с мировосприятием М. Агеева, но атрибуционный анализ был ограничен возможностями филологических и историко-биографических методов. Вопрос об авторстве оставался открытым, так как по-прежнему существовало две гипотезы: согласно первой автором романа считался В. Набоков, согласно второй — М. Леви, т. е. возникла ситуация, когда лингвистическая задача не может быть решена методами, базирующимися исключительно на филологическом подходе, без использования методов математического моделирования и количественного описания индивидуально-авторских стилей.

Объектом исследования послужили текст романа М. Агеева «Роман с кокаином» и тексты романов В. Набокова «Подвиг» и «Защита Лужина».

Предметом исследования в данной работе является лексико-морфологическая и синтаксическая структура языка В. Набокова и М.Агеева.

Цель данного исследования — определение степени достоверности гипотезы, в соответствии с которой автором романа может считаться В.Набоков.

Задачи исследования состоят в следующем:

1) Выбрать для сопоставительного анализа произведения В. Набокова, которые отвечают требованиям жанровой, тематической и временной близости роману М. Агеева;

2) Провести сопоставительный лингвистический анализ «Романа с кокаином» с выбранными романами В. Набокова для аргументации атрибуционной гипотезыI.

3) Сформировать априорный словарь признаков;

4) Сформулировать принципы и критерии отбора языковых единиц в подмножества, определяемые набором параметров, составляющих признаковое пространство;

5) Описать исследуемые тексты на языке словаря априорных признаков;

6) Определить необходимый и достаточный набор параметров, обеспечивающих разбиение объектов на классы;

7) Описать объекты на языке информативных параметров;

8) Выбрать алгоритм классификации объектов;

9) Осуществить атрибуцию текстов.

— 8.

Основными методами исследования являются описательный метод, вероятностно-статистические методы оценки близости параметров, характеризующих анализируемые объекты, метод корреляционного анализа (определение силы связи параметров), методы факторного анализа (выявление информативных параметров) и методы теории распознавания образов для классификации объектов с использованием детерминированного и вероятностного алгоритмов' распознавания.

Актуальность исследования заключается в возможности использования результатов работы для развития теории и методологии функциональной стилистики — описание и анализ индивидуально-авторских стилей является необходимым этапом любой атрибуции. Проблема атрибуции остается по-прежнему актуальной, когда возникает вопрос о включении анонимного или псевдонимного произведение в собрание сочинений предполагаемого автора.

Научная новизна работы состоит в том, что в ней впервые осуществляется атрибуция «Романа с кокаином» методами математического анализа художественных текстов. Гипотеза о возможном авторстве В. Набокова была выдвинута Н. А. Струве на основании филологического (литературоведческого и лингвистического) анализа текста «Романа с кокаином», выявившего наличие пересечений с произведениями В. Набокова, которые касались композиции, сюжета, имен героев, использования отдельных выразительных средств. Однако высказанная гипотеза не была подтверждена никакими вероятностно-статистическими исследованиями ни текста М. Агеева, ни текстов В.Набокова.

Теоретическое значение исследования заключается в том, что его результаты способствуют развитию теории и.

— 9 практики атрибуции методами распознавания образов, а также могут быть использованы в теории разработки стилей речи.

Практическое значение исследования определяется возможностью использованию результатов работы в практике преподавания стилистики русского языка и культуры речи в вузе. Материалы диссертации могут быть использованы при чтении спецкурсов по прикладной лингвистике и по функциональной стилистике.

Апробация работы. Основные положения диссертации обсуждались на конференции «Проблемы прикладной лингвистики» (Пенза, 1997), научно-технической конференции НГТУ, посвященной 8 0-летию Нижегородской радиолаборатории (Нижний Новгород, 1998), и научной конференции «Актуальные проблемы современной филологии» НГУ (Нижний Новгород, 2000). Результаты исследования отражены в б публикациях по теме диссертации.

Перспективы дальнейшего исследования состоят в дальнейшей разработке проблемы описания индивидуальных авторских стилей, в частности, стиля В. Набокова и писателей-современников В.Набокова.

Структура работы. Диссертация состоит из введения, трех глав, заключения и приложения, содержащего.

— 195-Заключение.

Результаты проведенного исследования позволяют сделать следующие выводы:

1. Лингвистический сопоставительный анализ «Романа с кокаином» и романов В. Набокова «Подвиг» и «Защита Лужина» показал наличие сходства в употреблении некоторых языковых единиц, таких, как сложные прилагательные, прилагательные с уменьшительно-ласкательными суффиксами и суффиксамиейш-, -айш-, цветовой ряд желтый-рыжий-ржавый, некоторые метафоры, глаголы, характеризующие мимику человека, разговорная лексика. Был выделен ряд почти дословных совпадений и сходных описаний в тексте М. Агеева и текстах В.Набокова. С другой стороны, была отмечена разница в употреблении обоими авторами одних и тех же лексических единиц, выразительных средств, художественных приемов.

2. Лингвистический анализ и наличие документально-исторических фактов показали равновероятность существования двух версий: согласно первой «Роман с кокаином» написан В. Набоковым, согласно второй — не В. Набоковым, что подтвердило необходимость применения математических методов анализа в процессе дальнейшего исследования. Другими словами, филологический анализ является необходимым (для формирования атрибуционной гипотезы), но недостаточным этапом любой атрибуции.

3. Формирование параметрического пространства должно производиться с учетом результатов лингвистического анализа, учитывающего такие стилистические особенности, как встречаемость и сочетаемость языковых единиц и конструкций, окказиональные употребления.

— 1964. Исходя из анализа частоты языковых единиц и степени их информативности в пределах анализируемых текстов, не представляется разумным включать в словарь априорных признаков лингвистические единицы, частота функционирования которых не превышает 1−2 употреблений на 100 цельных предложений. 5. Определение критериев отбора лингвистических единиц в подмножества является обязательным этапом анализа при количественном описании стиля, т.к. необходимо соотносить каждую языковую единицу с единственным признаком, из словаря априорных параметров, что позволяет объединять языковые единицы в четкие подмножества.

6. Необходимо объединять в подмножества параметры морфологического и синтаксического уровня, характеризующие лексико-грамматические категории или обладающие высокой степенью синкретизма, исключительно по формальным признакам. При выборе единиц для описания лексического уровня языка необходимо учитывать многозначность лексических вариантов значений, реализующихся в контексте, и по возможности включать только те параметры, характеристики которых минимально зависят от контекста.

7. При сравнении распределений критерий Колмогорова, по сравнению с критерием Стъюдента, не показал разницы в степени информативности параметров, характеризующих лингвистические объекты, хотя позволил разделить объекты, принадлежащие к разным генеральным совокупностям в соответствии с атрибуционной гипотезой. Критерий Стъюдента позволил выделить 10 параметров, нерелевантных с точки зрения идентификации стиля В. Набокова, что позволило определить степень.

— 197корреляции параметров между собой и выделить набор информативных.

8. Проведенная атрибуция подтвердила высокую информативность и стиледифференцирующие возможности параметров синтаксического уровня: они составили набор информативных параметров.

9. При анализе характеристик распределений с целью выявления информативных параметров можно идти от противного: выделять параметры не дифференцирующие, а идентифицирующие авторский стиль.

10. В соответствии с правилом принятия решения о принадлежности объектов к определенному классу использования детерминированного алгоритма распознавания оказалось недостаточным для распределения объектов на классы.

11. Сравнение распределений объектов, заведомо принадлежащих к одному классу (в данном случае Набоков-1 и Набоков-2), а также проверка условия сгущения и существования кластера на этих объектах позволяют доказать правильность выбора набора информативных параметров и метода свертывания параметрического пространства.

12. Объекты были классифицированы при помощи вероятностного алгоритма распознавания: романы В. Набокова составили один класс, т.к. были выполнены условия сгущения и существования кластера, и вероятность того, что образы Набоков1 и Набоков2 принадлежат к одному классу, составила 8 9%.

13. Анализ результатов проведенной атрибуции позволяет сделать вывод, что с высокой степенью вероятности: 95,4% для образов Набоков1 и Агеев и 93,4% для образов Набоков2 и Агеев — В. Набоков не является автором.

— 198.

Романа с кокаином". В соответствии с имеющимися документально-историческими доказательствами и в связи с отсутствием других версий, кроме рассмотренных (относительно личности М. Агеева), можно считать автором «Романа с кокаином» М.Леви.

В целом полученные результаты подтвердили высокую эффективность сочетания качественных и количественных методов анализа художественных текстов и показали, что методы теории распознавания образов работают на объектах разного объема и позволяют классифицировать минимальное количество объектов, которые могут быть распределены по кластерам.

Показать весь текст

Список литературы

  1. С.А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985. — 487 с.
  2. С.А. и др. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика, 1989. — 607 с.
  3. М.В. Квантитативная лингвистика. М.: Наука, 1988. — 184 с.
  4. В.И., Сорокин Ю. А. Поэтический текст и проблема его автора // Ученые записки Тартуского ун-та. Труды по лингвистике. 1983. — Вып.658. -с.3−10.
  5. В.И., Сорокин Ю. А. Опыт построения методики для установления авторства текстов // Изв. АН СССР.Сер.лит. и языка. 1977. — Т.36. — № 4.с.345−347.
  6. К.Б. Стилистика и критерии проверки статистических гипотез // Статистическое изучение стилей языка и стилей речи. Горький, 1970.с.12−13.
  7. В.А. Современный русский язык. М.: ВШ, 1981. — 560 с.
  8. В.А. и др. Современный русский язык. -М.: Азбуковник, 1997. --928 с.
  9. С.М. Черновики Пушкина. М.: Просвещение, 1971. — 232 с.
  10. Э.М., Мучник И. Б. Структурные методы обработки эмпирических данных. М.: Наука, 1983. — 464 с.
  11. В.Н. Лингвистическая статистика и проблема эквивалентности статистических описаний // Структурная и прикладная лингвистика. -Л.: Изд-во ЛГУ, 1983. Вып.2. — с.72−82.
  12. В.В. Проблемы русской стилистики. М. ВШ, 1981. — 320 с.
  13. B.B. Язык и стиль русских писателей. -М.: Наукаt 1990. 386 с.
  14. A.B., Мельчук И. А. Элементы математическойлингвистики. М.: Наука, 1969. — 192 с.
  15. В.Е. Теория вероятностей и математическаястатистика. М.: ВШ, 1977. — 479 с.
  16. .Н. Язык и статистика. М.: Просвещение, 1971. 190 с.
  17. .Н. Опыт применения корреляционного анализа // Вопросы статистической стилистики. -Киев, 1974. с.5−16.
  18. .Н. Основы культуры речи. М.: ВШ, 1980.- 335 с.
  19. .Н. Основы теории синтаксиса современного русского языка. Нижний Новгород: Изд-во ННГУ, 1994. — 172 с.
  20. И.Н., Седов К. Ф. Основы психолингвистики.- М.: Лабиринт, 1997. 224 с.
  21. А.Л. и др. Современное состояние проблемы распознавания. М.: Радио и связь, 1985. — 160 с. Горелик А. Л., Скрипкин В. А. Методы распознавания.- М.: ВШ, 1989. 232 с.
  22. И.И., Рукавишников В. О. Группировка, корреляция, распознавание образов. М.: Статистика, 1977. — 144 с.
  23. Г. В. Анонимные произведения и их авторы.- Минск: Университетское, 1988. 116 с. Ермоленко Г. В. О прологе к комедии А. С. Грибоедова «Горе от ума» //Вопросы статистической стилистики.- Киев, 1974. с.251−262.
  24. Н.Г. Методы распознавания и их применение. М.: Советское радио, 1972. — 208 с. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. — М.: Мир, 1976. — 114 с.
  25. Л. Статистическое оценивание. М.: Статистика, 1976. — 598 с.
  26. .И. Кто он автор «Слова»? // Вопросы истории. — 1989. — № 1. — с.118−124.
  27. В.М. и др. Математическая статистика. -М.: ВШ, 1975. 398 с.
  28. М.Н. Стилистика русского языка. М.: Просвещение, 1993. — 223 с.
  29. A.A. Общие сведения об ассоциациях и ассоциативных нормах // Словарь ассоциативных норм русского языка. М.: Изд-во Московского ун-та, 1977. — с. 5−16.
  30. Г. Я. Сложность синтаксических структур и стилистическая диагностика // Прикладное языкознание. С-Петербург: Изд. СПбГУ, 1996. с.420−434.
  31. М.А. Атрибуция анонимных и псевдонимных произведений методами теории распознавания образов. Л.: Изд-во Ленинградского ун-та, 1990. — 168 с.
  32. М.А. Атрибуция анонимных и псевдонимных текстов методами прикладной лингвистики // Прикладное языкознание. С.-Петербург: Изд-во СПбГУ, 1996. — 466−479.
  33. Медведева-Томашевская И. Стремя «Тихого Дона» // Загадки и тайны «Тихого Дона». Самара, 1996. -с. 4 — 91.
  34. И.И. Члены предложения и части речи. -М.: Наука, 1978. 387 с.
  35. С.Т. Об одном из способов выявления общей лингвостатической структуры выборок // Структурная и математическая лингвистика. Киев Наукова думка, 1976. — Вып.4. — с.103−112.
  36. Ope О. Графы и их применение.- М.: Мир, 1965. -352 с.
  37. Р.Г. и др. Математическая лингвистика. М.: ВШ, 1977.
  38. Е.И. Проблема отдела DUBIA в изданиях произведений писателей-классиков. // Вопросы текстологии. М.: Изд-во Московского ун-та, 1960.- Вып.2. с.196−240.
  39. Н.Ю. Опыт статистического анализа стилевой дифференциации структуры простого предложения // Вопросы статистической стилистики. Киев: Наукова Думка, 1974. — с.125−138. .
  40. .А. Петр Бориславич: поиск автора «Слова о полку Игореве». М.: Мол. гвард, 1991. — 286 с. Сахарный Л. В. Введение в психолингвистику. — Л.: Изд-во ЛГУ, 1989. — 168 с.
  41. Г. С. Процессы принятия решений при распознавании образов. Киев: Техника, 1965. -151 с.
  42. И.П. Графическое представление синтаксических структур. Киев: Наукова Думка, 1981. — 192 с.
  43. И.П., Петунин Ю. И. Галюта Е.Д. Эксперимент по распознаванию автора, основанный на предварительном статистическом исследовании синтаксических структур // Структурная и математическая лингвистика. 1977. — Вып.5. -с.96−103.
  44. .Я. Некоторые теоретико-методологические предпосылки качественно-количественной концепции стиля // Вопросы сопоставительной и прикладной лингвистики: Уч. зап. Тартуского ун-та, 1982. -Вып.619. -с.107−117.
  45. .Я. К вопросу о типах выборок и видераспределения синтаксических единиц // Структурнаяи математическая лингвистика. Киев: Науковадумка, 1976. Вып.4. — с.93−99.
  46. Ю. Подписано: «Олл Райт читается:
  47. Булгаков?» // Памир. 1989. — № 12. — с.155−163.
  48. Современный русский язык: в 2 ч. (Под ред.
  49. Д.Э.Розенталя). М.: ВШ, 1976.
  50. Г. В. Основы языкознания. М.: Просвещение, 1966. — 271 с.
  51. А.Ю. Анализ данных методом многомерного шкалирования. М.: Наука, 1986. — 210 с.
  52. Ив. Тропою тропа, или Почему не Набоков автор «Романа с кокаином // Звезда. 1995. — № 5.- с.197−204.
  53. .В. Стилистика. JI.: Изд-во ЛГУ, 1983. — 288 с.
  54. Н.И. Сочинения А.Островского в журнале «Отечественные записки» за 1859 г. // Уч. зап. ЛГУ. Сер. филолог.наук. — 1960. — Вып.58. -с.197−202.
  55. Ю. Проблемы и методы квантитативного исследования лексики. Таллин: Валгус, 1987. -204 с.
  56. Ю. Опыт классификации текстов с помощью кластер анализа // Актуальные проблемы квантитативной лингвистики и автоматического анализа текстов: Уч. зап. Тартуского ун-та, 1981.- Вып.591. с.136−157.
  57. Н.В. Грамматический аспект ассоциаций // Словарь ассоциативных норм русского языка. М.: Изд-во Московского ун-та, 1977. — с.33−36. Хетсо Г. и др. Кто написал «Тихий Дон»? — М.: Книга, 1989. — 192 с.
  58. Г. Стиль и норма // Лингвистика текста и стилистика: Уч. зап. Тартуского ун-та, 1981. -Вып.585. с.48−61.
  59. JI.Д. Явления синкретизма в сфере членов предложения // Явления синкретизма в синтаксисе русского языка. Ростов-на-Дону: Изд-во Ростовского ун-та, 1992. — с.30−42. Челпанов Г. И. Учебник логики. — М.: Прогресс, 1994. — 248 с.
  60. Т.А., Скляревич А. Н. Корреляционная характеристика частей речи в связных текстах. -Рига: Зинатне, 1980. 135 с.- 212 -Словари
  61. Ю.Н. и др. Русский ассоциативный словарь: Кн.3,4- «М.: ИРЯ, 1996.
  62. Ю.Н. и др. Русский ассоциативный словарь: Кн.5, 6. М.: ИРЯ, 1998.
  63. A.A. и др. Словарь ассоциативных норм русского языка. М.: Изд-во Московского ун-та, 1977. — 192 с.
  64. С.И. Словарь русского языка. М.: Русский язык, 1981. -816 с.
  65. Русский язык. Энциклопедия. М.: Дрофа, 1997. -703 с.
  66. Словарь современного русского языка: в 17-ти т. Под ред. A.M. Бабкина, С. Г. Бархударова и др. -М.- Л.: Большой академический словарь, 1965.
  67. Словарь русского языка: в 4-х т. М.: Русский язык, 1999.
  68. Языкознание. Большой энциклопедический словарь. -М.: Большая Российская энциклопедия, 1998. 685 с.
  69. М. Роман с кокаином, Набоков.В. Король, дама, валет. Петрозаводск: Карелия, 1992. 320 с.
  70. A.A. Сочинения: В 2-х томах. М.: Цитадель, 1997.
  71. М.А. Чаша жизни. М.: Советская Россия, 1988. — 582 с.
  72. М.А. Сочинения: В 2-х т. Минск: Маст. л1т., 1991.
  73. И.А. Сочинения: В 4-х т. М.: Правда, 1988. Вертинский А. Н. Дорогой длинною. — М.: Правда, 1990. — 576 с.
  74. О.Э. Сочинения в 2-х томах. Тула: Филин, 1994.
  75. В.В. Сочинения: В 4-х т. М.: Правда, 1990.
  76. В.В. Романы. М.: Современник, 1990. -542 с.
  77. В.В. Случайность // За рубежом. 1988. -№ 18. — с.16−17.
  78. .Л. Сочинения: В 2-х т. Тула: Филин, 1993.
  79. И. Стихотворения. М.: Советская Россия, 1988. — 464 с.
  80. А.Н. Эмигранты. М.: Правда, 1982. — 560 с. Толстой А. Н. Сочинения: в 8-ми т. — М.: Правда, 1972.
Заполнить форму текущей работой