Студент НГУ исследовал песенную поэзию с точки зрения математики

Выпускник бакалавриата Гуманитарного института НГУ Антон Зоркальцев в своей выпускной квалификационной работе исследовал структурный подход к песенной поэзии, позволяющий изучать литературу с точки зрения математики. Молодой исследователь собрал корпус из произведений нескольких поэтов-песенников: Роберта Рождественского, Александра Городницкого, Юрия Шевчука и Дмитрия Мозжухина. Песенные тексты этих авторов были представлены как деревья смысловых отношений. На основе их различных характеристик выпускником предлагались, рассчитывались и проверялись с помощью опроса меры сложности и эстетики текста, а также величины, позволяющие сравнивать поэтов по их стилям. Также автор исследования применил метод Монте-Карло, позволяющий оценить, насколько точны результаты его расчетов в зависимости от размера корпуса.

Песенная поэзия — одна из самых популярных форм современной литературы, но, несмотря на это, песенные тексты менее изучены, чем проза или классическая поэзия. На этом текстовом материале мы решили проверить метод объективного анализа художественного текста, который затем можно будет применять для различных текстов других видов. В качестве метода выбрали теорию риторических структур. В данном случае объективный анализ подразумевает введение определенных численных метрик, позволяющих оценивать различные аспекты текста. Данные метрики могут обогатить методологию современного литературоведения и подкрепить разного рода оценочные суждения, которые часто встречаются в литературных исследованиях и критике, — объяснил Антон Зоркальцев.

В ходе исследования молодой человек прибегнул к нескольким методам анализа: он составил и разметил корпус, собрал и проанализировал статистические данные, произвёл метрическое оценивание, провёл анкетирование и статистический эксперимент.

Теория риторических структур – это описательный лингвистический подход к широкому кругу феноменов, связанных с организацией текста. При таком подходе структура высказывания определяется смысловыми отношениями между его частями. Представление текста в виде графа (математического объекта) также отражает такую важную черту любого высказывания, как связность.

Для проведения стилеметрического, сложностного и эстетического анализа песенных текстов мною использовалась теория риторических структур. Этот инструмент был разработан и предложен еще в 80-х годах прошлого века учеными Института информационных наук (ISI) Университета Южной Калифорнии Уильямом Манном и Сандрой Томпсон, с тех пор он дорабатывается и совершенствуется. Согласно данной теории, исследуемый текст рассматривается как дерево смысловых отношений. Его разделяют на простые предложения (или другие единицы, в зависимости от цели), и анализируют, как они объединяются в одно дерево с помощью заданного изначально набора смысловых отношений. Например, части текста могут дополнять, уточнять или пояснять друг друга. Набор таких отношений может варьироваться в зависимости от поставленной задачи. Примечательно, что изначально теорию риторических структур предлагалось применять в сфере искусственного интеллекта, однако она также нашла достаточно эффективное применение в литературоведении, например, для изучения манипуляции читателем и механизмов влияния автора на аудиторию, — рассказал Антон Зоркальцев.

Авторов песенных текстов, как и сами тексты, молодой исследователь выбирал самостоятельно, исходя из своих музыкальных и литературных предпочтений. Также важны были популярность авторов и их произведений и то, какое внимание уделяют поэты художественной отделке своих текстов. Тексты Александра Городницкого имеют очень чёткую форму и очень часто погружают нас в атмосферу какого-то места: Городницкий – известный океанограф, бывавший во многих экспедициях. Песни на стихи Роберта Рождественского стали символом его эпохи и до сих пор популярны из-за удивительно точных и лёгких формулировок. Юрий Шевчук, как счел автор исследования, пишет достаточно актуальные тексты и сочетает надрыв с иронией, удаль – с грустью. Дмитрий Мозжухин – самый молодой из выбранных для исследования авторов. Как считает Антон Зоркальцев, его стихотворные тексты выгодно отличаются на фоне современной музыки – они отлично передают дух поколения, и каждая строка в них так и просится стать крылатой. Выбранные авторы представляют разные этапы и жанры в русской песенной поэзии: эстрадную песню, бардовскую поэзию, старый и новый русский рок.

Антон Зоркальцев составил корпус из 40 текстов этих поэтов. Для риторической разметки текста он использовал набор из 34 различных риторических отношений. В результате объем корпуса составил 1228 идентифицированных отношений. Он ввел одну стилеметрическую, 3 сложностных и 5 эстетических метрик. Для их расчета использовались численные показатели деревьев риторических структур. Сложностные и эстетические метрики молодой исследователь проверял путем опросов.

Для проверки каждой метрики испытуемым предлагали оценить два текста: с высоким и низким значением проверяемой метрики соответственно.  Участникам анкетирования нужно было выбрать, какой текст им представляется более сложным (если проверялась метрика сложности) или более красивым (если проверялась метрика эстетики). В опросе для проверки сложностных метрик участвовало 27 человек различных возрастов и профессий, а в опросе для проверки метрик эстетики участвовало 53 человек студента НГУ. Одна сложностная метрика (коэффициент вытянутости) оказалось наиболее действенной: текст с высоким значением данной метрики отметили, как более сложный 96% участников. Среди эстетических метрик не было обнаружено достаточно точной, — поделился результатами исследования Антон Зоркальцев. — Важно, что такой подход к эстетике текста — это не способ ограничить и стандартизировать существующие представления, игнорируя необъяснимость прекрасного; это, скорее, именно попытка объяснить наше восприятие искусства, — пояснил Антон Зоркальцев

Автор исследования разъясняет, что используемые меры эстетики опирались на значение энтропии, рассчитываемое по частотам отношений в корпусе. Однако на малых размерах корпуса частоты элементов могут сильно отличаться от их истинных вероятностей, и эту погрешность требовалось оценить. С помощью метода Монте-Карло было сгенерировано по 1000 выборок различных размеров для каждого возможного размера корпуса (от 1 идентифицированного отношения до 10 000). Для каждого значения размера корпуса было рассчитано математическое ожидание энтропии и другие статистические характеристики. Для выборки из 30 отношений (таков средний размер песенного текста) оценка энтропии существенно отличалась от действительной. Поэтому Антон Зоркальцев сделал вывод, что полученные значения эстетических метрик требуют уточнения, а сами эстетические метрики могут эффективно применяться лишь к материалу большего объема — от 100 идентифицированных отношений и более.

Мы получили неоднозначные результаты: чем старше автор, тем сложнее его тексты. Но проблема состояла в том, что в нашем исследовании эстетика определяется, как величина, обратная сложности. Соответственно, и эстетика сложных текстов оценивается, как низкая. Получается, чем сложнее текст, тем менее он эстетичен, но это не так! Скорее, для оценки текстов более ранних авторов необходим другой подход к измерению эстетики. Таких методов несколько, и мы попробовали применить лишь один их них. А это значит, есть пространство для дальнейших экспериментов, — сказал Антон Зоркальцев.

Студент работал под руководством профессора и доктора филологических наук Марии Кирилловны Тимофеевой. Исследовать тексты песен с использованием математических методов молодому исследователю помогал его отец, доктор технических наук, выпускник НГУ, научный сотрудник Байкальского государственного университета Валерий Иванович Зоркальцев.

В ноябре прошлого года Антон Зоркальцев выпустил дебютный сборник стихов «Жест освобождения». Книга была издана на средства гранта министерства культуры Новосибирской области.



Материал подготовил: Елена Панфило, пресс-служба НГУ