Компьютерная этномузыкология: задачи, методы, результаты

Опыт изучения традиционной музыки в прошлом и текущем столетии показал, что при определении важных параметров, связанных со строем, интервальным составом и структурой звукорядов, индивидуальным исполнительским стилем, целесообразно использовать объективные методы измерений. Ранее они могли быть проведены с помощью специальных приборов, анализирующих физические характеристики звука; в настоящее время (конец XX — начало XXI века) уместнее обратиться к компьютерному анализу фонограмм (см., например, [21; 26; 36]). Среди задач, которые стоят перед компьютерной этномузыкологией сегодня, можно выделить несколько направлений:

  • получение объективных данных и визуализация параметров акустического текста для исследования;
  • анализ ритма, темпа, ритмических паттернов;
  • изучение акустических характеристик звука и особенностей тембра инструментов;
  • анализ звуковысотного рисунка фонограммы;
  • анализ особенностей исполнения отдельных звуков, фрагментов текста, музыкального произведения в целом;
  • статистический анализ параметров ис­полнительского стиля, в том числе выявление используемого звукоряда и строя традиционных музыкальных инструментов;
  • исследование традиционных техник пения;
  • автоматическая нотация;
  • каталогизация образцов традиционной музыки, разработка алгоритмов и параметров поиска музыкальной инфор­мации в компьютерных базах данных.

 

Технические средства в этномузыкологии

Одними из первых приборов, используемых в этномузыкологии, стали аппараты для записи звука — например, фонограф Т. А. Эдисона, изобретенный в 1877 году. Он позволял создавать фонограммы, которые далее могли исследоваться учеными неограниченное время. Примерно через семьдесят лет, в середине 1940-х годов, появились ЭВМ — электронные вычислительные машины, ныне называемые компьютерами. Спустя еще примерно шестьдесят лет, в 2007 году, утвердилось новое направление в этномузыкологии — компьютерная (или вычислительная) этномузыкология: такое название было дано группой авторов в статье «Computational Ethnomusicology» (CE) [47], где прослеживалась история применения аппаратных средств в этнографических исследованиях. Авторы данной статьи цитировали фон Хорнбостеля, который еще в 1928 году писал1: «В качестве материала для изучения фонограммы чрезвычайно превосходят расшифровки мелодий, сделанные прямо на слух, и непонятно, почему снова и снова применяется более примитивный метод». Авторы соглашались с Э. Хорнбостелем в том, что применение «полевой» записи звука радикально изменило возможности этномузыкологии, обеспечив способ сохранения музыки за пределами места и времени, где она прозвучала; они подчеркивали, что аудиозаписи содержат гораздо больше информации, чем транскрипции (нотные записи), поскольку процесс расшифровки во многом субъективен; кроме того, визуальное представление музыкального материала также имеет определенные преимущества перед аудиозаписью [47].

Отметим, что в нашей стране первой начала применять полевую звукозаписывающую технику известная исследовательница традиционной музыки Е. Э. Линёва (1853–1919); она выпустила «первый в России фонографический песенный сборник, где было зафиксировано подлинное народное многоголосие» [11, 3].

Одним из важных этапов дальнейшего развития объективных методов анализа в этномузыкологии стало использование аппаратов для звуковысотной расшифровки мелодии. Турецкий исследователь А. Гедик указывал [38], что проблема звуковысотной расшифровки незападной музыки горячо об­суждалась основателями этномузыкологии, такими как А. Эллис, Ф. К. Штумпф, Э. М. Хорн­бостель, Ч. Л. Сигер2. Последний в 1958 году ввел научное определение «оригинальной» нотации и «транскрипции»: оригинальная, 

«предписывающая» нотация указывает, как кон­кретный музыкальный номер должен ис­полняться, в то время как транскрипция — «описывающая нотация» — фиксирует реаль­ное звучание исполнения с его особен­ностями. Он же изобрел ряд приборов для автоматической звуковысотной расшифровки — так называемые мелографы Сигера (1951, 1958); в них результаты измерений высоты (мелограмма) и динамического профиля выводились на бумажную ленту в реальном времени в виде графиков. Однако этот процесс пытались автоматизировать и раньше: один из первых аппаратов был изобретен, по данным работы Гедика [38], около 1870 го­да. Для этой же цели были позже созданы Аппуновский тонометр (1879), фонодейк Миллера (1916), аппарат для фонофотографии Метфесселя (1928), аналогичный аппарат Сишора (1932), аппарат авторов Обата и Кобаяши (1937). Наиболее удачным, получившим распространение в этномузыкологии, оказался мелограф Сигера, который использовался долгое время — до замены его компьютерными программами [38].

Необходимость разработки таких уст­ройств связана прежде всего со спецификой звукорядов, существующих в традиционной музыке: здесь интервалы между ступенями обычно значительно меньше, чем в академической музыке, что делает расшифровку в рамках 12-полутонового ряда весьма неточной. Например, в наших исследованиях русского народного пения [31] было выявлено использование исполнителями от 15 до 30 ступеней в октаве и более. Интервалы между ступенями в таких звукорядах могли составлять примерно от 30–40 до 70–80 цен­тов. Ряд последующих работ, касающихся анализа звукорядов традиционных культур Азии [21; 43; 44], показал, что музыканты этого региона часто используют интервалы около 25 центов. В связи с этим возникают требования к точности измерений: для уверенного определения интервала в 25 центов высоты звука, между которыми он образуется, должны быть замерены с точностью не менее 5–10 центов.

Отметим, что аналогичные приборы — интонографы — разрабатывались для иссле­до­ваний интонации речи в лингвистике; в 1980–1990-х годах они были замене­ны компьютерными программами анализа фоно­грамм. (В настоящее время известными общедоступными программами для этих целей являются, например, Speech Analyzer и Praat.) Точность анализа частоты основного тона, требуемая в лингвистике, обычно намного ниже, чем в этномузыковедении, — так, считается достаточным фиксировать в расшиф­ровке только номер частотной полосы, в которой оказался основной тон на данном отрезке речи (весь звуковысотный диапазон речи разделяют на 3–6 полос).

В России пионером аппаратных методов анализа характеристик звука в сфере музыко­ведения был А. В. Рабинович, проводивший в 1930–1931 годах (по идее и под руководством Н. А. Гарбузова) замеры мгновенной высоты тона во время исполнения на скрипке [15]. Измерение происходило по записи, сделанной на осциллографе — приборе, который фиксировал тонким лучом на фоточувствительном материале форму звуковых колебаний в виде графика. Далее Рабинович визуально выделял из него повторяющиеся фрагменты, соответствующие периоду основного тона в данный момент времени. Таким способом он исследовал процесс интонирования при академической игре на скрипке. 

Точность анализа высоты звука Рабинович оценивал примерно в 10 центов. В своей бро­шюре он писал: «Помимо профессиональ­ной музыки, осциллографический анализ найдет широкое применение в области народной музыки, давая возможность записи подлинного строя <…> записи, не испорченной “темперированным” воспитанием этнографов» [15, 32]. Рабинович упоминал также об аналогичных работах современников — в частности профессора М. Метфесселя3, который «задался целью объективными методами определить строи народной песни негров Северной Америки» [15, 3].

 

Кибернетическая этномузыкология (В. Гошовский)

В эпоху «больших ЭВМ» в СССР проводились разработки вычислительных систем, ориентированных на задачи музыкальной науки. В работах 1960–1980-х годов В. Л. Гошовский (1922–1996) ввел термин «кибернетическая этномузыкология» [6]. Он предложил единый формальный язык для ввода музыкальных текстов, их сегментации, алгоритмического структурного анализа [7]. Наиболее убедительные результаты в то время были получены в области машинной каталогизации народных мелодий. Примером может служить УНСАКАТ (Универсальный структурно-аналитический каталог) АН Армении, представ­ляющий собой систему для обработки фольк­лорных текстов, поиска и классификации музыкальной информации. Каждый образец мог анализироваться по восьмидесяти параметрам, и машина была способна выполнять двадцать тысяч разных операций анализа [7, 8–9]. Система на основе ЭВМ представляла собой принципиально новый вид каталога. Текстологический анализ, применяемый Гошовским по отношению к фольклорным образцам, вполне согласовывался с задачами исследования музыки устной традиции, особенно когда было необходимо выделить архетипы, и музыка рассматривалась как «воплощенная в тексте семиологическая система» [8].

Каталогизация проводилась на основе текста, созданного исследователем (путем анализа фонограммы на слух). Таким образом, набор элементов в экспертной системе был ограничен взглядами ученого, уровнем музыкальной науки его времени, а концепция предшествовала анализу. В работе над армянской песней «Горани» были убедительно показаны элементы музыкального материала (нотная запись и словесный текст), которые объединяют несколько на первый взгляд разных мелодий в одну группу. В процессе анализа основное внимание было сосредоточено на наиболее часто повторяющихся элементах, которые выявлялись статистическими методами, при этом единичное отбрасывалось как нетипичное [8].

 

Компьютерный анализ звука в музыке (ISMIR)

В 1960–1990-х годах была создана система стандартов цифровой записи звука, видеоизображения и других сигналов, а также соответствующая аппаратура, что позволяло фиксировать их с гораздо большей точностью. Для анализа в конце 1960-х годов был разработан эффективный алгоритм расчета спектра — так называемого быстрого преобразования Фурье, который давал огромную экономию времени. Благодаря этим достижениям, а также значительному увеличению быстродействия и объема памяти к концу ХХ века ЭВМ, которые стали теперь называться компьютерами, уже могли обеспечить оперативный анализ музыкального звука, и он стал актуален для исследователей многих стран. В 2000 году возникло Между­на­родное общество по извлечению музыкальной информации — ISMIR (International So­cie­ty of Music Information Retrieval), которое с тех пор проводит ежегодные конференции; число его членов в конце 2017 года достигло 22504. По данным [46], на конференцию отбираются около девяноста докладов, причем каждый из них имеет в среднем двух авторов (тренд состоит в увеличении этого числа от 1,94 в 2000 году до 3,24 в 2014 году).

Основным направлением работ членов ISMIR является автоматический анализ музыки, исполняемой в европейском 12-полутоновом равномерно-темперированном строе. Разрабатываемые в сообществе программы анализа позволяют опознавать исходную мелодию, использованную для аранжировки, последовательность аккордов (или хотя бы их типов) и время их звучания; одной из основных целей становится определение автора исходной композиции (для соблюдения его прав) путем поиска похожих образцов в специально разрабатываемых компьютерных базах данных5.

Следует отметить, что если в фонограмме использован 12-полутоновый равномерно-тем­перированный строй, то заранее определены и все возможные частоты содержащихся в ней звуков; задача распознавания аккордов состоит в определении наличия или отсутствия звуков из этого известного набора в каждый момент времени, и достаточная точность поиска составляет 50 центов. Несмотря на кажущуюся простоту задачи и быстродействие компьютеров, удовлетворительно работающие алгоритмы анализа последовательности аккордов для академической музыки были разработаны только к 2010-м годам. Характерные сложности анализа состоят в наложении систем обертонов друг на друга и на предполагаемые основные тоны, наличии в исполнении вибрато и глиссандо (переменная высота), присутствии неизбежных переходных процессов (когда меняется уровень сигнала, а высоты находятся в процессе установления), влиянии шумов инструментов и так далее. Для улучшения результата исследователи обращались, в част­ности, к известным теоретическим прин­ципам сочинения классической музыки, а также к экс­периментальным материалам по ста­тис­тике последовательности нот с целью опре­де­ле­ния наиболее вероятного продолжения (метод «скрытых моделей Маркова» — Hid­den Markov’s models) [41] и другим.

При анализе фонограмм традиционной му­зыки ситуация оказывается еще более сложной: используемый в ней звукоряд обычно неизвестен — ни его тип (равномер­ный или неравномерный), ни структура (после­до­ва­тельность интервалов), и число технически возможных высот звуков оказывается очень большим. При наличии строго одного звучащего голоса (одной струны) компьютерная расшифровка может выполняться автоматически с достаточной точностью (см., например, [26, гл. 3]). Эта задача решается с помощью программы SPAX, созданной одним из авторов данной статьи (А. Харуто) [23; 26, гл. 5]. Здесь требуется определение высоты единственного основного тона с погрешностью не более 5 центов (что примерно соответствует слуховым возможностям че­ло­века); отметим, что это в 10 раз выше требуе­мой точности расшифровки для 12-полутоновой музыки с равномерно-темперированным строем.

Компьютерная расшифровка, полученная в программе SPAX

В случае многоголосного звучания для автоматической расшифровки невозможно применять те же методы, что для одноголосной фонограммы, так как состав колебания оказывается принципиально более сложным. В многоголосных фонограммах традицион­ной музыки количество технически возмож­ных частот основных тонов оказывается прак­­тически бесконечным. В связи с этим задача автоматической расшифровки, не сводящей результат к «европейскому» звукоряду, пока не имеет удовлетворительного решения (см., например, [46; 48], а также обзор в книге [26, гл. 4]). Отметим, что в неавтоматическом («ручном») режиме измерение высот отдельных звуков в заданные моменты времени при многоголосном звучании вполне осуществимо (используется измерение положений частичных тонов в динамическом спектре); ниже приведен пример исследования, проведенного нами таким методом [21] с помощью программы SPAX.

Получаемая в результате расшифровки мелограмма является обычно промежу­точ­ным результатом, далее перед исследова­те­лем встают задачи определения используе­мого в ней звукоряда и системы длитель­ностей и на их основе нотирования расшиф­ровки каким-либо методом; на этом этапе также появляются дополнительные проблемы (см., например, [24; 25; 27; 28]). Таким образом, компьютерный анализ фонограмм традицион­ной музыки сталкивается с преодолением комплекса специфических трудностей, что и привело к возникновению отдельного направления — компьютерной этномузыкологии.

 

Компьютерная этномузыкология

В опубликованной в 2007 году статье «Com­pu­tational Ethnomusicology» (CE) [47] анализировались области применения компьютерных методов в музыкознании и освещались результаты применения компьютерного анализа в разных традиционных музыкальных культурах. Авторы объединяли под общим термином СЕ массив цифровых технологий, которые обеспечивают анализ, преобразова­ние и поиск в базах данных записанных музыкальных материалов. В качестве этапных работ этого направления было выделено несколько исследований, опубликованных в тру­дах разных конференций и журналах, зани­мающихся проблемами обработки сигналов.

Так, авторы [47] описывают созданную еще в середине 1970-х годов систему нотирования одноголосных шведских народных мелодий6. На графическом дисплее выводились результаты — в том числе отображение статистического распределения (гистограммы) частоты основного тона, которая показывает относительное время пребывания звука на разных высотах. На основе этих данных далее были выделены пики распределения, соответствующие ступеням звукоряда, используемого в фонограмме. Частоты пиков фиксировались в центах относительно цент­рального тона (тоники). Система обеспечи­вала печатный вывод нотного текста в привычном формате пятилинейной нотации.

Далее в статье [47] упоминается исследовательская группа из Финляндии7, которая использовала «символическое представление» (MIDI-запись) 6252 народных (в основном) песен германского региона из «Кол­лекции Эссена», а также 2226 народных песен из Северного Китая. Они также вычисляли статистические распределения длительности звучания на разных высотах, мелодический интервал между следующими друг за другом тонами, а также вероятности переходов по этим трем параметрам. Затем они обратились к искусственной нейронной сети, чтобы свести многомерные распределения в единый массив, обеспечивающий сопоставление и поиск похожих мелодий.

Согласно данным обзора [38], в 2000–2011 годах исследованиям такого направления было посвящено около 5,5% докладов на конференциях ISMIR; наш анализ тематики докладов с 2012 по 2018 год показал, что эта доля снизилась до 4% (что вполне объяс­няется направленностью основных разработок ISMIR). Тем не менее работы по традиционной музыке продолжаются и в рамках ISMIR. Так, на 12-й конференции ISMIR [37] была представлена система анализа циклов классической иранской музыки — дастгах, и определения их ладовой принадлежности (аналогично анализируются лады-макамы в турецкой и арабской музыке). В связи с вариативностью звуковысотных ступеней лада для распознавания были выбраны методы классификации на основе нечетких множеств Заде [50]. Для настройки и проверки системы использовались, как указывает автор [37], 210 записей разных дастгахов (жанры иранской классической музыки) в основном в вокальном, но также в инструментальном исполнении. (Необходимо уточнить, что в ана­лизируемом образце может содержаться переход от одного лада в другой, то есть ладовая модуляция; в этом случае исследователю, помимо слухового опыта, также может помочь компьютер. Это особенно актуально в современной исполнительской практике, когда музыканты часто проявляют бóльшую свободу и отходят от устоявшихся способов перехода и сочетания ладов.)

В диссертационной работе Гедика [38] описана система автоматического компьютер­ного анализа традиционной турецкой му­зыки с учетом ее специфики. Система обес­пе­чи­вает как расшифровку, так и автома­ти­ческое распознавание макама (в данном случае как лада). Гедик указывает, что турецкая система нотации национальной музыки использует в качестве наименьшего интервала гольде­рову комму, равную 1/53 части октавы (22, 64 цента)8. В связи с традиционной вариативностью исполнения звук каждой ступени перекрывает некоторый диапазон частот, и при этом интервалы между ступенями и цент­ральным тоном должны соответствовать определенному ладу-макаму и базовому звукоряду. Ключевым моментом для разработчика системы являлось определение цент­рального тона и исполняемого макама. Обе эти операции основывались на статистическом подходе, а именно: полученное статистическое распределение времени звучания высот сравнивалось с построенными ранее шаблонами разных макамов и находился наиболее близкий к нему шаблон. Для сопоставления экспериментально полученных распределений с шаблонами использовался корреляционный критерий [39].

Особое внимание в работе [38] уделяется проблеме квантизации звуков по длительности. Для определения шкалы длитель­ностей строилось их статистическое распределение, причем каждая измеренная длительность округлялась до десятков миллисекунд. В полученном распределении находилась длительность, возникающая чаще других, и она соотносилась со стандартной 1/8.

Отметим, что этот аспект важен в плане определения ритмической структуры анализируемой музыки, ее темпа и агогики. Описанный подход позволяет получить достаточно точные данные для автоматической но­тации, однако, как указывает автор [38], многие исследователи до сих пор округляют эти данные до привычной европейской стандартной системы длительностей. Компью­тер­ный анализ дает исследователю возможность точного объективного определения микроинтервальной «жизни» лада и темпоритма, а также особенностей индивидуального исполнительского прочтения данного образца.

 

Компьютерная этномузыкология в России

Независимо от зарубежных работ направление компьютерной этномузыкологии получило развитие в Московской государственной консерватории имени П. И. Чайковского, где, начиная с 1994 года, силами одного из авторов данной статьи (А. Харуто) разрабатывались программы для анализа звука — сначала для работы под управлением операционной системы ДОС, а затем (с 2000 года) — под Windows [23]. Основные подходы к компьютерному анализу и результаты исследований с 1995 по 2014 год представлены в книге [26] и многочисленных статьях.

С помощью программ, созданных в 1994–1995 годах, изучались характеристики спектра голоса певцов разных жанров [12]. Далее в разрабатываемые программы были добавлены блоки для определения точного звуковысотного рисунка (мелодической линии). В работах [33; 34], проведенных с помощью этих программ (совместно с аспирантом Московской консерватории С. Химом), были опубликованы полученные результаты анализа звуковысотного рисунка традиционных вокальных жанров Камбоджи и параметров разных типов вибрато (частоты и амплитуды колебаний высоты звука), возникающих в этой музыке (см. также [26]).

Указанные программы далее использовались в работах по анализу русского фольк­лора, проводившихся совместно с научным сотрудником Московской консерватории, фольклористом Д. В. Смирновым. Он также выступал в роли квалифицированного пользователя и тестировал разные варианты анализа фонограммы и способы представления результатов, запрограммированные А. Харуто. При этом исследовались точный звуковысотный рисунок и его стилистические детали [31; 18]. Компьютерный анализ показал, что разные исполнители задействуют неодинаковое число ступеней в октаве — от 15 до 30 и более (в тот время как ранее расшифровки производились с приведением к 12-ступенному равномерно-темперированному строю). Одна из расшифровок фонограмм зафиксировала необычную структуру ладово-звукового ядра песни, содержащего два звука разной высоты, которые быстро сменяли друг друга во времени и были неразличимы слухом как самостоятельные: они формировали своеобразное очень быстрое вибрато прямо­угольной формы. Как отмечалось в статье [31], «при первом прослушивании создается специ­фический тембровый эффект: звук воспринимается как несколько сдавленный, взятый голосом в высокой позиции <…>». При этом на протяжении всей песни «и сам звук, и его составляющие строго выдерживаются по высоте, как, впрочем, и остальные ступени звукоряда, что говорит о стабильности ладовой системы, чистоте интонирования» [31].

В работах Харуто и Смирнова [45; 19] были опубликованы результаты исследова­ния традиции, бытующей на реке Пинеге (Ар­хангельская область). Сравнивались запи­санные Смирновым мелограммы старшего поколения исполнительниц Пинежского плача, родившихся в 1910–1920-х годах, и носителей традиции, родившихся в 1950-х годах и постоянно выступающих на эстраде; установлено, что они разучили плачи по чужим
фонограммам
(записанным на грампластинки) уже в зрелом возрасте. Сопоставление компьютерных расшифровок, полученных в программе SPAX, показало разный подход к интонированию: в исполнении старшего поколения глиссандирование осуществляется непрерывно, без остановок на какой-либо высоте, причем с непрерывно меняющейся крутизной, а во втором случае при сохранении общей линии мелодия как бы прорисовывается в виде последовательности тонов разной высоты, сопровождаемых предварительным ходом вниз — вверх — к высоте последующего «тонального» звука (см. подробнее [19]).

Статистическое распределение высот звука показало, что в «новом стиле» исполнение базируется на постоянных высотах, составляющих звукоряд данного музыканта (близкий к 12-полутоновому равномерно-тем­перированному). В более ранних записях такие постоянные высоты не обнаружи­ва­ются. Таким образом, в исследовании были зафиксированы исторические изменения в исполнительской традиции при смене поколений ее носителей.

В силу географического положения нашей страны и наличия в России развитого востоковедческого направления в настоящее время (в том числе силами авторов статьи) наиболее быстрыми темпами развивается компьютерное музыкальное востоковедение [35; 36; 42; 43; 44]. В его рамках на основе объективных количественных методов проводилось изучение устно-профессиональной и классической музыки Востока — тувинской, калмыцкой, азербайджанской, казах­ской, узбекской, таджикской, индийской, иран­ской, турецкой, китайской, корейской.

В исследовании культур Востока актуальными оказываются следующие проблемы: оп­ределение точного строя и звукоряда анализируемой музыки; обнаружение минимальных используемых исполнителем интервалов (микроинтервалов); определение темб­ровых параметров; выявление своеобразия исполнительского стиля, в вокальной музыке — манеры звукоизвлечения, соотношения высо­ких и низких певческих формант; анализ ти­пов орнаментики, ее своеобразия у разных музыкантов; в инструментальной музыке также определение точной звуковысотности и спектра звука шумовых инструментов.

Сопоставление звукоряда молчащего ин­стру­мента (линейный обмер), предвари­тельно озвученных фиксированных ладков и реального звукоряда, используемого во вре­­мя исполнения, показал, что реальная звуко­­вы­сотная система отличается от «лабо­ра­тор­­ной». Таким образом, сравнительное ис­сле­­дование реального используемого и тео­ре­ти­ческого звукоряда возможно только на основе анализа фонограммы исполнения. Этот подход использовался во всех работах авторов статьи. Например, наше совместное с С. И. Уте­га­лиевой изучение звукоряда казахской домб­ры (фонограмма исполнения зна­менитой Д. Нурпеисовой, 1861–1955) показало, что здесь звукоряд строится с шагом около 25 цен­тов [21]9.

В цикле совместных работ авторов статьи [35; 36; 42; 43; 44] сопоставлялись звукоряды в исполнениях мастеров классической музыки Востока (Б. Мансурова, Н. Аминова), записанных в 1960-х годах, и музыкантов следующего поколения (Р. Аминов, В. Раги­мов, М. Эшанкулов). Полученные данные свидетельствовали о преимущественном исполь­зо­вании старыми мастерами интервалов, при­мерно кратных 25 центам (25, 50, 75, 125 цен­тов, характерных для «теоретического» 17-сту­пен­ного звукоряда) и явно меньшей доле та­ких интервалов в исполнении более молодых музыкантов — они заметно чаще обращаются к интервалам, кратным 100 центам. Таким образом, традиция исполнения становится все более близка к европейской.

Следует отметить, что в работе исследовались две записи Рагимова: первая была сделана в 1981 году — до того как он учился в консерватории, а вторая в 2012-м — уже после ее окончания, и его исполнение 2012 года также оказалось более приближенным к академической музыке. Эшанкулов до момента записи (2013 год) уже закончил консерваторию — доля «европейских» интервалов в его исполнении тоже велика. Аминов учился только у своего отца, знаменитого мастера Шашмакома Н. Аминова, то есть не получил академического музыкального образования; в его исполнении в бóльшей степени (чем у Эшанкулова и Рагимова в 2012–2013 годах) сохранились микроинтервалы — однако их доля меньше, чем в исполнении отца. По-видимому, современная звуковая среда, развитие средств массовой коммуникации также влияют на процесс уменьшения доли мик­ро­интервалов — наряду с консерваторским образованием.

Еще одним типом фонограмм, записан­ных от представителей традиционных музыкаль­ных культур, являются исполнения с существенными вариациями тембра. Например, к ним можно отнести так называемое горловое пение (хоомей), известное в Туве, Хакасии, Монголии, на Тибете и в Башкирии. В нашем совместном с Е. Карелиной исследовании [32] было подтверждено, что верхние голоса (во время вокализа) — в дополнение к низкому бурдонному звуку — создаются за счет присутствия в звуке верхних формант, которые «выделяют» из спектра ряд близких обертонов постоянно присутствующего бурдонного звука. В результате оказываются слышны два, три и более голоса, которые производятся одним источником — горлом певца. Компьютерный анализ позволил провести моделирование процесса восприятия такого звука как двух голосов путем регулирования «глубины просмотра» спектра (с разделением на более и менее мощные обертоны).

Следует отметить, что аналогичную обер­тоновую модель формирования голосов предлагали ранее разные исследователи (см., например, [1; 5]), однако на основе компьютерного анализа была предложена новая модель звукообразования в хоомее [22], которая объясняет само наличие достаточно мощных обертонов, вплоть до высоких частот, служащих основой для формирования верхних голосов (см. также [26], раздел о горловом пении). Она же объясняет наблюдаемую структуру спектра, содержащую только один натуральный обертоновый ряд от бурдонного звука, при одновременном действии двух источников колебаний с разными характеристиками — основных и ложных голосовых складок.

Одним из уникальных свойств горлового пения является наличие у певца в качестве звукового материала только обертонов одного натурального ряда, которые выделяются формантами «для прослушивания». Это приводит к тому, что все слышимые голоса используют натуральный звукоряд; происхож­дение и влияние этой традиции на тувинскую профессиональную музыку было отмечено, в частности, в книге [9].

Из приведенного выше краткого обзора характерных результатов исследований методами компьютерной этномузыкологии видно, что одной из важных задач является определение звукоряда, используемого исполнителем. Решению этой задачи был посвящен ряд работ [26; 27; 28; 30; 25; 24; 35; 36; 21; 44; 43 и другие]. Экспериментальное определение звукоряда (когда неизвестны ни число ступеней, ни тип темперации) производится на базе представления о том, что его ступени проявляются в исполнении более долгим выдерживанием звука на их высотах (аналогичный подход отмечается в обзоре в статье [47]: статистический анализ времени пребывания звука на разных высотах применяли авторы разных стран — см. также [37; 38]). В программе SPAX производится статистический анализ этого времени, и далее высоты ступеней выделяются по признаку достаточно большой (по сравнению с заданным порогом) длительности звучания на данной высоте; кроме того, слишком близко расположенные ступени объединяются [26, гл. 3]. Оба параметра — порог отбора по длительности и минимально допустимый интервал между ступенями — задает программе сам исследователь.

С учетом существующей в музыковедении традиции представления нотной записи в интервалах равномерно-темперированного звукоряда в программу SPAX включен также блок преобразования точного звуковысотного рисунка (получаемого, напомним, с погрешностью не более 5 центов) путем округления высот до тонов, расположенных с заданным постоянным шагом по высоте (от 5 до 96 ступеней в октаве). Как показано в работах [24; 25; 29], проблема нотации всегда связана с такого рода заменой реаль­ных высот звуков ближайшими «разрешенными», входящими в модельный звукоряд. Аналогичная процедура необходима и при фиксации длительностей. В программе SPAX предусмотрены процедуры вычисления соответствующих погрешностей по высоте и по длительности.

 

Заключение

Все рассмотренные результаты получены с помощью программы SPAX или ее более ранних версий; обзор некоторых зарубежных программ этого направления приво­дился в [26, гл. 4]10. Таким образом, к настоя­ще­му времени в рамках компьютерной эт­но­музыкологии начинают формироваться несколько направлений исследований (к сожалению, они пока не покрывают анонсированное в начале статьи поле потенциальных возможностей):

  • Структурно-аналитическое направле­ние, объектами которого выступают параметры звука инструментов, струк­тура их спектра, параметры строя ин­стру­мента — лабораторного и исполни­тельского звукоряда, анализ харак­те­рис­тик певческого звука, его звуко­ряда. Оно наиболее развито и востребовано в наше время и представлено практи­чески во всех работах, упомянутых в данной статье.
  • В рамках экспертного направления происходит уточнение или определение ладовых структур акустических текстов, поиск принадлежности вариантов мелодий к одному прототипу. Подобные исследования проводятся на основе сопоставления с шаблонами, им посвящены работы В. Л. Гошовского [6; 7; 8], а также А. Гедика [38; 39].
  • Сравнительное и сравнительно-историческое направление нацелено на сопоставление характеристик ряда исполнительских версий, которые могут далее использоваться для выявления исторических тенденций изменения стиля исполнения, происходящих как в процессе эволюции стиля отдельного музыканта, так и при взаимодействии разных культур. Анализ исполне­ния как отдельных музыкантов, так и многих представителей национальной исполнительской школы позволяет 
  • не только фиксировать параметры звука, но и исследовать статистику этих параметров. Оно широко представлено в работах авторов данной статьи, а также С. Утегалиевой [20], Е. Ка­релиной [9], С. Абдоллы [37], А. Гедика и Б. Бозкурта [38; 39].
  • Наблюдается также развитие направления автонотаций и создания цифровых каталогов (сюда можно отнести труды Гошовского по созданию УНСАКАТ [7]; автонотацию также широко используют А. Гедик, Б. Бозкурт [38; 39] и другие).

Как известно, общая тенденция развития наук состоит в переходе ко все более точным методам анализа; применительно к музыке эта тенденция должна развиваться в комплексе со слуховым анализом. В идеале этномузыколог должен владеть компьютерными технологиями и быть готовым к союзу с техническими специалистами, и за такими союзами будущее.

 

Литература

  1. Айзенштадт С. А., Харуто А. В. О некоторых особенностях фортепианного интонирования представителей музыкальной культуры стран Дальневосточного региона (Китай, Корея, Япония) в контексте языковых закономерностей // Музыкальная академия. 2013. № 1. С. 118–125.
  2. Аксенов А. Н. Тувинская народная музыка / под ред. и с предисл. Е. В. Гиппиуса. М. : Музыка, 1964. 256 с.
  3. Бажанов Н. С. Динамическое интонирование в искусстве пианиста : исследование. Новосибирск : Новосибирская гос. консерватория, 1994. 300 с.
  4. Бажанов Н. С. Изучение звучащего музыкально­го произведения компьютерными технологиями: музыкальное время // Музыка в информационном мире. Наука. Творчество. Педагогика. Сборник научных статей / науч. ред. Г. Р. Тараева, Т. Ф. Шак. Р. н/Д. : Ростовская гос. консерватория, 2004. С. 12–43.
  5. Банин А. А., Ложкин В. Н. Об акустических особенностях тувинского сольного двухголосия // Труды VIII Всесоюзной акустической конференции. М. : АН СССР, 1973. 264 с. С. 30–34.
  6. Гошовский В. Л. Фольклор и кибернетика // Советская музыка. 1964. № 11. С. 74–83; № 12. С. 83–89.
  7. Гошовский В. Л. Горани. К типологии армянской песни (Опыт исследования с помощью ЭВМ). Ереван : АН Арм. ССР, 1983. 71 с.
  8. Гошовский В. Л. Объект — текст — соответствия // Традиции и перспективы изучения музыкального фольклора СССР. Сборник научных статей / ред.-сост. Э. Е. Алексеев, Л. И. Левин. М. : ВНИИ искусствознания, 1989. С. 56–93.
  9. Карелина Е. К. История тувинской музыки от падения династии Цин и до наших дней : исследование. М. : Композитор, 2009. 552 с.
  10. Лаборатория музыкальной акустики (К 100летию Московской гос. консерватории им. П. И. Чайковского) / ред. Е. В. Назайкинский. М. : Музыка, 1966. 84 с.
  11. Линёва Е. Э. Письма к мужу: Написаны летом 1901 года во время экспедиций по селам Новгородской губернии / подгот. текста, вступит. статья и коммент. Смирнов Д. В. М. : ГИПИ им. М. М. Ипполитова-Иванова, 2011. 76 с.
  12. Морозов В. П., Кузнецов Ю. М., Харуто А. В. Об осо­бенностях спектра голоса певцов разных жанров // Проблемы информационной культуры. Вып. 2. Информационный подход и искусствознание / М.—Краснодар : Краснодарский гос. университет культуры и искусств, 1995. С. 147–156.
  13. Назайкинский Е. В., Рагс Ю. Н. О применении акустических методов исследования в музыко­знании // Применение акустических методов исследования в музыкознании. М. : Музыка, 1964. С. 3–17.
  14. Отчеты акустической лаборатории Москов­ской государственной консерватории (1954–1960). На­учно-музыкальная библиотека им. С. И. Тане­ева Московской гос. консерватории им. П. И. Чай­ковского. Рукопись.
  15. Рабинович А. В. Осциллографический метод анализа мелодии. М. : Музгиз, 1932. 32 с.
  16. Рагс Ю. Н. О художественной норме чистой интонации при исполнении мелодии. Дисс. ... канд. искусствоведения. М. : Московская гос. консерватория, 1970. 323 с.
  17. Сахалтуева О. Е. О некоторых закономерностях интонирования в связи с формой, динамикой и ладом // Труды кафедры теории музыки Московской гос. консерватории им. П. И. Чайковского. Вып. 1. М. : Музгиз, 1960. С. 356–378.
  18. Смирнов Д. В., Харуто А. В. Нелинейный звукоряд в музыкальном фольклоре: общая закономерность и индивидуальность // Языки науки — языки искусства : сб. научных трудов / общ. ред. З. Е. Журавлёвой, В. А. Копцик, Г. Ю. Резниченко. М. : Прогресс-Традиция, 2000. С. 347–352.
  19. Смирнов Д. В. Причитания Верхней Пинеги (компьютерный анализ звуковысотности) // Актуальные проблемы полевой фольклористики. Вып. 2. М. : Изд-во МГУ, 2003. С. 26–36.
  20. Утегалиева С. И. Звуковой мир тюркских народов: теория, история, практика: (на материале инструментальных традиций Центральной Азии). М. : Композитор, 2013. 525 с.
  21. Утегалиева С. И., Харуто А. В. Компьютерное исследование традиционного строя казахской домбры на примере фрагмента из кюя Д. Нурпеисовой «Енбек epi» // Музыковедение. 2013. № 8. С. 28–39.
  22. Харуто А. В. Тувинское горловое пение: акусти­ческий анализ и модель звукообразования // Cб. трудов ХХ сессии Российского акустического общества, секция «Акустика речи». М. : РАО, 2008. С. 106–110.
  23. Харуто А. В. Программа SPAX для ОС Win­dows. Свидетельство ФГУ «Роспатент» о регистрации № 2005612875 от 7 ноября 2005 года. Демонстрационная версия программы доступна на сайте автора: URL: http://kharuto.ru/ SPAX-demo/ index.htm (дата обращения: 13.08.2020).
  24. Харуто А. Компьютерный анализ высоты звука в музыковедческом исследовании: информационный аспект // Музыкальная академия. 2016. № 3. С. 98–102.
  25. Харуто А. Компьютерный анализ длительностей звуков в музыкальном исполнении // Музыкальная академия. 2017. № 3. С. 125–128.
  26. Харуто А. Компьютерный анализ звука в му­зыкаль­ной науке. М. : НИЦ «Московская кон­серватория», 2015. 448 с.
  27. Харуто А. Компьютерный анализ звукоряда по фонограмме // Музыкальная академия. 2010. № 3. С. 83–89.
  28. Харуто А. Определение звукоряда по фонограмме: статистический критерий «истинности» // Музыкальная академия. 2019. № 3. С. 230–239.
  29. Харуто А. В. Компьютерный анализ музыкального звука и проблемы точности // Музыка народов мира: проблемы изучения. Материалы международных научных конференций. Вып. 2. / ред.-сост. В. Н. Юнусова, А. В. Харуто. М. : НИЦ «Московская консерватория», 2017. С. 77–90.
  30. Харуто А. В. Компьютерный анализ характеристик звука в задачах исследования различных 
  31. стилей музыкального исполнения // Музыка народов мира: проблемы изучения. Материалы научных конференций. Вып. 1 / ред.-сост. В. Н. Юнусова, А. В. Харуто. М. : НИЦ «Московская консерватория», 2008. С. 388–408.
  32. Харуто А. В., Смирнов Д. В. Использование компьютерного анализа в исследовании звуковы­сотного строения народной музыки // Музыка устной традиции : материалы междунар. науч. конференций памяти А. В. Рудневой / науч. ред Н. Н. Гилярова; сост. В. Н. Щуров, Н. Н Гилярова. М. : Московская гос. консерватория, 1999. С. 335–340 (серия «Научые труды Московской гос. консерватории», сб. 27).
  33. Харуто А., Карелина Е. К вопросу о музыкально-акустических свойствах тувинского горлового пения // Музыкальная академия. 2008. № 4. С. 108–113.
  34. Хим С. К проблеме звука в кхмерской музыке. М. : Хронограф, 1997. 62 с.
  35. Хим С. Теоретические проблемы камбоджийской музыки. Дисс. … канд. искусствоведения. 
  36. М. : Московская гос. консерватория, 1998. 264 с.
  37. Юнусова В. Н., Харуто А. В. Традиционный му­зыкант в зеркале компьютерного анализа // Вопросы инструментоведения : сб. статей и мате­риалов VIII Международного инструментоведческого конгресса «Благодатовские чтения» (2–5 декабря 2013 г.). Вып. 9. / ред-сост. О. В. Колганова. СПб. : РИИИ, 2014. С. 267–275.
  38. Юнусова В., Харуто А. Компьютерный анализ параметров стиля исполнения в традиционной культуре (на материале классической музыки Востока) // Музыкальная академия. 2015. № 1. С. 143–147.
  39. Abdoli S. Iranian traditional music Dastgah classi­fication // Proc. of 12th International Society for Music Information Retrieval Conference (ISMIR 2011) / ed. by A. Klapuri, K. Leider. University of Miami, 2011. Р. 275–280.
  40. Gedik A. C. Automatic transcription of traditional Turkish art music recordings: A computational ethnomusicology approach // A thesis submitted to the graduate school of engineering and sciences of İzmir Institute of Technology in partial fulfillment of the requirements for the Degree of Doctor Of Philosophy in Electronics and Communication Engineering. İZMİR, 2012. 143 p.
  41. Gedik A. C., Bozkurt B. Pitch-frequency histo­gram-based music information retrieval for Tur­kish music // Signal Processing. 2010. Vol. 90. Р. 1049–1063.
  42. Gerhard D. Pitch Extraction and Fundamental Fre­quency: History and Current Techniques. Techni­cal Report. Regina : Department of Computer Science, University of Regina, 2003. 22 p.
  43. Hsu C.-L., Chen L.-Y., Jang J.-S. R., Li Hsu C.-L., Chen L.-Y., Jang J.-S. R., Li H.J. Singing pitch extraction from monaural polyphonic songs by contextual audio modeling and singing harmonic enhancement // Proc. of ISMIR 2009, ISMIR 2009. Р. 201–206.
  44. Iunysova V., Kharuto A. Computer analysis of sound phenomenon in traditional music of the Turkic speaking world. From voice to instrument: Sound phenomenon in traditional cultural heritage of the Turkic speaking world // Proc. of the 5th Symposium of ICTM Study Group “Music of the Turkic Speaking World.” Almaty, 2016. Р. 201–216.
  45. Iunysova V., Kharuto A. Computer sound analysis of traditional music of Asia // Musigi Dunyasi (Baku). 2017. Nr. 1(70). P. 7722–7754 (16–34).
  46. Iunysova V., Kharuto A. Computer sound analysis of traditional music of Transcaucasia and Central Asia. // 2016 Yearbook for Traditional Music. Inter­national Council for Traditional Music (UNESCO). 2016. V. 48. P. 136–145.
  47. Kharuto A. V., Smirnov D. V. Information approach in examining of evolution of Russian Northern folk musical tradition // Art and Environment: Proc. of IAEA-2002 / ed. by T. Kato. Osaka, 2002. Р. 313–318.
  48. Ryynänen M., Klapuri A. Transcription of the singing melody in polyphonic music // Proc. of ISMIR-2006. ISMIR, 2006. Р. 222–227.
  49. Tzanetakis G., Kapur Ajay, Schloss W. A., Wright M. Computational ethnomusicology // Journal of Interdisciplinary Music Studies. 2007. Vol. 1, iss. 2. Р. 1–24.
  50. Salamon J., Gulati S., Serra X. A multipitch approach to tonic identification in Indian classical music // Proc. of ISMIR 2012. ISMIR, 2012. Р. 499–504.
  51. Sordo M., Ogihara M., Wuchty S. Analysis of the evolution of research groups and topics in the ISMIR conference // Proc. of 16th ISMIR confe­rence / ISMIR, 2015. Р. 204–210.
  52. Zadeh L. The concept of a linguistic variable and its application to approximate reasoning // Journal of Information Sciences. 1975. Vol. 8. No. 3. Р. 199–249.

Об авторах: Юнусова Виолетта Николаевна, доктор искусствоведения, профессор кафедры истории зарубежной музыки Московской государственной консерватории имени П. И. Чайковского

Харуто Александр Витальевич, кандидат технических наук, доцент межфакультетской кафедры музыкально-ин­формационных технологий Московской государственной консерватории имени П. И. Чайковского

Комментировать

Осталось 5000 символов
Личный кабинет