137 КОНГРЕСС AES – НАУЧНЫЕ РЕЗУЛЬТАТЫ
top_560.jpg
С 9 по 12 октября 2014 года в Лос-Анжелесе прошел очередной конгресс международного Звукотехнического общества AES. Cтатья доктора технических наук профессора И.А. Алдошиной является продолжением серии публикаций о результатах иследований, представленных на конгрессе AES. 
 
Как всегда, конгрессы в США собирают много специалистов, на этом было зарегистрировано 15 403 человека и 307 фирм-участников выставки.
 
Порядок конгресса сохранялся неизменным: научная сессия, выставка, многочисленные семинары, технические туры, встречи со специалистами и т.д.
 
На вступительной лекции, известный инженер и продюсер Алан Парсонс, анализируя современные достижения в звукозаписи, призвал оглянуться к истокам, назад к Hi-Fi. Легендарный режиссер аудиоигр и композитор Марти О'Донелл в своей мемориальной Хайзеровской лекции «Создание креативной культуры с адаптивным аудио» нарисовал перспективы развития таких нелинейных мультимедиа-сред как интерактивное кино и игры.
 
marty_560px.jpg
 
Марти О'Донелл – второй справа
 
На научной сессии работало девять секций, анализ основных докладов на них представлен ниже.

На секции «Акустика помещений» был прочитан интересный доклад «Визуализация ранних отражений в контрольных комнатах» (пр. 9157). Количество, направление и время прихода ранних отражений (до 80 мс) играют большую роль в оценке акустических свойств помещения, определяя такие важные субъективные параметры, как ясность, камерность, ширина источника, баланс и др. (как было показано в работах Лео Беранека и др.). Практически во всех наиболее известных программах по расчету акустики помещений, таких как CATT, ODEON, EASE и др., приводится расчет ранних отражений методами геометрической акустики и дается их изображение в одномерной плоскости. В данной работе приводится метод измерения с помощью четырех капсюльного микрофона (типа Soundfield в B-формате) и специального программного комплекса ‘IRIS’, разработанного фирмой Marshall Day Acoustics, который позволяет в трехмерном виде отображать ранние отражения, показывая их амплитуду, направление и время прихода (рис.1 и рис.2). 
pic_1_560pix.jpg 
Рис.1 – запись ранних отражений с разных направлений
 
pic_2_560pix.jpg 
 
Рис.2  импульсная характеристика в помещении

С использованием этого комплекса был приведен анализ структуры отражений в различных контрольных комнатах, показаны направления прихода отражений от различного оборудования (пультов, мониторов, щитов и пр.). Это дает в руки дизайнеров студий (и других помещений) очень полезный инструмент при их проектировании.
 
Доклад известного английского специалиста Питера Маппа «Моделирование характеристик направленности оратора при измерении разборчивости» (пр. 9156) был посвящен проблемам выбора измерительного громкоговорителя для измерений и расчета разборчивости речи в помещении. Было показано, что громкоговоритель, характеристики направленности которого максимально близки к характеристикам направленности рта, дают различающиеся результаты для коэффициентов разборчивости STI, измеренных с помощью обычного громкоговорителя (рис.3). Поэтому предлагается уточнить требования стандарта IEC 60268-16 по выбору параметров измерительного громкоговорителя. 
 
pic_3_560pix.jpg 
Рис.3 – характеристика направленности для рта (верхняя) и для громкоговорителя (нижняя)
 
В докладе В. Гесса и др. (Фраунгоферовский институт) «Колебательное измерительное движение – миф или магия» (пр.9159) предлагается метод измерения и настройки акустических систем в автомобилях, используя колебательные перемещения микрофона в горизонтальной и вертикальной плоскости. Утверждается, что усредненные АЧХ лучше согласуются с субъективными оценками качества звука в салонах автомобилей. 
 
В английском докладе «Дизайн акустических поглотителей: от моделирования к лабораторному тестированию» (пр. 9158) представлен метод компьютерного моделирования щелевых щитов для поглощения звука, что может использоваться, например, при проектировании студий для обеспечения заданного времени реверберации в определенных частотных диапазонах. Общий вид щита показан на рис.4.
 
pic_4_560pix.jpg 
Рис.4 – вид щита для студии

В докладе «Создание методов для оценки диффузности звукового поля» (пр. 9155) предлагается очень полезная для оценки акустики помещений методика, а именно расчет коэффициента диффузности звукового поля из измеренной моноуральной импульсной характеристики (Sound Field Diffusion Coefficient- SFDC). Поле считается диффузным, если направление прихода отражений в каждую точку поля равновероятно и значение энергии одинаково. Как известно, применение методов статистической теории для расчета времени реверберации, акустического отношения и др. допустимо только в предположении диффузности звукового поля, потому расчет коэффициентов SFDC для разных частотных полос в различных точках поля является очень полезным результатом. Примеры расчета для двух контрольных комнат показаны на рис.5; как видно, абсолютная диффузность поля (SFDC = 1) достигается только на самых низких частотах и в отдельных точках помещения. 
 
pic_5_560pix.jpg 
Рис.5 – зависимость коэффициента диффузности от частоты для разных положений микрофона

На секции «Преобразователи» несколько докладов были посвящены методам проектирования электродинамических громкоговорителей.
 
Доклад известного специалиста В. Клиппеля «Адаптивная стабилизация электродинамических громкоговорителей» (пр. 9116) представил новую технику процессорной обработки входного сигнала громкоговорителя, обеспечивающую стабилизацию положения звуковой катушки в зазоре магнитной цепи. Это очень полезно для практики проектирования, поскольку при больших уровнях сигнала может иметь место постоянное смещение звуковой катушки от середины зазора, что приводит к дополнительным искажениям, особенно для маленьких громкоговорителей, обычно работающих при максимально возможных уровнях громкости. 
 
В докладе А.Войшвилло (JBL) «Идентификация параметров компрессионных драйверов с учетом зависимой от частоты активной площади диафрагмы» (пр. 9164) рассматривается способ расчета параметров рупорных излучателей методом электро-механических аналогий с учетом частотно-зависимой площади диафрагмы.
 
В докладе Н. Антонелло и др. (пр. 9160) описано применение дополнительной звуковой катушки для компенсации модуляции магнитного потока в электродинамических громкоговорителях. 
 
Новая конструкция излучателя Хейла (АМТ – электродинамического громкоговорителя, в котором используется гофрированная диафрагма из помещенной в зазор магнитной цепи пленки с нанесенным проводником, эта конструкция давно известна и широко используется в производстве), была представлена в докладе «Дизайн и конструкция круглого АМТ-громкоговорителя с углом излучения 360 град» (пр. 9163). Общий вид нового громкоговорителя показан на рис.6. 
 
pic_6_560pix.jpg 
Рис.6 – круговой излучатель Хейла

Продолжаются работы по применению нового уникального материала – графена (подробнее о его свойствах было рассказано в предыдущей статье по 136 конгрессу AES) для создания электроакустических преобразователей. На секции был представлен доклад (Университет McGill Канада, пр. 9144), посвященный отработке технологии изготовления диафрагм из графена для ленточных микрофонов.
 
Доклад «Применение MEMS-микрофонов для записи городских шумов» (пр. 9143) представляет результаты большого проекта (в нем участвуют несколько университетов), предполагающий создание карты распределения шумов в Нью-Йоркe. Новизна состоит в выборе сравнительно нового типа микрофонов MEMS. Они представляют собой миниатюрные микрофоны электретного типа на силиконовой подложке и объединены в решетку, что позволяет с помощью соответствующего процессорного управления регулировать ширину и направление характеристики направленности (рис. 7).
 
pic_7_560pix.jpg 
Рис.7 – система MEMS микрофонов

На секции «Запись и воспроизведение звука» было представлено четыре доклада: в докладе «Дуплекс-паннер-сравнительное тестирование и применение техники обогащенного стереопанорамирования для воспроизведения музыки через стереотелефоны» (пр. 9134) рассматривается актуальный вопрос – при воспроизведении через стереотелефоны музыки, записанной для стерео громкоговорителей, звук локализуется в центре головы, поскольку исчезают важные для пространственного воспроизведения признаки, такие как обработка звука ушной раковиной, наличие перекрестных связей и др. В докладе предлагается техника панорамирования, учитывающая, наряду с амплитудным и временным панорамированием (обычно применяемом в стерео), свертку сигнала с передаточными функциями головы HRTF, декорреляцию сигналов и др., что позволяет вынести звуковой образ из головы, получить расширенный стереообраз и существенно улучшить восприятие коммерческой музыки через телефоны. 
 
Второй доклад «Предпочтения слушателей аналоговой или цифровой записи в зависимости от жанра музыки» (пр.9136) представляет результаты экспериментов по оценке качества звука при прослушивании разных жанров музыки. Оказалось, что слушатели предпочитают цифровую запись для классической музыки и аналоговую – для тяжелого рока. Причины, почему это происходит, авторы собираются выяснить в процессе следующих исследований. 
 
В следующем докладе «Влияние акустических условий на предпочтение высоких частот» (пр. 9135) представлены результаты экспериментов по оценке уровня высоких частот в записях в зависимости от условий прослушивания. Показано, что уровень боковых отражений в помещении существенно влияет на оценку необходимого уровня высоких частот, что полезно учитывать при записи. 
 
Наконец, в докладе специалистов из Аальборгского Университета (Финляндия) (пр. 9133) представлено новое микшерное устройство, использующее расположение виртуальных музыкальных инструментов на виртуальной сцене (рис. 8), что позволяет наглядно контролировать процесс микширования. 
 
pic_10_560pix.jpg 
Рис.8 – расположение виртуальных источников при микшировании

На секции «Восприятие» было представлено 13  докладов, несколько из них следует отметить. 
 
Доклад профессора В. Пулкки «Влияние фазы на воспринимаемый уровень низких частот» (пр. 9137), в котором рассматривались результаты слуховых экспериментов со сложными гармоническими сигналами, в которых амплитуды гармоник поддерживались постоянными, а изменялись фазовые соотношения между ними. Оказалось, что это влияет на воспринимаемый уровень громкости низких частот. Такой результат является новым, поскольку раньше считалось, что восприятие громкости зависит только от соотношения амплитуд.
 
В английском докладе «Факторы, влияющие на слушательские предпочтения при компрессии динамического диапазона» (пр. 9176) рассматривается важный для современного вещания вопрос о допустимой компрессии динамического диапазона в передаваемых программах. Показано, что на восприятие допустимой степени компрессии влияет музыкальный жанр, уровень музыкальной культуры, длительность прослушивания и др. Эти исследования могут послужить основой при создании новых стандартов в радиовещании. 
 
Доклад Шон Олив (JBL) «Влияние слушательского опыта, возраста и культуры на предпочтения в качестве звучания стереотелефонов» (пр. 9177) представил результаты экспериментов, проведенных в четырех странах с 238 слушателями. На прослушивание было представлено четыре типа телефонов, из них три коммерческих и один со специально настроенной АЧХ, повторяющей АЧХ-громкоговорителей в помещении прослушивания. Оказалось, что независимо от страны, опыта и возраста, слушатели предпочитали специально настроенный телефон. Из этого следует, что требования современного стандарта к АЧХ-стереотелефонов необходимо корректировать. 
 
Доклад большой группы исследователей из разных стран (Германии, Дании, США, Японии и др.) «Ревизия стандарта ITU-R BS. 1934» (пр. 9172) содержит предложения по ревизии основной процедуры для организации субъективных экспертиз MUSHRA, широко используемой в настоящее время в разных странах, включающей в себя условия для выбора образцов, помещения прослушивания, экспертов, параметров тракта и др.
 
На секции «Применение аудио» было представлено 26 докладов,анализ некоторых из них представлен ниже.
 
В докладе «Автоматизированная система оптимизации звука в автомобиле, использующая бинауральные измерения и параметрические IIR-фильтры» (пр. 9166) предлагается полностью автоматизированная система настройки параметров многоканальных звуковоспроизводящих систем в автомобилях с использованием бинауральных измерений на системе микрофонов, содержащих макет головы и торса (рис. 9), что позволяет не проводить трудоемкой ручной настройки и прослушивания.
 
pic_8_560pix.jpg 
Рис.9 – система «искусственная голова» для измерения в автомобиле

В докладе Роберта Эллиса (пр. 9169) дается подробное описание нового творческого медиа-центра при Гонконгском Университете, предназначенном для обучения студентов, аспирантов и проведения научных работ в области аудиомузыкальных технологий в кино, мультимедийных искусствах и пр. (рис. 10). 
 
pic_9_560pix.jpg
 
Рис.10 – мультимедийный центр в Университете Гонгконга

Центр включает кинотеатр с системой Dolby 7.1, студии звукозаписи, интегрированные с лабораториями цифровых аудиомузыкальных технологий, множество аудиторий, оснащенных компьютерными станциями и системами пространственного звука, театр, сцена которого вмещает симфонический оркестр и пр. Этот центр по уровню оснащения является сейчас самым передовым в азиатском регионе. (Если бы на всю Россию иметь хотя бы один такой центр, насколько бы изменился уровень нашего образования!) 
В докладе известного специалиста в области микрофонной техники М. Вильямса «Дизайн двенадцатиканальной микрофонной системы, совместимой с разными конфигурациями воспроизводящих систем» (пр. 9186) предлагается новая микрофонная система записи, состоящая из двенадцати микрофонов, принципы расположения которых показаны на рис. 11а. 
 
pic_11b_560pix.jpg
 
Рис.11а – система из 12 микрофонов

Оптимальным для этой системы является воспроизведение через 12-канальную систему активных громкоговорителей (рис.11б), однако полученные записи можно воспроизводить и через другие форматы (стерео, четырехканальные, 5.1. и др.) без предварительного процессирования, только за счет выбора соответствующих микрофонных каналов. 
 
pic_11a_560pix.jpg
Рис.11б – система из12 громкоговорителей

Два доклада (пр. 9215, США, и 9217, ЮАР) были посвящены проблемам создания алгоритмов для распознавания жестов и интерфейсов с их использованием. Созданные интерфейсы (рис. 12) позволяют управлять различными треками в записи и выполнять пространственное панорамирование. 
 
pic_12_560pix.jpg 
Рис.12 – управление жестами при микшировании

В докладе Дж. Свободник и др. «Методы мультифизического моделирования процессов в магнитных цепях громкоговорителей» (пр. 9214) представлен метод компьютерного моделирования процессов распределения магнитного поля в магнитных цепях громкоговорителей, позволяющих наглядно увидеть влияние таких процессов как перенасыщение, появление скин-эффекта и др., что очень полезно для практики проектирования громкоговорителей.

На секции «Процессорная обработка аудиосигналов» можно отметить два доклада японских исследователей (пр.9179, пр.9181), посвященных созданию программ в MATLAB для вычисления функций автокорреляции и интерауральной кросс-корреляции звуковых сигналов. В книгах известного акустика Й. Андо («Акустика концертных залов», «Архитектурная акустика», «Аудиовизуальное восприятие» и др.) была предложена теория обработки звуковых сигналов в центральных отделах слуховой системы, основанная на анализе функций кросс-корреляции и автокорреляции, которая лежит в основе восприятия звукового пространства и таких субъективных параметров, как ясность, полнота, интимность и др., принятых в настоящее время в архитектурной акустике. Представленные программы позволяют рассчитать вышеуказанные функции музыкальных и речевых сигналов и их основные параметры, необходимые для субъективной оценки качества звучания в помещении. 
 
В докладе «Модальная архитектура для искусственной реверберации» (пр. 9208) предлагается новый метод создания цифровых ревербераторов с помощью системы фильтров, моделирующих отдельные моды колебаний в помещении. Для этого анализируется спектрограмма импульсной характеристики (рис. 13), выделяются отдельные моды колебаний и рассчитываются параметры соответствующего фильтра.
 
pic_13_560pix.jpg 
Рис.13 – выделение мод колебаний из импульсной характеристики помещения

В докладе «Имитация тембра и адаптация для экспериментальных музыкальных инструментов» (пр. 9196) предлагается алгоритм процессорной обработки, позволяющий анализировать тембры экспериментальных музыкальных инструментов в реальном времени (по анализу их спектрального состава), сравнивать с некоторыми эталонными образцами и корректировать при необходимости.

На секции «Пространственный звук» значительная часть докладов была посвящена проблемам, связанным с бинауральной стереофонией и бинауральным синтезом, что говорит обо все возрастающем интересе к этому направлению пространственного воспроизведения. Обсуждаемые вопросы касались ряда еще недостаточно проработанных проблем.
 
Одна из них – учет индивидуальных особенностей передаточных (или импульсных) функций головы (HRTF или HRIR), поскольку обычно в операциях свертки при бинауральном синтезе используются HRIR, записанные на искусственной голове, а это приводит к определенным ошибкам при локализации. Этому вопросу были посвящены доклады «Аналитическая модель междуушной разницы во времени для индивидуализации произвольных HRIR» (пр. 9131), «Эволюция алгоритмов для возможности применения не-индивидуальных HRTF» (пр. 9153). 
 
Необходимым этапом применения бинаурального синтеза являются измерения передаточных функций стереотелефонов для воспроизведения бинауральных сигналов и их последующая эквализация (выравнивание), эти проблемы рассмотрены в докладах «PHOnA: база данных для измеренных передаточных функций телефонов» (пр. 9126) и «Влияние эквализации телефонов на восприятие расстояния до источника» (пр. 9126).
 
Продолжаются работы по совершенствованию других пространственных систем, в частности многоканальной японской системы 22.2. Этой теме был посвящен доклад «Выбор скорости потока данных для передачи сигналов по 22.2 каналам вещания» (пр. 9096), в котором по результатам субъективных экспертиз на разном музыкальном материале и с разной скоростью передачи данных было предложно значение 1.2 Мбит/с. 
 
В ряде докладов рассмотрены пространственные системы типа Амбисоник и другие с расположением громкоговорителей по высоте, выполнена оценка их качества звучания и даже начата разработка нового стандарта MPEG-H 3D Audio standard, предусматривающего высотное расположение громкоговорителей в пространственных системах (пр. 9109, 9129, 9095, 9154).
 
Наконец, был очень интересный доклад «Полигональный метод панорамирования для 3D-систем громкоговорителей» (пр.9106), в котором предлагался новый метод панорамирования сигналов для пространственных систем звуковоспроизведения с учетом расположения громкоговорителей в горизонтальной и вертикальной плоскости, наряду с широко используемым в настоящее время методом VBAP (векторный метод амплитудного панорамирования). Рассмотрены сравнительные преимущества нового метода.

Впервые на этом Конгрессе работала специальная секция «Образование» (имеется ввиду образование в области аудиотехнологий), на которой было представлено пять докладов, в которых обсуждалась методология преподавания аудиодисциплин с использованием интерактивного кино, средств мультимедиа и др. 
 
Особый интерес представлял доклад В. Мойлана (Массачусетский Университет) «Пути анализа звукозаписей» (пр. 9103), в котором детально обсуждалось, какие именно параметры надо оценивать в процессе слухового анализа фонограмм, как они связаны с музыкальным содержанием и структурой произведения, как организовывать такие прослушивания и как тренировать студентов (думаю, что этот материал будет очень полезен для преподавателей дисциплины «Слуховой анализ» для звукорежиссеров).

На секции «Звук в кино» был всего один доклад, но принципиально нового содержания – доклад Н. Фонсека (Polytechnic Institute of Leiria, Португалия) «Применение теории «Particle Systems (системы частиц) к созданию сложного звукового содержания» (пр. 9132). В нем предлагается методы компьютерной графики, а именно Particle Systems (системы частиц) применить к управлению множеством звуковых источников. В этой системе (например при создании эффектов дождя, снега, огня) пользователь не управляет поведением каждой частицы (рис.14), а работает с управлением всей системой в целом, которая уже сама контролирует движение частиц. 
 
pic_14_560pix.jpg 
Рис.14 – система Particle System для видеографики
 
Эту идею предлагается применить к управлению поведением множественных мнимых источников в системах пространственного звуковоспроизведения. Идея уже нашла применение в системах гранулированного синтеза звука. Автор рассматривает возможности ее применения для таких пространственных систем, как Амбисоник, бинауральный синтез, Dolby Atmos и др. Возможно, эта действительно интересная идея найдет себе много применений.

Наряду с докладами на научной конференции работали три секции, где были представлены Инженерные записки – короткие доклады (в основном стендовые). Таких докладов на конгрессе было 26, тематика докладов касалась звука в кино, в частности системы Dolby Atmos, оборудования студий и лабораторий для учебного процесса (на примере Университета McGill, Канада), системы для идентификации голоса, результатов измерения времени реверберации в соборе и др. 
 
Интересные данные были представлены в сообщении проф. Б. Костек «Измерения и визуализация интенсивности звукового поля вокруг искусственной головы». Поскольку в настоящее время много различных измерений проводится с использованием «искусственной головы», то наглядная информация о том, как изменяется структура звукового поля в присутствии с искусственной головы (в заглушенной камере) представляет существенный интерес. Результаты измерений для частоты 2000 Гц показаны на рис.15.
 
pic_15_560pix.jpg 
Рис.15 – звуковое поле вокруг «искусственной головы» в заглушенной камере

Как и на всех предыдущих конгрессах, были проведены научные семинары (всего десять) под руководством ведущих специалистов, тематика которых касалась следующих вопросов: преподавание мастеринга, как сохранять исторические аналоговые записи, как найти хорошее в акустическом отношении пространство, микрофонные системы для мобильных записей и др. 
 
Кроме того, был проведен 21 учебный семинар, основная их тематика следующая: Дизайн громкоговорителей; Новый стандарт MPEG-H 3D Audio; создание 3D Audio для музыки, фильмов и игр; Создание 3D-звука через стереотелефоны; Все о тембре; Психоакустика для аудиоинженеров; Слушательские тесты – понимание базовых концепций и др.
 
Как обычно на конгрессе проходили многочисленные студенческие мероприятия: соревнования звукозаписей, конкурс студенческих работ, студенческая ассамблея и др. Лучшей научной работой был признан доклад из Университета Нью-Уорка «Дуплекс-паннер» (пр.9134).

 
< Пред.   След. >

inavate-twitter_50.jpg twitter_50.jpg facebook_50_2.jpg

   
 

Advertisement
Advertisement
64132-001_pls_banner_versand_120x240_ru.gif
Яндекс.Метрика