Слух и восприятие звука. Вологдин Э.И.

Элементы психоакустики. Часть 3

Слух и восприятие звука. Вологдин Э.И.
Как ни пытаются ученые выстроить модели слухового анализатора или хотя бы каких-то его подсистем, например той, что отвечает за восприятие громкости, неизбежно возникают противоречия с объективной реальностью, данной нам в слуховых ощущениях. Даже отдельные устоявшиеся, казалось бы, понятия и характеристики трактуются порой не вполне однозначно.

К таким загадочным, многоплановым понятиям относится идея критических полос. А сколько сюрпризов преподносит подсистема объемного восприятия… Попробуем, пусть в общих чертах, осветить эти проблемы.

В первом разделе, рассказывая о конструкции уха, мы упоминали, что тональный сигнал провоцирует формирование в базилярной мембране бегущей волны, причем амплитуда поперечных смещений имеет максимум в некоей точке, положение которой зависит от частоты входного сигнала.

По факту в ответ на тональный стимул возбуждается целый фрагмент мембраны с максимумом смещений в этой самой точке, и задействованными оказывается множество связанных с данным участком нейронных каналов.

Огибающая области возбуждения несимметрична относительно максимума: в направлении к основанию улитки ее характер гораздо более пологий, что, кстати, объясняет несимметричность эффекта маскировки (высокие частоты лучше маскируются низкими).

Понятно, что картина восприятия двух близких по частоте тональных сигналов, когда две области возбуждения в существенной мере пересекаются, и далеко отстоящих друг от друга будет разной. Ширине этого участка мембраны соответствует некоторый частотный интервал, имеющий для психоакустики фундаментальное значение.

Кривые частотной зависимости ширины критических полос Δf в герцах (правые ординаты) и в децибелах 10 lgΔf (левые ординаты) для моноурального (А) и бинаурального (Б) слушания по Флетчеру, бинаурального слушания по Цвиккеру (В). График Г — зависимость от частоты ширины 1/3-октавных полос

Наличие характерных частотных областей или полос заметили, в частности, в психоакустических экспериментах по маскировке тональных сигналов шумом. Допустим, мы пытаемся замаскировать узкополосным шумом с равномерной спектральной плотностью (белый шум, пропущенный через полосовой фильтр) тональный сигнал с частотой, находящейся в центре этой полосы. Тогда мы замечаем, что при увеличении ширины полосы шума (спектральная плотность при этом не меняется) степень маскировки растет — нам приходится повышать амплитуду маскируемого тонального сигнала, чтобы его расслышать. Однако когда ширина шумовой полосы становится больше определенного значения, маскировка перестает усиливаться. Да, громкость шума растет, но это не влияет на заметность маскируемого тонального сигнала на его фоне. Это предельное значение полосы Флетчер назвал «критической полосой слуха». При этом он полагал, что сигнал перестает быть заметным на фоне шума, когда мощности сигнала и шума в критической полосе сравняются. Таким образом, зная, какова величина смещения порога слышимости в условиях широкополосного белого шума для тонального сигнала любой частоты, мы легко можем вычислить соответствующие критические полосы. Однако Цвиккер показал, что для различения тона его мощность должна быть меньше суммарной мощности шума, и критические полосы Цвиккера оказались существенно шире, чем у Флетчера. Ширина критических полос меняется с частотой; по Цвиккеру, на низких частотах вплоть до 500 Гц она примерно постоянна и составляет около 100 Гц, далее — около 20% значения частоты. То есть выше 500 Гц ширина критической полосы пропорциональна частоте.

В некоторых случаях одни звуки маскируются другими, более громкими. Например, во время поездки в автобусе можно не слышать речи собеседника, если мотор работает очень громко. Этот феномен называется маскировкой

В пределах критической полосы громкость сигнала остается неизменной при расширении его спектра и при неизменности его мощности. Но как только ширина полосы сигнала превышает критическую, громкость начинает расти. При формировании ощущения громкости сложного сигнала его мощность суммируется в пределах критической полосы, и результирующая громкость оценивается по этой сумме. Если те же сигналы попали в разные (но не сильно удаленные друг от друга) критические полосы, суммируется их громкость. Это совсем не одно и то же: если два разных узкополосных шумовых сигнала с одинаковыми уровнями попали в одну критическую полосу, то итоговый уровень будет на 3 дБ больше уровня суммируемых. А если два сигнала с равными амплитудами попали в разные полосы (недалеко от 1 кГц), то суммарная громкость будет в два раза больше громкости каждого из них. Напомним, что для удвоения громкости сигнала надо повысить его уровень на 10 дБ (а не на 3 дБ). Весь слуховой диапазон может быть разделен на 24 примыкающие друг к другу граничными частотами критические полосы. В этой связи введена новая частотная шкала, отградуированная в барках (в честь известного ученого Баркхаузена, который ввел единицу измерения уровня громкости «фон»). Таким образом, частотный диапазон слуха делится на 24 барка. Но это не нужно понимать таким образом, что слуховой анализатор можно представить в виде системы из 24 полосовых фильтров. Для каждой частоты слухового диапазона существует своя критическая полоса, свой фильтр, в котором интегрируется мощность звукового стимула, преобразованного в смещения базилярной мембраны. Но отсюда опять же не следует, что слуховая система — это фиксированный набор пусть и большого количества фильтров. Мы вынуждены согласиться с мнением Уоткинсона, что при моделировании слуховой системы необходимо рассматривать реальные движения базилярной мембраны, спровоцированные звуковым стимулом.

Зависимость громкости сигнала от его ширины полосы с центральной частотой 1 кГц и при неизменном уровне звукового давления 60 дБ

Критические полосы можно обнаружить и иным способом. Предъявляя слушателю одновременно два тональных сигнала, в разной мере отличающихся по частоте, ему предлагают сравнить ощущения. Когда частоты сигналов совпадают (сигналы звучат в унисон), имеет место полный консонанс. Если частота одного из сигналов начинает повышаться (или понижаться), то возникает явление биений, которые особенно хорошо слышны при равенстве амплитуд двух сигналов. Напомним, биения — модулированный по амплитуде сигнал с несущей частотой, равной среднеарифметической для двух сигналов и с разностной частотой огибающей. Глубина модуляции определяется соотношением амплитуд двух сигналов; если амплитуды равны, глубина модуляции равняется удвоенной амплитуде сигналов. Для большинства слушателей биения ощущаются при разнице частот сигналов меньше 12,5 Гц. При увеличении разности больше чем на 15 Гц слушатель продолжает воспринимать два сигнала как один, но как бы размытый шероховатый звук. При дальнейшем увеличении дистанции наступает момент, когда начинают различаться оба сигнала, но воспринимаются они как крайне диссонансные. Диссонанс переходит в консонанс, когда второй сигнал (частота которого меняется) покидает пределы критической полосы. В этой связи уместно вспомнить определение критической полосы, данное Шарфом: «Критическая — это такая полоса, в пределах которой слуховые ощущения довольно резко меняются». Поскольку базилярную мембрану правомерно рассматривать как резонансную систему, то ее отклик на звуковое раздражение имеет время как нарастания, так и спада. Отсюда, в свою очередь, как минимум следует, что громкость коротких звуков зависит от их длительности. Для тональных импульсов, длительность которых превышает 200 мс, порог слышимости в тишине совпадает с порогом слышимости длительного тонального воздействия. Для более коротких импульсов порог повышается. Чтобы услышать сигнал длительностью, скажем, 20 мс, его уровень должен быть на 10 дБ выше порогового значения для непрерывного сигнала. При невысоких уровнях громкость тональных импульсов растет с повышением длительности также приблизительно до 200 мс, когда она становится равной громкости протяженного во времени сигнала. Например, звук длительностью 1 мс на 22 фона тише непрерывного тона той же частоты и амплитуды, а при достижении 10 мс — приблизительно на 12 фон. Зависимость громкости от длительности сигнала меняется с повышением уровня. Так, для высоких уровней громкость перестает меняться при длительности, превышающей 70—100 мс.

Зависимость громкости тонального сигнала от его длительности. По оси ординат отложена разность громкости короткого сигнала и непрерывного тона той же амплитуды

Для узкополосных шумовых импульсов (с шириной полосы меньше критической) зависимость громкости от длительности та же, что и для тональных импульсов. Для широкополосных шумовых импульсов установление громкости происходит уже после 50 мс, то есть у шумовых импульсов длительностью больше 50 мс она совпадает с громкостью непрерывного шума. При уменьшении длительности в 10 раз — до 5 мс — порог слышимости повышается не на 10 дБ, как в случае тонального импульса, а на 7 дБ. Становится понятным, почему звук выстрела из «калашникова» не вызывает болевых ощущений: при амплитуде звукового давления около 140 дБ его длительность составляет всего несколько миллисекунд. Однако следует иметь в виду, что адаптационные механизмы слуха тоже инертны и не всегда успевают включаться при коротком одиночном воздействии. Поэтому импульсные сигналы большой амплитуды представляют особую опасность для здоровья слуховой системы. Наличие двух ушей позволяет нам ориентироваться в звуковом пространстве, локализуя различные источники звука. Эта способность называется бинауральным эффектом. Для локализации по крайней мере в горизонтальной плоскости логично предположить наличие двух механизмов. Первый из них связан с оценкой слуховой системой разности времени прибытия сигнала от источника к одному и ко второму уху. Второй — с оценкой разности интенсивности сигнала у разных ушей. Можно добавить смешанный механизм — когда слуховая система оценивает изменения спектра сигнала.

Зависимость разности времени прибытия сигнала к левому и правому уху от угла (в горизонтальной плоскости) между медианной плоскостью и направлением на источник

Если принять, что диаметр головы равен 18 см, то кратчайшее расстояние от уха до уха составит 26 см. Стало быть, максимальная разница времени прибытия звукового сигнала (в случае расположения источника строго напротив одного из ушей) составит 673 мкс (0,000673 с). Соответственно, при положении источника точно напротив человека она будет равна нулю. При всей ничтожности этой величины именно временной сдвиг является основным механизмом для определения положения источника на низких частотах. Обратим внимание на то, что максимальная разница (источник напротив правого или левого уха) во времени прибытия сигнала с частотой 743 Гц к разным ушам совпадает с половиной его периода, и, таким образом, во временном механизме локализации возникает сбой — он (механизм) не видит никакой разницы между двумя сигналами. Ясно, что с повышением частоты фазовая неопределенность возрастает. Это некритично: на таких частотах начинает эффективно работать механизм локализации, улавливающий разницу в интенсивности. Естественно, что перепад интенсивности максимален, когда источник расположен напротив одного из ушей — в этом случае противоположное ухо находится в зоне тени головы. Также понятно, что с повышением частоты перепад интенсивности выше — дифракция на низких частотах (когда длина волны превышает размеры головы) практически сводит этот эффект на нет. На высоких же частотах (выше 5 кГц) соответствующая разница в уровнях может превышать 20 дБ. Известно, что наибольшее число ошибок при определении местоположения источника происходит в диапазоне частот 2—4 кГц, что, возможно, связано со сменой механизмов локализации, приходящейся на эту область. С повышением и понижением частоты (относительно указанного участка) качество оценок растет. Казалось бы, что все более эффективная работа временного механизма на низких частотах должна привести к отличному угловому разрешению на басах, а увеличение разности интенсивности на ушах, которое неизбежно происходит с повышением частоты, — к прекрасной локализации у верхней границы слухового диапазона. Тем не менее источники басов (ниже 150 Гц) вообще не поддаются локализации, а источники тональных сигналов выше 8 кГц локализуются с большим трудом.

Зависимость разности в уровнях сигналов у правого и левого ушей от угла (в горизонтальной плоскости) между медианной плоскостью и направлением на источник для сигналов разной частоты

Если источник сигнала находится напротив слушателя, то в тепличных экспериментальных условия можно обнаружить изменение его положения в горизонтальной плоскости всего на 2°. Если же источник находится справа или слева от слушателя, то образуется так называемый конус неопределенности, в пределах которого мы вообще не замечаем его перемещений. Надо упомянуть, что излучатели спектрально сложных звуков (щелчки, речь и т. п.) поддаются локализации лучше, чем излучатели чистых тональных сигналов. Вообще же в обычных условиях слух замечает угловое перемещение источника в горизонтальной плоскости на 3—4°, а точность локализации (определения направления на источник) составляет около 12°. Гораздо хуже обстоит дело с локализацией по вертикали. Направление прихода звуковых волн определяется в этом случае с точностью не более 20°. Такой же показатель получается и при одноухом слушании, что, в частности, свидетельствует о высокой роли строения ушной раковины в ориентации по вертикали. Локализация по глубине в условиях заглушенной камеры, как правило, выходит невысокой. Весь сложный аппарат локализации привязывается только к изменению амплитуды сигнала удаляющегося или приближающегося источника. Разностные механизмы здесь не помогают. Вместе с тем в обычных помещениях, в концертных залах чувствительность к глубине сильно возрастает, поскольку появляются многочисленные отражения и к делу подключается бинауральный процессор. То есть стрелять в цель на слух можно, но только с очень небольшого расстояния и заведомо зная высоту цели. И еще: попробуйте определить координаты соловья… Данная особенность слухового восприятия была детально изучена немецким ученым Хаасом и описана в его докторской (PhD) диссертации в 1949 году. И хотя об этом эффекте знали и ранее, свое имя он приобрел после того, как в 1972 году был опубликован английский перевод диссертации. Эффект является причудливым следствием одновременного существования двух механизмов локализации. Хаас выполнил следующий эксперимент. Чтобы свести к минимуму роль отражений, опыт проводился на свежем воздухе на крыше лабораторного корпуса. Перед испытуемым на расстоянии 3 м была установлена пара громкоговорителей, разнесенная по отношению к слушателю на 45°. На каждый громкоговоритель подавался одинаковый, равный по амплитуде речевой сигнал. В воспроизводящую цепь одного из громкоговорителей была введена линия задержки. Если время прихода сигнала одно и то же, то звуковой образ располагается где-то по центру между колонками. При введении задержки фокус начинает смещаться в направлении громкоговорителя, сигнал с которого приходит раньше. Когда задержка достигает 0,6—1 мс, положение образа совпадает с положением громкоговорителя, звук с которого приходит с опережением. В интервале задержек 0—1 мс говорят о суммирующей локализации, которую используют в стереофонии для создания образов, локализуемых в пространстве между правым и левым громкоговорителями. При дальнейшем увеличении задержки вплоть до 30 мс образ сохраняет единство и его положение совпадает с источником опережающего звука. В диапазоне задержек от 1 до 30 мс мы имеем дело с эффектом предшествования. Когда задержка начинает превышать 30 мс, слушатель постепенно осознает наличие второго образа, положение которого совпадает с положением громкоговорителя с задержкой, однако сигнал из первого громкоговорителя продолжает доминировать. После 50 мс звук запаздывающей системы воспринимается как эхо. Не следует думать, что эффект предшествования обусловлен маскировкой запаздывающего сигнала опережающим. Все задержанные звуки воспринимаются слуховой системой, оказывают влияние на тембр, громкость… Просто мы не ощущаем задержанный и опережающий звуки как пространственно разделенные события. И локализованы они в зоне излучения опережающего сигнала. Оказывается, для того чтобы заставить слушателя «увидеть» источник задержанного сигнала (в интервале задержек 1—30 мс), нужно повысить его уровень на 10—12 дБ. То есть задержанный сигнал должен быть в два раза громче незадержанного. Разумеется, описанные эффекты существенно зависят от характера сигналов, соотношения их интенсивностей. Совершенно очевидно огромное значение эффекта Хааса для архитектурной акустики. Ведь в помещении слушатель имеет дело как с прямыми, так и с отраженными сигналами, которые правомерно рассматривать в контексте данного эксперимента. На этом мы завершаем наше трехчастное введение в психоакустику. Не будем обольщаться: то, что удалось осветить, — лишь самая вершина айсберга очень непростой и весьма увлекательной науки. Нетривиальной, как и все области знания, связанные с изучением человеческого восприятия. Здесь особенно четко осознаешь тезис о бесконечности движения к истине. Но у нас столько времени нет, пора применять имеющиеся знания в архитектурной акустике.

Алексей Тихонов, кандидат физ.-мат. наук, генеральный директор компании Home Cinema Hall

Популярные статьи

Источник: https://www.hi-fi.ru/magazine/audio/elementy-psikhoakustiki-chast-3/

Область слухового восприятия человека

Слух и восприятие звука. Вологдин Э.И.

Область слухового восприятия человека довольно обширна. Но какова же эта область, какие её особенности и что ещё важно знать и учитывать при прослушивании своих проектов? Рассмотрим в этой статье.

Область слухового восприятия

У обычного, скажем, среднестатистического нормально слышащего человека область восприятия ограничена по частоте и силе звука.

Частотный диапазон находиться в районе от 20 Гц до 20 000 Гц (в некоторых книгах указывается даже от 16 Гц до 25 000 Гц).

Кстати,  для сравнения у многих животных диапазон, особенно на высоких частотах намного выше. Например, собаки и кошки слышат до 60000 Гц, а дельфины до 100000 Гц

По силе звука (динамическому диапазону) предел громкости доходит до 120 — 140 Дб.

Диапазоны

Условно область слухового восприятия можно разделить на три области: 20…300 Гц — низкая; 300…3000 Гц — средняя; 3000…20000 Гц — высокая.

Чувствительность слуха

Наибольшая степень чувствительности находится в диапазоне от 1000 до 3000 Гц. Чем выше или ниже от этого диапазона чувствительность начинает падать. Причем в области самых низких и высоких звуков наблюдается очень резкое её падение.

Кроме этого с возрастом чувствительность существенно меняется. Наибольшая она у 15—20-летних. Затем она постепенно снижается. Например, область наибольшей чувствительности до 40-летнего возраста находится около 3000 Гц, от 40 до 60 лет — около 2000 Гц, а старше 60 лет — около 1000 Гц.

Порог слышимости

Едва ощущаемое звучание минимальной силы звука называется порогом слышимости. Чем меньше необходимо звуковой энергии для того чтобы услышать звук, тем выше чувствительность уха.

Как мы говорили выше, в области 1000-3000 Гц находиться наибольшая степень чувствительности. Поэтому порог слухового восприятия в данной области наиболее низкий.

Естественно, что в других областях (более низких и высоких) порог повышается.

В международном стандарте ISO/R-226 значится следующие значения порогов слышимости (слушатели в возрасте от 18 до 30лет):

На рисунке нижняя  кривая изображает порог слышимости (ниже его мы уже не слышим звук). А верхняя кривая это болевой порог (при нем мы уже начинаем ощущать боль в ушах).

Область восприятия музыки

Основная энергия области слухового восприятия музыки находится в частотной области от 40 до 5000 Гц, а по уровню давления от 40 до 100 дБ. С возрастом, конечно, эта область восприятия звуков уменьшается и начинает терять яркость (уменьшается восприятие верхнего частотного диапазона). Однако, это в целом абсолютно не влияет на прослушивание музыки в любом возрасте.

Область восприятия речи

Что касается речи, то основная энергия области её слухового восприятия находится по частоте от 500 до 600 Гц и по силе от 50 до 90 дБ.

Для звукорежиссера при обработке речи (в том числе и вокала) важно знать следующее, что согласные с, з, ц, содержат частоты намного выше вплоть до 8600 Гц. А как их редактировать можно прочитать здесь.

Динамический диапазон тихого шепота равен 10—15 дБ, а громкой речи 25 дБ. Это означает, что некоторые особенно глухие согласные можно полноценно различить при условии сохранности не только частоты, но и интенсивности звука.

Абсолютный порог слышимости

Он зависит от длительности сигнала. Чтобы слух смог определить высоту тона, ему требуется определённое время воздействия. Например, для 50 Гц это 60 мс, для 1000 Гц и выше от 10 мс. Не удивительно, что высоту тона, например, в ударной установки определить очень сложно. А если звук совсем короткий, то он воспринимается как щелчок (подробнее).

На рисунке можно увидеть как зависит интенсивность (в Дб — вертикаль) и длительность воздействия (в мс горизонталь). Если длительность меньше 250 мс, то пороги возрастают, если больше 250 мс, то они стабилизируются. (рисунок взят их книги И. Алдошиной «Основы психоакустики»)

Разностный порог

Этот порог показывает нам ту разницу, при которой мы чувствуем прирост или ослабление частоты звука по сравнению с первоначальным.

  • Разностный порог по частоте:

В диапазоне от 500 до 5000 Гц он равен 0,003. Это означает, что изменение частоты в этом диапазоне на 3 Гц воспринимается слухом как другой звук (например, 2000 и 2003 Гц).

  • Разностный порог по силе звука:

Минимальный прирост силы звука заметный для слуха в среднем равен 0,1—0,12. Это означает, что наш слух ощущает разницу в громкости, если его усилить на 0,1 первоначальной величины, или на 1 дБ.

Но подробнее о дБ и громкости звука мы поговорим в отдельной статье.

Если нравятся наши статьи, подписывайтесь на RSS!  И поделись статьей со своим другом! Не ленитесь!

Если у вас есть, что добавить по теме, не стесняйтесь.

Share on Tweet Подписаться Share Share Share Share Share

Источник: https://nssound.ru/o-zvuke-i-zvukovykh-signalakh/oblast-sluhovogo-vosprijatija-cheloveka/

Biz-books
Добавить комментарий