Слуховые аппараты с повышенной разборчивостью речи. Снижение и потеря слуха

УДК 534.773

И.В. ПРАСОЛ, канд. техн. наук, ХНУРЭ (г. Харьков),

А.С. НЕЧИПОРЕНКО, ХНУРЭ (г. Харьков)

СПОСОБ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ У БОЛЬНЫХ

НЕЙРОСЕНСОРНОЙ ТУГОУХОСТЬЮ

Запропоновано новий спосіб підвищення розбірливості мови у хворих на нейросенсорну тугоухість, який базується на фільтрації мовного сигналу. В результаті фільтрації відбувається відокремлення найбільш значущих областей мовного спектру, що впливають на сприйняття мови хворим. Даний спосіб дозволяє поліпшити сприйняття мови у хворих з втратою чутності у діапазоні частот вище 1 кГц.

A new method to improve phrase intelligibility of people sick neurosurgery sensory hearing loss is suggested. It is based on the filtering voice. As a result of the filtering the most significant areas of speech spectrum which affect on speech perception patients are detected. This method helps improve the perception of speech of patients with hearing loss in the range above 1 kHz.

Постановка проблемы. В настоящее время всё большее число людей страдают нарушениями слуха. Причины снижения слуха могут быть разными, это и длительное воздействие чрезмерного шума, и общее ухудшение экологии, и осложнения после перенесенных болезней, травмы, генетические нарушения. Среди патологий слуховой системы лидирует нейросенсорная тугоухость, - ослабление слуха с сохранившимся восприятием речи, обусловленное поражением звуковоспринимающего аппарата или центрального отдела слухового анализатора. Она может быть следствием поражения как нейросенсорных эпителиальных клеток спирального органа, так и подкорковых, и корковых слуховых центров . Однако чаще всего нейросенсорная тугоухость обусловлена патологией рецептора и корешка преддверно-улиткового нерва. Данное заболевание не излечимо хирургическим путем, поэтому больному назначают слухопротезирование. Слуховой аппарат должен скорректировать индивидуальные особенности слуха, характерные для данного вида патологии . Для этих целей существует ряд алгоритмов обработки звука, реализованных в аналоговых слуховых аппаратах. Это алгоритмы частотно зависимого усиления, амплитудной компрессии, фильтрации помех. Однако реализация сложных алгоритмов обработки речевых сигналов, адаптируемых к индивидуальному характеру потерь слуха у пациентов, возможна только в цифровых слуховых аппаратах . Цифровая обработка сигналов позволяет применять высокоэффективные адаптивные алгоритмы с возможностью индивидуальной настройки параметров при неизменном аппаратном ядре.

Анализ литературы. Проведен анализ методов цифровой обработки сигналов . Изучены особенности восприятия речевого сигнала, существующие методы выделения формант из его спектра , а также методы

обработки речевого сигнала, позволяющие повысить разборчивость сигнала как для пациентов с нормальным слухом, так и для слабослышащих пациентов с диагнозом нейросенсорная тугоухость . Однако существующие методы повышения разборчивости речи не учитывают такую особенность нейросенсорной патологии как потеря слышимости в диапазоне свыше 1 кГц. Формантный анализ не использовался для создания адаптивных алгоритмов повышения словесной разборчивости.

Цель данной статьи - разработать способ повышения разборчивости речи у больных нейросенсорной тугоухостью.

Разборчивость речи у больных нейросенсорной тугоухостью.

Известно, что нейросенсорная тугоухость характеризуется повышением порогов слышимости, а также ухудшением слышимости в диапазоне свыше 1 кГц, что, в свою очередь, приводит к потере восприятия у таких больных высокочастотных компонент речи. Следствием такого ограниченного восприятия является значительное ухудшение разборчивости речи. Причина этого кроется в особенности локализации звуков речевого сигнала, а именно: согласные звуки в большинстве своём находятся в области частот выше 1 кГц, а гласные - в низкочастотном диапазоне. Поскольку на разборчивость речи преимущественно влияет восприятие согласных, то оставшийся речевой спектр из-за превалирования в нём гласных звуков становится нечётким и трудным для понимания. Исходя из вышесказанного, предлагается улучшить разборчивость речевого сигнала путём увеличения чёткости за счёт удаления частей спектра.

Особенности восприятия речевого сигнала. Любой речевой сигнал состоит из простейших звуков речи, называемых фонемами . Известно, что каждой фонеме соответствует своя форма голосового тракта человека, которая варьируется в соответствии с изменением положения языка, губ, зубов, в зависимости от этого меняются и частоты голосового тракта, в том числе и резонансные. Области спектральных максимумов речевого сигнала, соответствующие резонансным частотам голосового тракта, называются формантами. Форманта характеризуется частотой, шириной и амплитудой . Распознавание фонем базируется на восприятии формант как наиболее информативных признаков речевого сигнала. Также следует отметить, что распознавание каждой фонемы происходит в основном по положению первых двух формант. Учитывая данные факторы, а также такую особенность больных нейросенсорной тугоухостью как снижение частотной селективности, предлагается удалить из речевого спектра области, граничащие с формантными полосами.

Фильтрация речевого сигнала. В ходе эксперимента обрабатывалось несколько различных сигналов разных дикторов. Речевой сигнал преобразовывался в цифровой код и обрабатывался на ЭВМ. Для

идентификации формантных пиков гласных был использован программный пакет «Cool Edit Pro» , который позволяет проводить спектральный анализ речевого сигнала. Для получения спектральной характеристики аналогового сигнала, представленного в дискретной форме было использовано быстрое преобразование Фурье (БПФ), результатом которого является представление сигнала в виде набора из n частот

F = {F1,F2,...,Fn }. (1)

Влияние шумовых источников на речевой сигнал может привести к образованию пиков моментального спектра, не являющихся частью речевого сигнала. Такие пики называются ложными .

Определим пик как максимум интенсивности энергии сигнала в определенном интервале d на оси частот и выразим функцию P(Fk, d) проверки максимума в интервале d следующим образом:

Г1, при A, > max Л, k Ф j,

I к к-d

P(Fk, d) = \ j (2)

10, при Ak < ІШХ Aj , k ф j.

^ k-d

Тогда нахождение всех пиков сведется к нахождению частот разложения F є F, для которых выполняется условие P(F, d) = 1. Данный способ нахождения пиков называют последовательным проходом.

Поскольку наибольшее влияние на распознавание речевого сигнала оказывают первые две форманты, осуществляем фильтрацию формантных областей первых двух пиков. На рис. 1 изображен моментальный спектр

сигнала (одна выделенная форманта) до фильтрации. На рис. 2 изображен

моментальный спектр после фильтрации. Фильтрация производилась по формулам:

Fa = Fk - mx2 1 , (3)

F = F + _2--------maxL (4)

A b i max 1 2 ’ ^"

где Fa, F1, Fb, F2 - границы формантных областей подлежащих удалению; Fmax - пиковая частота форманты.

F = F + F 2 F max (4)

В результате фильтрации происходит выделение наиболее значимых областей речевого спектра, а также уменьшение маскировки нижних граничных частот последующих полос, оставшихся формантными полосами.

Для создания необходимых фильтров был проведен частотный анализ гласных и согласных звуков. Спектральная огибающая содержит большое число пиков отдельных частот, однако большая их часть неинформативна и находится в области выше 1 500 Гц. Основную речевую информацию несут в

себе пики с относительно большой амплитудой в диапазоне 70 Гц - 900 Гц . На рис. 3 представлен спектр звука "Е", где отчётливо различимы формантные пики в данном диапазоне.

Рис. 2. Формантная линия после фильтрации

Рис. 3. Спектр звука "Е" до фильтрации 163

Рис. 4. Спектр звука "Е" после фильтрации

Удаление частотных полос осуществлялось с помощью фильтров, которые создавались в опции меню РБТ-фильтр, согласно расчётным данным. В результате получена спектральная характеристика сигнала, представленная на рис. 4, откуда можно сделать вывод о сужении формантных областей, а также об увеличении амплитуды сигнала в области первых двух формантных пиков.

На рис. 5 - 8 представлены спектральные характеристики звуков Ж, Б до и после фильтрации.

Рис. 5. Спектр звука "Ж" до фильтрации 164

Таким образом проводилась обработка каждого звука всей речевой последовательности. Поскольку падение кривой слышимости у больных нейросенсорной тугоухостью начинается с 1кГц, на спектр также накладывался фильтр, отсекающий частоты выше 1кГц.

Рис. 6. Спектр звука "Ж" после фильтрации

Рис. 7. Спектр звука "Б" до фильтрации

Рис. 8. Спектр звука "Б" после фильтрации

Оценка влияния предлагаемого способа обработки на восприятие

речи. Для оценки влияния предлагаемого способа обработки на восприятие речевого сигнала группе больных нейросенсорной тугоухостью из 20 человек было предложено прослушать и сравнить два сигнала: исходный и прошедший предварительную обработку. Все больные имели опыт пользования слуховыми аппаратами в течение ряда лет. Следует отметить, что больные обладали невысокой исходной разборчивостью речи (менее 51%). Для оценки разборчивости были использованы речевые таблицы многосложных слов Гринберга, учитывающие фонетические особенности, характерные для русской речи . Выходной сигнал не подвергался никаким дополнительным преобразованиям, кроме регулировки громкости для комфортного восприятия конкретным пациентом. Результаты исследования для 6 человек приведены в таблице.

Результаты исследования

Испытуемые с диагнозом нейросенсорная тугоухость Разборчивость исходного речевого сигнала (%) Разборчивость обработанного речевого сигнала (%)

Степень тугоухости Возраст испытуемого

Выводы. Анализируя полученные данные можно сделать вывод о повышении разборчивости речи у больных в пределах 5 - 18 %. Результаты исследования для остальных пациентов аналогичны, значения разборчивости находятся в пределах вышеуказанного диапазона. Следовательно, в результате фильтрации частотных полос спектра, граничащих с формантами, увеличивается чёткость речевого сигнала. Выделение наиболее информативных областей спектра способствует улучшению восприятия речевой последовательности, речь становится более внятной и понимаемой. Использование предлагаемого способа обработки речевого сигнала позволяет достоверно повысить разборчивость речевого сигнала у больных нейросенсорной тугоухостью. Таким образом, это открывает возможность создания адаптивного алгоритма повышения словесной разборчивости.

Список литературы: 1. Нейман Л.В., Богомильский М.Р. Анатомия, физиология и патология органов слуха и речи. - "Владос", 2001. - 224 с. 2. Прасол И.В., Кобылинский А.В. Методика оптимизации цифровых схем биомедицинских устройств // Прикладная радиоэлектроника. - 2007. -Т. 6. - № 1. - С. 51-55. 3. Прасол И.В., Кобылинский А.В. Алгоритмы проектирования адаптивных цифровых слуховых аппаратов / 7-я научно-техническая конференция "Медикотехнические технологии на страже здоровья". Сборник научных трудов. - М.: МГТУ им. Н.Э. Баумана, 2005. - С. 54-56. 4. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. - М.: Мир, 1978. - 848 с. 5. Гельфанд С.А. Слух: Введение в психологическую и физиологическую акустику. - М.: Медицина, 1984. 6. Петров С.М. Полосовая фильтрация речевого сигнала - восприятие речи в норме и при нейросенсорной тугоухости // Вестник оториноларингологии. - 2000. - N° 3. - С. 55-56. 7. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981. - 496 с. 8. ttp://www.adobe.com/special/ products/audition/syntrillium.html. 9. Сердюков В.Д. Опознавание речевых сигналов на фоне мешающих факторов. - Тбилиси: Наука, 1987. - 142 с. 10. Чистович Л.А., Венцов А.В., ГранстремМ.П. Физиология речи. Восприятие речи человеком. - Л.: Наука, 1976. - 388 с. 11. Джеймс Л. Фланаган Анализ, синтез и восприятие речи. - М.: Связь, 1968. - 396 с.

се мы не раз оказывались в ситуации, когда различные шумовые помехи настолько мешали разговору, что слова собеседника становились совершенно неразборчивыми. А если проводить в таких условиях видеосъемку, то речь, звучащая в кадре, станет абсолютно непонятной, поскольку исчезнет и визуальный контакт с собеседником.

К сожалению, оставляет желать лучшего и качество речи при передаче ее через Интернет. В этом может убедиться любой, кто воспользуется одной из существующих коммуникационных программ для передачи голоса через IP на базе, например, протоколов Н.323. При этом принципиального улучшения качества передачи речи при существующих методах маршрутизации в Интернете ждать не приходиться, ведь до сих пор считалось, что круг пользователей такой связи весьма ограничен. Казалось, что это могло заинтересовать лишь индивидуальных владельцев персональных компьютеров, жаждущих доступного по цене общения со своими друзьями на другом конце света, или корпоративных пользователей, пытающихся максимально удешевить связь между офисами в разных городах. Но если делать Интернет-телефонию общедоступной услугой, за которую можно взымать деньги, то, естественно, необходимо повышать качество связи, которое она обеспечивает.

Разборчивость речи

то же такое разборчивость речи? В принципе, разборчивость является некоторой интегральной оценкой речевого сигнала и в соответствии с международным стандартом ISO/TR 4870 определяется как «степень, с которой речь может быть понята (расшифрована) слушателями». Под этим понимается степень, с которой слушатели могут понять смысл фразы, идентифицировать слова, слоги и фонемы. В соответствии с этим различают различные виды разборчивости: фонемная, слоговая, словесная и фразовая, которые, однако, все тесно связаны друг с другом и могут быть пересчитаны одна в другую.

Однако подобное определение субъективно и предполагает организацию некой экспертизы. Для определения разборчивости, в частности при оценке акустических свойств аудиторий, театральных, концертных залов, студий и других помещений, на практике используются различные методы и стандарты: ГОСТ 25902-83, ГОСТ 51061-97, ANSI S3.2 и др. Но все они предлагают довольно сложные, длительные и дорогостоящие процедуры, а объективные методы определения разборчивости, позволяющие получить быстрые и автоматизированные оценки, которые хорошо совпадают с субъективными экспертизами, пока еще разработаны недостаточно, хотя работа ведется уже на протяжении многих лет.

В настоящее время разработано большое количество таких методов: AI (Articulation Index) - индекс артикуляции; %ALcons (Percentage Articulation Loss of Consonants) - процент артикуляционных потерь согласных; STI (Speech Transmission Index) - индекс передачи речи; RASTI (Rapid Speech Transmission Index) - быстрый индекс передачи речи; SII (Speech Intelligibility Index) - индекс разборчивости речи и многие другие, соответствующие стандартам ISO/TR-4870, ANSI S3.2, S3.5; IEC 268-16 и пр.

Так, например, один из критериев, регламентированный международными нормативными документами, представляет собой безразмерный коэффициент, который может изменяться от 0 до 1. При этом его значения соотносятся с субъективной оценкой разборчивости речи в соответствии со следующей стандартизованной зависимостью:

Для расчетов разборчивости выбирается частотная полоса речевого сигнала в диапазоне от 150 до 7000 Гц (или с запасом - от 125 до 8000 Гц), поскольку внутри этой полосы располагаются практически все гласные и согласные русской речи. Как видите, речевой сигнал в этом случае достаточно широкополосный для того, чтобы различные помехи смогли внести свой негативный вклад в понижение разборчивости. При этом основная энергия согласных звуков сосредоточена вокруг 2000 Гц, из-за чего в результате маскировки шумом примерно на такой частоте значительно уменьшается вероятность восприятия (отметим также, что согласные звуки ниже по уровню и поэтому пропадают быстрее), а следовательно, падает уровень разборчивости речи. Интересно отметить, что при потере почти половины звуковой разборчивости слоговая разборчивость сохраняется на уровне 80%, то есть речь обладает достаточным запасом в плане информационной избыточности.

Как показывает анализ, речевой сигнал можно приближенно рассматривать как некоторый широкополосный сигнал, модулированный другим сигналом с низкой частотой. Частота модуляции определяется скоростью, с которой человек произносит фразы, то есть скоростью артикуляции. Эксперименты показали, что частоты модуляции обычной речи лежат в диапазоне от 0,63 до 16 Гц, причем наиболее вероятные частоты модуляции находятся в области 5-7 Гц. Соответственно уменьшение глубины модуляции делает речевой сигнал более похожим на шумовой, а потому приводит к уменьшению его разборчивости. При прохождении речевого сигнала через любой тракт передачи, с учетом искажений и шумов, происходит снижение разборчивости сигнала, что может быть оценено по степени уменьшения глубины его модуляции (изменения формы огибающей сигнала).

Как решают эту проблему профессионалы

адо сказать, что профессионалы стараются вообще не связываться с неразборчивой речью и предпочитают сразу записывать чистый звук - либо отдельно, либо при помощи специальных узко направленных микрофонов.

В результате длительных поисков оборудования, хоть как-то подходящего для решения проблемы повышения разборчивости уже записанной речи, автору удалось обнаружить лишь безумно дорогое устройство полосового обесшумливания фирмы Dolby Laboratories, именуемое Cat. No. 43 (просьба не путать с устройствами шумопонижения той же фирмы).

Действительно, из, казалось бы, широкополосного речевого спектра можно выделить частотные полосы, в которых имеются максимумы акустической энергии от речевой составляющей, и обрабатывать их по отдельности, добиваясь тем самым очищения полезного сигнала. Надо ли говорить, что вас ожидает кропотливая ручная работа, если, конечно, вы хотите улучшить разборчивость произносимого - без ущерба для динамического диапазона оригинальной фонограммы. Безусловно, придется поработать над средней плотностью фонограммы в каждом «новом» канале и с соотношением «полезный сигнал/помеха».

Профессионалы предпочитают сразу записывать чистый звук, иначе последующая обработка в системах типа Dolby Laboratories Cat. No. 43 обойдется им очень дорого

Но почему не решать эту проблему программно, с использованием «умных» компьютеров? Производители подобных продуктов вроде бы имеются (например, компании SIA Software, DAC или та же Dolby Laboratories), но успехи в этой области, похоже, находятся на том же уровне, что и в отношении программ автоматического распознавания речи и преобразования ее в текст. Таким образом, в настоящее время таких программ для реальной работы (да еще и на русском языке) практически не существует, и созданы они будут, очевидно, весьма нескоро.

Однако петербуржская компания «Центр речевых технологий» (ЦРТ), которая работает в этой области с 1990 года, кажется, добилась определенных успехов. Компания ЦРТ (www.speechpro.ru) имеет в своем арсенале целый набор программных и аппаратных средств, предназначенных для шумоочистки и повышения качества звуковых, и в первую очередь речевых сигналов, - это компьютерные программы, автономные устройства, платы (DSP), встраиваемые в устройства каналов записи или передачи речевой информации. В частности, компания разработала такие программы, как SIS, SoundCleaner, а также аппаратные устройства серии «Золушка», «Тишина» и др. Данные устройства повышают разборчивость речи в условиях воздействия шумов и искажений, делают ее прослушивание более комфортным, что необходимо экипажам самолетов, авиадиспетчерам, операторам служб экстренной помощи, машинистам локомотивов и пр. При этом подобное устройство может быть встроено практически в любой аналоговый или цифровой телефонный аппарат, радиостанцию, телефонную гарнитуру и т.п.

Так, например, первым покупателем платы «Тишина» стала американская компания, которая использует ее в гонках NASCAR для обеспечения качественной связи между пилотом, командой и болельщиками.

Специалисты фирмы принимали участие в восстановлении аудиоинформации, записанной на борту затонувшей подлодки «Курск» (итогом полугодовой работы стали 23 компакт-диска со 120 часами восстановленной звуковой информации и 340 страниц дословного содержания фонограмм речи), на потерпевших катастрофу воздушных судах, а также при расследовании ряда уголовных дел, для которых требовалось установить содержание фонограмм речи.

SoundCleaner

есомненным лидером в линейке продуктов шумоочистки ЦРТ является программный пакет SoundCleaner. В 2000 году программа SoundCleaner официально зарегистрирована Российским агентством по патентам и товарным знакам.

Комплекс шумоочистки речи SoundCleaner представляет собой профессиональный набор программно-аппаратных средств, предназначенных для восстановления разборчивости речи и очистки звуковых сигналов, записанных в сложных акустических условиях или передаваемых по каналам связи.

Портативная система шумоочистки речи SoundCleaner может помочь в повышении
разборчивости и в текстовой расшифровке низкокачественных фонограмм речи, записанных в сложных акустических условиях

Это действительно уникальный программный продукт, предназначенный для шумоочистки и повышения качества звучания живого (то есть поступающего в реальном времени) или записанного звукового сигнала. И именно он может помочь в повышении разборчивости и в текстовой расшифровке низкокачественных фонограмм речи, записанных в сложных акустических условиях (в том числе архивных).

Естественно, он эффективнее работает в отношении шумов и искажений звука известной природы, таких как типовые шумы и искажения каналов связи и звукозаписи, шумы помещений и улицы, работающих механизмов, транспортных средств и бытовой техники, голосовой «коктейль», медленная музыка, электромагнитные наводки систем питания, как шумы компьютерной и другой техники, эффекты реверберации и эха. В принципе, чем регулярнее и равномернее шум, тем успешнее SoundCleaner с ним справится.

Однако при двухканальном съеме информации он существенно снижает влияние шумов любого типа. Так, например, SoundCleaner имеет методы двухканальной адаптивной фильтрации, предназначенные для подавления как широкополосных нестационарных помех (таких как речь, радио или телетрансляция, шумы зала и т.д.), так и периодических (вибрации, сетевые наводки и т.п.). Эти методы основываются на том, что при выделении полезного сигнала используется дополнительная информация о свойствах помехи, представленная в опорном канале.

Если возникает необходимость решать нестандартные задачи по обработке тех или иных фонограмм, то программа SoundCleaner предоставляет возможность гибкой настройки процедуры обработки сигнала, включая редактирование самой схемы обработки. Таким образом, пользователи любого уровня подготовки могут успешно решать задачи шумоподавления, пользуясь автоматическими или ручными настройками программы. Для менее опытных существует 13 готовых схем обработки наиболее типичных зашумлений и искажений сигналов (электронаводка, шум транспорта, частотные и амплитудные искажения, помехи радиосвязи и др.), которые помогут в борьбе с различными видами известных шумов и помех. При этом каждая схема поддается корректировке, а более опытные пользователи могут разработать собственные схемы, которые потом можно сохранить в качестве типовых для повторного применения.

В комплект поставки включаются звуковые файлы примеров зашумленных речевых сигналов и оптимизированных для их обработки конфигураций и схем фильтрации, так что освоение и работа с программой будут происходить просто и довольно эффективно.

Начиная с версии 5.10 SoundCleaner может работать в качестве DirectX plug-in, сохраняя при этом все возможности для автономной работы. В этом режиме программа может работать в составе таких известных звуковых редакторов, как Adobe Audition (1.0 и выше), Sound Forge (6.0 и выше) или Wave Lab 4.0. В принципе, для работы в автономном режиме в SoundCleaner есть свой звуковой редактор Wave Assistant editor, который включает набор стандартных средств для редактирования сигнала и проведения его подробного электроакустического и спектрального анализа с целью выбора оптимального режима обработки.

Структурно программа представляет собой набор автономных модулей работы со звуком (всего имеется 19 таких модулей), объединенных в основной оболочке. Каждый модуль имеет свою панель управления и обрабатывает звук по собственному алгоритму, после чего передает его на следующий модуль. Общее количество одновременно используемых модулей ограничено только вычислительными возможностями компьютера.

Архитектура программного комплекса позволяет легко наращивать количество используемых типов модулей, обеспечивая тем самым длительный жизненный цикл программы (ибо компания создает все новые и новые модули). В программе предусмотрена возможность создания из таких модулей и использования схем обработки трех различных типов: одноканальной для сигнала моно или двухканальной с независимой обработкой в левом и правом каналах (в ряде случаев чрезвычайно эффективным оказывается использование для выделения полезного сигнала двух разных каналов).

Сигнал (до и после обработки) непрерывно отображается в виде осциллограммы и мгновенного спектра. Управление шумоочисткой осуществляется в масштабе реального времени: изменять настройки каждого модуля можно в любой момент, не прерывая воспроизведения, причем без потери сигнала, что очень важно для оперативного выбора параметров буквально на слух.

Ввод и обработка звукового сигнала могут производиться как от внешнего источника (линейного выхода аудиоаппаратуры, микрофона), так и из звукового wav-файла. Программа может работать с моно- или стереосигналами форматов ИКМ 8 и 16 бит, mu(a)-Law или 24 бит float с частотой дискретизации от 8 до 48 кГц и сохранять их после обработки с исходной частотой дискретизации в формате ИКМ 16 бит.

ClearVoice Denoiser — демонстрационная программа автоматического подавления шумов

SoundCleaner работает под управлением ОС Windows 9х/Ме/NT/2000/XP на стандартном PC (начиная с Pentium II или Celeron с 64 Мбайт оперативной памяти) со стандартной Windows-совместимой полнодуплексной звуковой картой. Для получения гарантированно высокого качества входного и выходного сигналов для старших версий продукта предусмотрена поставка профессиональных устройств ввода/вывода сигнала: 16-разрядного STC-H216 или 24-разрядного STC-H246 «Камертон». У программы есть русскоязычный пользовательский интерфейс. С сайта компании можно скачать ClearVoice Denoiser - демонстрационную программу автоматического подавления шумов. Основные алгоритмы шумоочистки из программы SoundCleaner реализованы также в виде набора встраиваемых программных модулей (SDK), которые могут использоваться другими разработчиками программного обеспечения. Демо-версии SDK доступны на сайте производителя.

Компьютерный транскрайбер, к сожалению, пока еще не является программой автоматического распознавания речи и преобразования ее в текст. В настоящее время таких программ для реальной работы на русском языке не существует, и появятся они, скорее всего, не скоро. Транскрайбер - это, скорее, компьютерный цифровой магнитофон, управляемый из специализированного текстового редактора.

Данные устройства предназначены для повышения скорости и комфортности документирования звукозаписей устной речи при подготовке сводок, протоколов совещаний, переговоров, лекций, интервью, при безбумажном делопроизводстве и во многих других случаях. Их отличает простота, удобство использования и доступность для непрофессиональных операторов: скорость работы по набору текста возрастает для профессиональных операторов, печатающих вслепую, в 2-3 раза, а для непрофессионалов - в 5-10 раз! Кроме того, значительно уменьшается механический износ магнитофона и ленты, если речь идет об аналоговом источнике. При этом у компьютерных транскрайберов существует интерактивная возможность сверки набранного текста и соответствующего звукового трека. Связь текста и речи устанавливается автоматически и позволяет в набранном тексте при подведении курсора к исследуемому фрагменту текста мгновенно автоматически находить и прослушивать соответствующие звуковые фрагменты речевого сигнала.

Повышения разборчивости речи можно добиться здесь как путем замедления скорости воспроизведения без искажения тембра голоса, так и путем многократного повторения неразборчивых фрагментов в режиме кольца.

По желанию заказчика компания может продать транскрайбер с ножной педалью, посредством которой осуществляется управление функциями цифрового магнитофона, что тоже повышает производительность и комфортность работы. Возможен и вариант программы под стандартную звуковую карту типа Sound Blaster.

Заключение

Настоящее время созданием международных рекомендаций по оценке разборчивости речи занимается специальная группа Комитета стандартов AES (председатель П.Мапп). Однако специалисты этой группы занимаются преимущественно сравнительным анализом различных методов оценки этой разборчивости.

Но если так сложна проблема оценки разборчивости речи, что уже тогда говорить о методах, автоматически повышающих эту разборчивость! Ведь разборчивость речи зависит не только от факторов, которые поддаются объективным измерениям (уровень шумов и др.), но и от таких субъективных факторов, как уровень владения языком, дикция оратора, степень знакомства слушателя с содержанием сообщения, состояние его слуха и др. Как видите, создание любой автоматизированной компьютерной системы, работающей с речью, - задача чрезвычайно сложная, но поскольку она важна для многих областей, особенно для развития коммуникационных систем, и к ее решению привлечены значительные силы специалистов в различных странах, то можно надеяться, что когда-нибудь надежные системы будут созданы и для точного распознавания речи.

На нашем CD-ROM вы найдете демонстрационные версии программ SoundCleaner и ClearVoice Denoiser.

Нарушение разборчивости человеческой речи, особенно в присутствии фонового шума — одна из основных проблем пользователей слуховых аппаратов. Разработчики и производители современных слуховых аппаратов хорошо знают об этом и прикладывают максимум усилий для решения этой непростой задачи. Почти все современные цифровые слуховые аппараты снабжены специальными системами, так называемыми «системами шумоподавления », позволяющими уменьшить воздействие посторонних звуков на речевой сигнал. Однако, к сожалению, большинство таких систем основано на уменьшении усиления в слуховом аппарате для тех или иных частотных областей. Другими словами, вместе с подавлением шума, аппарат частично подавляет и речь. В итоге, разборчивость речи остается неудовлетворительной.

Аудиологи компании Видекс (Widex), в очередной раз, предлагают нестандартное решение данной проблемы. Я говорю об уникальной системе «Усилитель Речи », которой снабжены современные аппараты Widex серий Mind, Inteo, Passion. Эта система использует сложный полностью автоматический алгоритм, основанный на анализе данных о нарушении слуха пользователя, о характере речи собеседника, и об особенностях фонового шума. Благодаря этому, слуховой аппарат оптимизирует работу всех своих систем таким образом, чтобы в любой звуковой обстановке, даже самой шумной, усиление для речи всегда значительно превышало усиление для шумового сигнала. Таким образом Widex обеспечивает максимально возможную разборчивость речи для каждой акустической ситуации.

Еще одной уникальной разработкой компании Widex является система, основанная на использовании, так называемой, линейной частотной транспозиции. Эта система называется «Расширителем Диапазона Слышимости ». Дело в том, что иногда использование даже самого совершенного и мощного слухового аппарата не позволяет полностью компенсировать нарушение слуха пользователя. Речь идет о случаях выраженного нарушения слуха в области высоких частот. Несколько лет назад таким пациентам мы бы сказали: «К сожалению, вы не сможете слышать высокочастотные звуки ». Когда мы говорим о высокочастотных звуках, мы имеем ввиду не только пение птиц, звонок будильника или мелодию флейты. Мы также думаем о высокочастотных звуках входящих в состав человеческой речи. Без этих звуков невозможно достижение адекватной разборчивости речи , а также, что особенно важно, невозможно правильное и полноценное развитие речи ребенка.

«Расширитель Диапазона Слышимости » переносит часть наиболее значимых звуковых сигналов из высокочастотной части в нижележащую область. Именно в ту область, в которой сохранена звуковая чувствительность. Таким образом, человек даже с полным отсутствием слуха в области высоких частот, вновь начинает слышать эти звуки. Конечно, звучание этих звуков отличается от исходного. Однако они остаются похожими на первоначальный оригинальный сигнал. Система прошла длительные клинические испытания с участием детей и взрослых на базе многих аудиологических лабораторий, в том числе, США и Австралии, результаты которых свидетельствуют о её высокой эффективности.

Однако следует помнить, что в каждом случае использования «Расширителя Диапазона Слышимости » следует использовать индивидуальный подход к конкретному нарушению слуха пациента, а также необходим продолжительный период адаптации пользователя (в некоторых случаях 2-3 месяца). До недавнего времени такая система была представлена в аппаратах Widex серии Inteo. Мы рады сообщить, что теперь, с выходом новых серий слуховых аппаратов, а именно Mind-440 и Mind-330, система стала более доступной для пользователей наших слуховых аппаратов.

Аудиолог российского представительства Widex
Бронякин Станислав Юрьевич

Если при разговоре вы глотаете бо́льшую часть слов или же окружающие с трудом понимают, что вы говорите, то можете попытаться улучшить ясность своей речи. Ниже представлено несколько способов, с помощью которых вы сможете говорить более четко, независимо от того, нужно ли вам произнести речь, или ваша профессия требует публичных выступлений или, возможно, вы просто хотите улучшить свою манеру общения.

Шаги

Не спешите во время разговора

    Контролируйте свое дыхание. Послушайте и понаблюдайте за певцом на сцене, и вы увидите, как много внимания он уделяет своему дыханию. Если бы Мик Джаггер не знал, как правильно дышать, он бы не смог бегать по сцене, распевая свою песню «You Can’t Always Get What You Want». То же самое происходит и во время разговора, так что правильное дыхание может значительно улучшить ясность вашей речи.

    Не торопитесь при разговоре. Разговаривайте неторопливо, но не нужно быть настолько медленным, чтобы казаться со стороны роботом.

    • Зачастую публичные выступления заставляют людей нервничать. Если вы осознаете, что нервничаете и спешите, постарайтесь напомнить себе, что все в порядке и нужно снизить скорость. Дышите правильно, чтобы оставаться спокойным и анализировать свои слова.
    • Также следует помнить о том, что люди хотят услышать то, что вы говорите. Ваши слова имеют значение, так что дайте шанс услышать их и разобрать.
    • Человеческое ухо способно очень быстро улавливать слова, но при условии, что вы полностью проговариваете каждое свое слово прежде, чем начинаете произносить следующее, ведь таким образом между словами вы оставляете достаточные паузы, с тем чтобы все могли вас правильно понять.
  1. Проглатывайте лишнюю слюну во рту. Слюна, оставшаяся в полости рта, зачастую приводит к проглатыванию слов и искажению произношения таких согласных как «С» и «К».

    • Сглатывая слюну, вы сможете не только прочистить горло, но и сделать паузу и отдышаться, чтобы продолжить свою речь.
    • Выбирайте момент для проглатывания слюны, когда вы уже закончили предложение или мысль, но никак не в середине предложения. Это также даст вам время, чтобы подготовиться произнести следующее предложение.
  2. Репетируйте. Если вам нужно публично выступить или представить какого-либо рода презентацию, вероятно, вам стоит подготовиться и как минимум набросать содержание в общих чертах. Попрактикуйтесь в произношении речи во время прогулки.

    • Некоторые актеры используют эту методику, чтобы заучить свои роли, так как подъем и движение помогают запомнить то, что нужно сказать. Тренируйте свою речь и на каждом шагу произносите по одному слову.
    • Возможно, это покажется трудным и медленным, но произнося на каждом шагу по одному слову, вы научитесь замедлять свою речь. Вам не нужно говорить так же медленно в своей речи или обычном разговоре, но ощущение комфорта при использовании более медленного темпа улучшит ясность вашей речи и позволит вам в дальнейшем не торопиться.
  3. Повторяйте те слова, которые трудно произнести. Когда трудно произносить определенные слова, мы часто начинаем торопиться, и спотыкаемся на этих словах, что приводит к нечеткой запутанной речи. Практикуйтесь в произношении этих слов, произнося их вслух снова и снова до тех пор, пока у вас не выработается мышечная память на их правильное звучание.

    • Например, к сложным для произношения словам в русском языке можно отнести «записывавшегося», «предшествовавшими», «участвовавшими», «покровительствовавшие» и так далее.
    • Чтобы научиться правильно произносить трудные слова, попробуйте проговаривать эти слова вслух.
    • Как только вы поймете, что у вас нет трудностей со сложными словами, вы сможете говорить уверенно и не торопиться.

    Как улучшить свою дикцию

    1. Тренируйтесь на скороговорках. Скороговорки являются отличным способом улучшить ясность своей речи, а овладев ими, вы сможете научиться сохранять свою речь четкой и уверенной. Многие актеры и ораторы перед выходом на сцену тренируются на скороговорках, чтобы разогреть свой голос.

      Читайте вслух. Когда вы читаете книгу или даже просто утреннюю газету, упражняйтесь, читая её вслух. Это поможет вам более детально ознакомиться с тем, как звучит ваш голос. Очень часто, когда мы разговариваем с другими, мы слышим себя совсем не так, как звучит наш голос по-настоящему. Читая вслух в уютной обстановке, сидя у себя дома, вам будет легче прислушиваться к себе и уделять внимание тем моментам, когда ваша речь становится нечеткой.

      • Также вы можете записывать свой голос и прослушивать его, попутно отмечая, где вы мямлите или говорите неясно.
    2. Тренируйтесь, разговаривая с пробкой во рту. Многие артисты и актеры озвучивания выполняют это упражнение для улучшения ясности речи и дикции, особенно если нужно читать что-то подобное произведениям Шекспира. Поместите пробку между зубами и начинайте говорить - вы заметите, что произносить слова стало труднее, ровно как и произносить каждый слог; кроме того, пробка во рту не позволит вам спотыкаться на определенных словах.

      • Это упражнение может утомить мышцы вашей челюсти, что поможет вам научиться их расслаблять, однако не нужно тренироваться таким образом слишком долго, иначе у вас заболит челюсть.
      • Если во время этого упражнения у вас вырабатывается много слюны, используйте салфетку.
    3. Уделяйте внимание интонации. Тон голоса также играет большую роль в ясности речи и дикции, так как он влияет на то, как вы произносите определенные слова.

      • Вы произносите речь, которая должна взволновать людей? Вероятно, они с трудом вас поймут, если вы произносите ее монотонным или невыразительным голосом.
      • Ваша интонация, будь вы взволнованы, разговариваете поучительным или обычным тоном, заставит людей обратить внимание на вашу речь, а также может улучшить ее четкость.
      • Интонация при разговоре целиком зависит от высоты звука вашего голоса. Обратите внимание на то, как высоко или низко звучит ваш голос.
    4. Не используйте восходящие интонации в разговоре. Эта скверная привычка говорить с восходящей интонацией заставляет звучать ваш голос так, будто вы задаете вопрос.

    Тренируйте мышцы

      Тренируйте мышцы челюсти, чтобы улучшить четкость своей речи. Чтобы ваша речь стала гораздо четче, расслабляйте челюсть с помощью нескольких упражнений.

      • Делайте широкие жевательные движения, одновременно с этим что-нибудь напевая себе под нос.
      • Растягивайте каждую мышцу своей челюсти и лица. Откройте рот как можно шире (как будто вы собираетесь зевнуть), в то же время описывая своей нижней челюстью круг и двигая ею из стороны в сторону.
      • Откройте рот широко, как и в предыдущем упражнении, и закройте его. Повторите так 5 раз.
      • С помощью губ, сомкнутых вместе, попробуйте издать жужжащий звук, но только не сжимайте челюсти.
    1. Следите за осанкой. Как и дыхание, ваша осанка играет важную роль в ясности вашей речи, и это именно то, о чем мы часто забываем и не принимаем во внимание.

    2. Разогревайте голосовые связки. Если вы разогреете свои голосовые связки , это вас расслабит и подготовит к тому, что ваша речь будет звучать ясно и эффективно.

      • Даже если вы не занимаетесь пением, вы можете пропеть несколько нот или просто помурлыкать себе под нос. Также попробуйте напевать скороговорки.
      • Произнесите несколько раз: «Ууууу…», повышая и понижая интонацию. Представьте себе, будто ваш голос как колесо обозрения восходит вверх и опускается вниз по кругу.
      • Издайте жужжащий звук и похлопайте по своей груди. Так вы сможете избавиться от мокроты и прочистить горло.
    3. Не разговаривайте со стиснутыми зубами.

      • Стискивая зубы, мы сильно напрягаемся, что служит признаком стресса. Разговаривая со стиснутыми зубами, мы не открываем рот достаточно широко, что делает нашу речь неясной и нечеткой.
      • Скажите «А» (как в слове «Арканзас» - опустите челюсть вниз).
      • Произнесите следующие звуки, сильно их выделяя:
        Аа ее оо еи о
        Каа кее коо кей ко
        Саа ши соо сэй со
        Таа чии цу тэй то
        Наа нии ноо нэй но
        Хаа хии хоо хэй хо
        Маа ми моо мэй мо
        Яаа еее ёоо яэй йо
        Раа рии роо рэй ро
        Ваа ви воо вэй вое.
      • Другое упражнение состоит в том, что нужно написать несколько предложений на листе бумаги, затем подчеркнуть последнюю букву в каждом слове. Когда вы будете читать лист, преувеличивайте звучание последних букв, затем делайте паузу на несколько секунд. Также вы можете поставить запятые между большим количеством слов, чтобы замедлиться в этом месте.
      • Демосфен, греческий мыслитель, чтобы отучить себя от заикания, тренировался, набрав в рот гальку. Стоит попробовать и такое с чем-нибудь чистым, безопасным и съедобным, например, с печеньем или кубиками льда. Только будьте осторожны и не подавитесь.
      • Тренируйтесь, произнося гласные звуки и добавляя к ним согласные, например, «паа пау по поо пэй пии пай, соу со суу сэй сии сай...»
      • Выбросьте все мысли из головы и думайте о том, что вы собираетесь сказать, чтобы забыть о тревожных мыслях. Это помогает при публичных выступлениях.
      • Старайтесь понять, что вы говорите! Чувствуйте силу голоса - так выступать перед большим количеством людей будет проще.

      Предупреждения

      • Работая с челюстью и ртом, не переусердствуйте, иначе получите травму. Если вы ощущаете боль, нужно немного расслабить мышцы лица.

Проблемы проявляются в общении с людьми, при разговоре по телефону, просмотре телевизора, прослушивании радио и т.д. С этим можно или смириться, но тогда проблемы станут только еще неразрешимей, либо принять необходимые шаги для их решения . При нарушениях звуковосприятия мозг человека не получает достаточного звукового стимула, возникает депривация слухового анализатора (частичное или полное лишение одного или более органов чувств внешнего воздействия), что со временем приводит к утрате навыка разборчивости речи, человек забывает как звучат те или иные звуки.

Чем дольше стаж потери слуха, чем далее откладываются меры по его восстановлению, тем быстрее и глубже происходит ухудшение разборчивости речи, тем сложнее и длительней будет процесс реабилитации, который не всегда приведет к 100% компенсации.

Наша задача заключается в оказании помощи слабослышащим, у кого есть нарушение слуха, кто уже столкнулся с проблемами, связанными с нарушением, а так же желает восстановить навык разборчивости речи, вновь ощутить забытые звуки.

Полноценного спуха можно достичь только совместными усилиями.

Шаг первый. Посещение специалиста по слухопротезированию.

Для этого необходимо записаться на прием к специалисту, который имеет профессиональную подготовку, соответствующие дипломы, сертификаты. Он Вам поможет определиться с выбором слухового аппарата , соответствующего нарушению слуха, образу жизни.
В специализированном центре Вам предложат несколько видов аппаратов, подходящих именно Вам по всем критериям. При этом выполнят компьютерную настройку, проведут различные речевые тесты для контроля качества настройки. Ваша задача лишь выбрать соответствующий слуховой аппарат по качеству звука, а так же по цене.

На прием к слухопротезисту рекомендуется придти с родным, близким или знакомым Вам человеком. Работа современных цифровых программируемых слуховых аппаратов направлена не столько на силу звука, сколько на понимание, а так же наразборчивость речи. При этом, услышав речь знакомого человека, Вам будет более понятен эффект.

Шаг второй. Приобретение слухового аппарата.

Приобретение слухового аппарата , рекомендованного нашим специалистом на основании данных слуха и образа жизни, является самым главным шагом на пути к успешному результату восстановления навыка разборчивости речи.

В настоящее время фирмами-производителями уделяется много внимания косметической составляющей. Современные модели стали значительно меньше по размерам за счет того, что регуляторы громкости, кнопки переключения программ вынесены в пульт управления, который напоминает брелок. Пультом легче пользоваться, так как Вы видите кнопки управления, ранее же приходилось «вслепую» на ощупь изменять громкость или программу прослушивания. Слуховые аппараты стали легче и менее заметными . Появилась также возможность выбора цвета корпуса под цвет кожи или волос, в тон косметики или по другим предпочтениям.

Все это сделано для того, что слуховым аппаратом Вам придется пользоваться длительное время, а при изменении слуха должна иметься возможность для перепрограммирования слухового аппарата, введение новых характеристик под измененный слух.

Шаг третий. Привыкание или адаптация.

После того, как Вы приобрели слуховой аппарат, стали им пользоваться, необходимо привыкнуть к его нахождению в ухе, новым звукам, которые раньше не слышали, которые сейчас стали слышать. Для привыкания требуется некоторое время. Слух должен привыкнуть к новым звукам.

Первые ощущения чрезвычайно важны для правильной настройки слухового аппарата . Используйте все возможности, которые предоставляют современные аппараты для решения вопросов коррекции слуха.

Кроме того, следует соблюдать инструкции, прилагающиеся к изделию. При возникновении вопросов или проблем обратитесь к специалисту по месту приобретения.

Необходимо понимать, что СА не может устранить потерю слуха . СА лишь усиливает на тех частотах, где выявлена потеря звуковосприятия.

Примерка слухового аппарата, проверка эффективности коррекции слуха производится в стандартных условиях - в так называемом «свободном звуковом поле» при отсутствии посторонних звуков. При этом невозможно смоделировать те акустические условия, с которыми Вам придется постоянно сталкиваться. Поэтому мы рекомендуем в течении первых 2 месяцев использования записать ощущения с тем, чтобы в дальнейшем, при возникновении необходимости, сообщить эту информацию слухопротезисту, сурдологу для получения дальнейших рекомендаций или настройки.

  • восприятие различных звуков по громкости,
  • разборчивость речи,
  • восприятие своего голоса,
  • разговор по телефону.

При этом все звуки Вам необходимо разделить на «неприятные» и «непривычные» . Если со временем «неприятные» звуки не исчезли, или Вы к ним не привыкли, это требует коррекции настроек.

Длительность привыкания к новому слуховому аппарату является абсолютно индивидуальной и может протекать от нескольких недель до нескольких месяцев.

Заключение.

Начинать всегда трудно.

В первое время от множества звуков может возникать утомление. Основа успеха - положительный настрой, а так же желание научиться лучше понимать и слышать.

  • Каждодневное ношение СА – залог успеха.

С каждым днем Вы будете лучше слышать и больше понимать речь. Вначале пользуйтесь несколько часов ежедневно, при этом постепенно увеличивая время ношения.

  • Улучшение слуха происходит постепенно.

Не стоит сразу после покупки ожидать 100% эффекта. К новым звукам и ощущениям нужно, особенно в сложных звуковых ситуациях.

Как общаться с теми, кто носит слуховой аппарат?

    Говорите ясно и четко.

    Говорите спокойно, четко и медленно. Не нужно кричать. Это не поможет лучше Вас понять.

    Подойдите поближе.

    В шумной обстановке постарайтесь быть ближе к собеседнику.

  1. Старайтесь смотреть на человека.
  2. Люди с нарушением слуха чаще всего обращают внимание на выражение лица и движение губ. Чем отчетливей Ваша речь, тем проще будет Вас понять.

  3. Обратите на себя внимание.
  4. Окликните собеседника по имени. Убедитесь, что с Вами готовы разговаривать.

  5. Избегайте сложных звуковых ситуаций.
  6. Разговор под шум льющейся воды, пылесоса, громкую музыку не принесет должного эффекта. Не стоит кричать и разговаривать на большом расстоянии, например из другой комнаты.

  7. Сохраняйте спокойствие.
  8. Внимание человека, который недавно использует слуховой аппарат, может быстро рассеиваться. Понимание речи требует напряжения. Беседуйте спокойно.