ОБРАБОТКА ДИНАМИЧЕСКИХ СВОЙСТВ АУДИО С ИСПОЛЬЗОВАНИЕМ ПЕРЕНАСТРОЙКИ
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ Изобретение относится к обработке звуковых сигналов. В частности, изобретение относится к процессору или способу обработки динамических свойств аудио, который использует механизм или последовательность операций перенастройки, для того чтобы быстро адаптироваться к изменениям контента в звуковом сигнале. Сигнал перенастройки может формироваться посредством анализа самого звукового сигнала, или перенастройка может запускаться от внешнего события, такого как изменение канала на телевизионном приемнике или изменение выбора входа на аудио/видеоприемнике. В случае внешнего пускового сигнала один или более признаков состояния процессора динамических свойств для текущего источника звука могут сохраняться и ассоциативно связываться с таким источником звука перед переключением на новый источник звука. Затем, если система переключается обратно на первый источник звука, процессор динамических свойств может быть перенастроен на состояние, сохраненное ранее, или его приближение. Изобретение также относится к компьютерным программам для осуществления таких способов на практике или управления таким устройством. УРОВЕНЬ ТЕХНИКИ Цель обработки динамических свойств аудио состоит в том, чтобы менять уровень или динамические свойства звукового сигнала, чтобы были в пределах некоторых желательных пределов. Это в целом достигается созданием зависящего от времени измерения уровня звукового сигнала (например, среднеквадратического уровня или пикового уровня), а затем вычислением и применением зависящей от времени модификации сигнала (например, изменения коэффициента усиления), которая является функцией оценки уровня. Процессоры динамических свойств, применяющие такой режим работы, включают в себя автоматическую регулировку усиления (АРУ, AGC), регулировку динамического диапазона (УДД, DRC), расширители, ограничители, шумовые заслоны и т.д. Различные типы обработки динамических свойств сигналов изложены в заявке PCT/US 2005/038579 на выдачу международного патента Алана Джеффри Шифельда, опубликованной в качестве WO 2006/047600 4 мая 2006 года. Заявка указывает Соединенные Штаты среди других субъектов права. Заявка настоящим включена в состав посредством ссылки во всей своей полноте. Фиг.1 изображает высокоуровневую структурную схему типового процессора динамических свойств аудио. Может считаться, что процессор должен иметь два тракта, верхний «сигнальный» тракт 2 и нижний тракт 4 «управления». В нижнем тракте последовательность операций управления или контроллер 6 динамических свойств («Элемент регулировки динамических свойств») измеряет уровень звукового сигнала и формирует один или более зависящих от времени параметров модификации в качестве функции измерения уровня. Как показано, параметры модификации выводятся из входного звукового сигнала. В качестве альтернативы параметры модификации могут выводиться из обработанного (выходного) аудио или из комбинации входного и выходного звуковых сигналов. В верхнем звуковом тракте 2 параметры модификации, сформированные элементом 6 регулировки динамических свойств, применяются к аудио для формирования обработанного аудио. Применение параметров модификации к звуковому сигналу может выполняться многими известными способами и, в общем, показано символом 8 умножителя. Например, в случае устройства или последовательности операций автоматической регулировки усиления может быть единственный параметр модификации широкополосного коэффициента усиления, который регулирует коэффициент усиления устройства или последовательности операций переменного усиления/ослабления в основном тракте. На практике аудио также может задерживаться перед применением параметров модификации, для того чтобы компенсировать любую задержку, ассоциативно связанную с вычислением параметров модификации в последовательности операций регулировки динамических свойств. Для простоты в представлении задержка не показана на фиг.1 или других фигурах в материалах настоящей заявки. В последовательности операций регулировки динамических свойств типично, что как измерение уровня сигнала, так и результирующие параметры модификации, вычисляются непрерывно во времени. В дополнение любое или оба измерения уровня сигнала и параметров модификации обычно сглаживаются по времени, чтобы минимизировать воспринимаемые артефакты от внесения в обработанный звук. Сглаживание, чаще всего, выполняется с использованием «быстрого нарастания» и «медленного спада», означающих, что параметры модификации изменяются относительно быстро в ответ на увеличение уровня сигнала и медленно реагируют, в то время как уровень сигнала уменьшается. Такое сглаживание происходит в соответствии с динамическими свойствами естественных звуков и способом, которым люди воспринимают изменения громкости во времени. Следовательно, такое временное сглаживание является почти универсальным в процессорах динамических свойств аудио. Для некоторых приложений обработки динамических свойств постоянные времени, ассоциативно связанные с таким сглаживанием, могут быть довольно большими, порядка одной или более секунд. Например, АРУ может вычислять оценку долговременного среднего уровня сигнала с использованием больших постоянных времени, а затем использовать результирующую оценку для формирования медленно меняющихся параметров модификации, которые перемещают средний уровень звука ближе к требуемому целевому уровню. В этом случае большие постоянные времени могут быть желательны для того, чтобы сохранять кратковременные динамические свойства звукового сигнала. Предположим, что такое АРУ оперирует со звуком телевизионного приемника с целью поддержания согласующегося среднего уровня по программам и по различным каналам. В такой ситуации контент звукового сигнала, обрабатываемого АРУ, может внезапно изменяться или содержать скачок, например, когда меняется канал, а потому ассоциативно связанный средний уровень звукового сигнала также может внезапно изменяться или содержать скачок. Со своими большими постоянными времени, однако, АРУ требует значительного количества времени для схождения к новому уровню и приведения модифицированного уровня обработанного звука в соответствие с требуемым целевым уровнем. В течение такого времени адаптации зритель телевидения может воспринимать уровень звука слишком громким или слишком приглушенным. Как результат, зритель может быстро доставать пульт дистанционного управления для настройки только уровня громкости, чтобы оказаться борющимся с АРУ, в то время как она стремится к пределу. Типичное решение предшествующего уровня техники для только что описанной проблемы включает в себя использование постоянных времени, которые приспосабливаются на основании динамических свойств сигнала. Например, если кратковременный уровень сигнала является значительно большим или меньшим, чем сглаженный уровень, как определено несколькими границами пороговых значений вокруг сглаженного уровня, то операция сглаживания переключается на более быстрые постоянные времени нарастания и/или спада соответственно до тех пор, пока кратковременный уровень не отступает в пределы границ пороговых значений вокруг сглаженного уровня. Следовательно, система переключается обратно на исходные, более медленные постоянные времени. Такая система может сокращать время адаптации АРУ, но пороговые значения и более короткие постоянные времени должны тщательно выбираться. Вообще, для любых приемлемых пороговых значений могут существовать сигналы, в которых исходные требуемые динамические свойства сигнала отклоняются за пределы границ пороговых значений вокруг среднего уровня, таким образом заставляя последовательность операций сглаживания ложно переключаться в режим быстрого нарастания или спада. Вследствие возможно частого возникновения такого ложного переключения постоянные времени режима быстрого нарастания и спада не должны выбираться слишком короткими, для того чтобы избежать нестабильности АРУ во время нормального программного материала. Как результат, схождение АРУ во время внезапных переходных процессов или скачков в звуковом контенте все же может не быть настолько быстрым, насколько требуется. Поэтому цель настоящего изобретения состоит в том, чтобы предложить лучшее решение для проблемы времени адаптации обработки динамических свойств в течение изменений звукового контента. РАСКРЫТИЕ ИЗОБРЕТЕНИЯ Согласно аспекту изобретения способ обработки звукового сигнала (или устройство, осуществляющее способ на практике) включает в себя изменение динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств, обнаружение изменения в контенте звукового сигнала и перенастройку последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения. Обнаружение изменения в контенте звукового сигнала может содержать одно или оба из (1) обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, Согласно еще одному аспекту изобретения способ обработки звукового сигнала (или устройство, осуществляющее способ на практике) включает в себя изменение динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств, прием подаваемого снаружи сигнала запуска перенастройки, указывающего изменение в звуковом сигнале, и перенастройку последовательности операций регулировки динамических свойств в ответ на сигнал запуска перенастройки. Сигнал запуска перенастройки может указывать одно или более из (1) действия пользователя, изменяющего канал, (2) действия пользователя, изменяющего источники входного сигнала, (3) действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед, (4) переключения с одного файла на другой, (5) изменения программы, (6) переключения с одного формата кодирования звука на другой и (7) изменения параметров кодирования. Согласно любому из вышеприведенных аспектов перенастройка последовательности операций регулировки динамических свойств может убыстрять скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале. Перенастройка последовательности операций регулировки динамических свойств устанавливает значение одного или более параметров управления последовательностью операций или сигнал, функцией которого являются такие один или более параметров управления последовательностью операций, в хранимое значение или значение по умолчанию. Перенастройка последовательности операций регулировки динамических свойств может уменьшать значение одной или более постоянных времени, применяемых при определении одного или более параметров управления последовательностью операций, или сигнала, функцией которого являются такие один или более параметров управления последовательностью операций. Хотя подход с адаптивными постоянными времени, описанный выше, может быть до некоторой степени полезным в сокращении времени адаптации процессора или последовательности операций динамических свойств аудио и может использоваться наряду с аспектами настоящего изобретения, такие процессор или последовательность операций могут быть значительно улучшены их наращиванием явными механизмом или последовательностью операций перенастройки, которые приводятся в действие при возникновении некоторых внезапных изменений или скачков в контенте звукового сигнала, являющегося обрабатываемым. Фиг.2 изображает настоящее изобретение в обобщенном виде, в котором дополнительный тракт управления, тракт 10 управления перенастройкой, добавлен в исходный процессор динамических свойств по фиг.1. Механизм или последовательность 12 операций управления перенастройкой («Элемент управления перенастройкой») может реагировать на один или оба из самого звукового сигнала (входного звукового сигнала или комбинации входного и выходного звуковых сигналов) и внешнего сигнала запуска. Таким образом, есть три возможные конфигурации: (1) сам звуковой сигнал (который, в свою очередь, может содержать входной звуковой сигнал или комбинацию входного и выходного звуковых сигналов), (2) внешний сигнал запуска и (3) оба, сам звуковой сигнал и внешний сигнал запуска. Если элемент 12 управления перенастройкой, механизм или последовательность операций управления перенастройкой, отправляет сообщение перенастройки в элемент 6 регулировки динамических свойств, давая ему указание перенастроить определенные аспекты его состояния регулировки динамических свойств некоторым образом, который предоставляет обработке динамических свойств аудио возможность быстро адаптироваться к новому уровню поступающего звукового сигнала. Перенастройка некоторых аспектов состояния регулировки динамических свойств, например, может (1) устанавливать одну или более постоянных времени в меньшее значение на короткий период времени (тем самым убыстряя скорость адаптации обработки звука) и/или (2) устанавливать сглаженное измерение уровня звукового сигнала либо одного или более параметров модификации в сохраненное значение либо в среднее значение или значение по умолчанию. Анализ звукового сигнала для определения события внезапного изменения или скачка в контенте сигнала Решение о перенастройке может инициироваться элементом 12 управления перенастройкой некоторым количеством способов, например, посредством анализа самого поступающего звукового сигнала или посредством приема внешнего сигнала запуска перенастройки. При анализе звукового сигнала элемент 12 управления перенастройкой пытается обнаружить условия в сигнале, указывающие на внезапное изменение или скачок в контенте. При обнаружении такого условия с определенной степенью достоверности элемент 12 управления перенастройкой принимает решение о перенастройке и впоследствии дает элементу 6 регулировки динамических свойств указание перенастроить один или более аспектов его состояния регулировки динамических свойств. Хотя другие технологии могут использоваться для обнаружения внезапных изменений или скачков в контенте сигнала, ниже описаны два практических и эффективных примера для выполнения этого. Использование внешнего пускового сигнала для определения события внезапного изменения или скачка в контенте сигнала Во многих применениях высоконадежная внешняя информация может быть имеющейся в распоряжении для запуска перенастройки. Например, в телевизионном приемнике или кабельной «телевизионной абонентской приставке» действие пользователя, изменяющего канал, может служить в качестве внешнего пускового сигнала перенастройки. К тому же в телевизионном или аудио/видеоприемнике действие пользователя, изменяющего источники входного сигнала, например, с «Видео 1» на «Видео 2», может служить для запуска перенастройки. Другие примеры включают в себя основанный на файлах медиаплеер, например портативное звуковое устройство или цифровой видеомагнитофон. В таком случае перенастройка может запускаться извне, когда система завершает воспроизведение одного файла и переключается на другой. Перенастройка также могла бы запускаться, когда пользователь сам или сама явным образом изменяет файл, нажимает воспроизведение либо быструю перемотку вперед или перемотку назад в новое местоположение на участке контента. В случае, в котором звук, являющийся обрабатываемым, был декодирован из сжатого потока цифровых данных, например звука в формате Dolby Digital, могут существовать другие источники внешнего сигнала запуска перенастройки. «Dolby» и «Dolby Digital» являются торговыми марками корпорации Dolby Laboratories Licensing. Например, система кодирования звука формата Dolby Digital является обязательным стандартом записи звука для телевидения высокой четкости в Соединенных Штатах. На заданном канале программирования звук отправляется непрерывно, но формат Dolby Digital может изменяться на границах программы. Например, основная программа может кодироваться в формате канала 5.1, но коммерческая может кодироваться в стереофоническом формате. Декодер Dolby Digital обязательно обнаруживает такие изменения и может пересылать информацию в процессор динамических свойств аудио по настоящему изобретению в качестве пускового сигнала перенастройки. Также могут применяться другие изменения в параметрах кодир, например изменения в параметре нормализации диалога Dolby Digital, «DIALNORM», который обычно сохраняется постоянным для одиночного участка контента. Подобный внешний пусковой сигнал перенастройки может формироваться также из других форматов кодирования, таких как формат MP3 и AAC. В дополнение к только что перечисленным источникам внешних пусковых сигналов перенастройки возможны другие, и изобретение не подразумевается ограниченным перечисленными таковыми. В случае, когда изобретение используется в устройстве, в котором аудио может возникать из набора известных источников, изобретение может быть дополнительно улучшено, как показано на фиг.3. По низу фигуры изображены Посредством использования аспектов последнего состояния регулировки динамических свойств источника звука для перенастройки последовательности операций регулировки динамических свойств при переключении на такой источник могут достигаться лучшие эксплуатационные качества, чем в отсутствие применения такого начального состояния. Без такой информации последовательность операций регулировки динамических свойств полагается на поступающий звуковой сигнал после перенастройки, в то время как адаптируется к новому источнику звука. На кратковременной основе уровень звука может быстро флуктуировать, а потому параметры модификации также могут быстро флуктуировать по мере того, как последовательность операций регулировки динамических свойств пытается быстро адаптироваться к новому аудио. Посредством использования аспектов последнего состояния процессора динамических свойств, ассоциативно связанного с источником звука, для перенастройки процессора динамических свойств вероятно, что процессор динамических свойств будет начинать с состояния, которое ближе к состоянию, к которому он будет стремиться в конечном счете для такого источника звука. Как результат, быстрым постоянным времени адаптации после перенастройки не нужно уменьшаться настолько, насколько могло бы потребоваться в ином случае, тем самым, с предоставлением улучшенной устойчивости без принесения в жертву общего времени адаптации. В качестве примера рассмотрим переключение между двумя телевизионными станциями, первой, со звуком на среднем уровне в -15 дБ относительно цифрового значения полной шкалы, и второй, со звуком на среднем уровне в -30 дБ, обе с диапазоном плюс или минус 5 дБ вокруг своих соответственных средних значений. Допустим, что как раз перед переключением на вторую станцию средний уровень первой станции находится на -13 дБ. Кроме того, допустим, что средний уровень второй станции находится на -33 дБ после переключения. Это перепад в -20 дБ. Если кому-то требуется, чтобы система обработки динамических свойств адаптировалась за половину секунды, например, скорость адаптации в -40 дБ в секунду требуется при отсутствии любой другой информации. Такая скорость довольно быстра и может привносить неустойчивость в обработанный звук. С другой стороны, предположим, что последнее состояние обработки динамических свойств, сохраненное у второй станции, соответствует уровню в -28 дБ. Затем, после перенастройки, последовательность операций регулировки динамических свойств может перенастраиваться этим состоянием и существует перепад всего лишь в -33 дБ - (-28 дБ) = -5 дБ. Таким образом, для приближения к требуемому уровню за половину секунды требуется скорость адаптации всего лишь в -10 дБ в секунду (требуя меньшего сокращения постоянной времени). Этот пример иллюстрирует преимущества в сохранении последнего состояния последовательности операций регулировки динамических свойств у источника звука, который давал в результате такое состояние. Результат, когда запускается перенастройка Запуск перенастройки убыстряет скорость адаптации обработки динамических свойств аудио (скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале). Например, когда запускается перенастройка, одна или более постоянных времени, ассоциативно связанных со скоростью адаптации, могут быстро переключаться на значительно меньшие значения, а затем плавно возвращаться к своим исходным большим значениям через заданный период времени. В качестве альтернативы одна или более постоянных времени могут переключаться на значительно меньшие значения и оставаться в таких значениях в течение заданного периода времени. В компоновке АРУ сигнал ОПИСАНИЕ ЧЕРТЕЖЕЙ Фиг.1 - схематическая функциональная структурная схема, показывающая, на высоком уровне, исходный процессор динамических свойств аудио. Фиг.2 - схематическая функциональная структурная схема, показывающая в соответствии с аспектами настоящего изобретения пример варианта осуществления настоящего изобретения, в котором, в общем виде, дополнительный тракт управления, тракт управления перенастройкой, добавлен в исходный процессор динамических свойств по фиг.1. Фиг.3 - схематическая функциональная структурная схема, показывающая в соответствии с аспектами настоящего изобретения пример варианта осуществления настоящего изобретения, в котором процессор динамических свойств аудио дополнительно улучшен. Фиг.4 показывает примерную функцию входа/выхода для типичной автоматической регулировки усиления (АРУ). Фиг.5 показывает набор частотных характеристик полос пропускания, выбранный для имитации критической полосовой фильтрации, наблюдаемой по базилярной мембране в человеческом ухе. Фиг.6 - схематическая функциональная структурная схема, показывающая в соответствии с аспектами настоящего изобретения пример варианта осуществления АРУ по настоящему изобретению. ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ Описанное изобретение применимо к широкому многообразию приложений обработки динамических свойств, таких как регулировка динамического диапазона, компрессоры, ограничители, расширители и т. д. Однако оно особенно полезно, когда применяется к АРУ, в котором типично большие постоянные времени имеют следствием медленную адаптацию в отсутствие настоящего изобретения. Таким образом, предпочтительные варианты осуществления описывают, в качестве примера, применение изобретения к АРУ. Базовая реализация АРУ Базовая реализация АРУ вычисляет зависящую от времени оценку среднего уровня сигнала и вычисляет требуемый модифицированный выходной уровень, который является функцией входного уровня и требуемого целевого уровня. Зависящая от времени модификация сигнала затем может вычисляться в качестве функции перепада между входным уровнем и требуемым выходным уровнем. Функция, отображающая вход в выход, предназначена для приведения уровня модифицированного звука ближе к требуемому целевому уровню, а фиг.4 изображает такую функцию входа/выхода. Для входного сигнала выше целевого уровня АРУ требует ослабления сигнала, а для входного сигнала ниже целевого уровня АРУ требует усиления сигнала. Степень ослабления или усиления может управляться изменением наклона линии на фиг.4. Теоретически, измерение, используемое для вычисления среднего уровня звука, должно коррелировать с человеческим восприятием громкости. Это может достигаться многими способами, например взвешенным измерением среднеквадратической мощности или измерением психоакустической громкости. Простое невзвешенное измерение среднеквадратической мощности является слегка менее точным, чем два только что упомянутых способа, но по-прежнему демонстрирует высокую степень корреляции с человеческим восприятием громкости для большинства звуковых сигналов реального мира. Вследствие своей вычислительной простоты невзвешенное измерение среднеквадратической мощности используется в предпочтительном варианте осуществления, но не должно рассматриваться в качестве ограничивающего изобретение. Хотя, в принципе, аспекты изобретения могут быть реализованы аналоговой и/или цифровой областях, насколько можно ожидать, практические реализации должны быть реализованы в цифровой области, в которой каждый из звуковых сигналов представлен отдельными отсчетами или отсчетами внутри блоков данных. Оценка входного уровня и соответствующего требуемого выходного уровня и параметры модификации сигнала могут вычисляться непрерывно для аналогового звукового сигнала либо на основе отсчет за отсчетом у цифрового сигнала, но для этого примерного варианта осуществления, взамен, желательно вычислять такие величины для следующих друг за другом перекрывающихся блоков отсчетов цифрового звукового сигнала. Это главным образом происходит вследствие того обстоятельства, что цифровая блочная обработка полезна для обнаружения условий перенастройки из самого сигнала, как описано позже. Давая возможность цифровому звуковому сигналу быть представленным посредством где В качестве первого этапа при вычислении коэффициента где 0 дБ соответствует уровню цифровой прямоугольной волны полной шкалы. Затем мгновенный уровень может сглаживаться с быстрым нарастанием и медленным спадом для формирования сглаженного среднего уровня звукового сигнала где и Коэффициенты Из сглаженного среднего уровня [ В заключение коэффициент Когда АРУ с перенастройкой Как упомянуто выше, механизм или функция перенастройки может вызывать одно из двух или оба из двух действий: (1) установку одной или более постоянных времени в меньшее значение на короткий период времени (тем самым убыстрение скорости адаптации обработки звука) и (2) установку сглаженного измерения уровня звукового сигнала либо одного или более параметров модификации в сохраненное значение либо в среднее значение или значение по умолчанию, которое может быть выражено в качестве Так как параметр модификации, коэффициент G[ Для запуска перенастройки может существовать двоичный сигнал По двоичному сигналу иначе, Коэффициент затухания Лучше чем использование постоянных коэффициентов нарастания и спада для сглаживания уровня сигнала, как показано в уравнении 4b, коэффициенты теперь могут меняться со временем в качестве функции сигнала иначе, где и Значения Обнаружение перенастройки посредством анализа сигнала Наиболее надежный способ для запуска перенастройки в раскрытом изобретении состоит в том, чтобы принимать пусковой сигнал внешним образом, из механизма или последовательности операций, которые известны непосредственно привязанными к изменению звукового контента. Несколько таких механизмов были обсуждены ранее, например изменение канала на телевизионном приемнике или изменение выбора входа на аудио/видеоприемнике. Во многих случаях, однако, никакие такие внешние механизмы могут не быть в распоряжении, а потому система должна полагаться на анализ самого звукового сигнала, если должна запускаться перенастройка. Например, предположим, что раскрытое изобретение находится в телевизионном приемнике, к которому пользователь подключил внешнюю кабельную телевизионную абонентскую приставку. Кабельная телевизионная абонентская приставка ответственна за подстройку и изменение каналов, и декодированный звук пересылается в телевизор только в качестве непрерывного аудиопотока. Телевизор поэтому не принимает никакой явной информации о том, когда выбран новый канал. Единственной имеющейся в распоряжении информацией является та, которая может логически выводиться из аудиопотока, который он принимает. Относительно простой, но эффективный способ запуска перенастройки посредством анализа сигнала состоит в том, чтобы обнаруживать событие во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, где сигнал Если 0 дБ соответствует уровню цифровой прямоугольной волны полной шкалы, то настройка В некоторых ситуациях промежуток относительной тишины может не привноситься, когда звуковой контент внезапно изменяется или содержит скачок, а потому вышеприведенная технология может не быть эффективной при запуске перенастройки. Поэтому желательно альтернативное событие запуска перенастройки, чтобы иметь дело с дополнительными случаями. В любой ситуации, в которой звуковой контент внезапно изменяется или содержит разрыв, уровень нового аудио будет либо большим чем, равным либо меньшим чем уровень предыдущего звукового контента. Так как большинство процессоров динамических свойств применяют нарастание, которое значительно быстрее, чем его спад, случай, в котором уровень нового звукового контента является большим чем или равным старому, является менее проблематичным, чем когда новый звуковой контент является значительно более низким, чем старый. В последнем случае время медленного спада может иметь следствием неприемлемо длительное время адаптации. Поэтому запуск перенастройки, когда новый звуковой контент значительно ниже, чем старый, может считаться особенно желательным. Чтобы делать так, можно применять признак, общий для большинства звуковых сигналов, состоящих из естественных звуков. Естественные звуки могут проявлять внезапные повышения уровня, но они обычно демонстрируют более постепенное затухание. Звуки, которые внезапно прерываются, не являются самыми распространенными в большинстве звуковых записей. Однако если звуковой контент внезапно переключается, например, благодаря изменению выбора входа и уровень нового звукового входа является значительно меньшим, чем старый, то результирующий аудиопоток демонстрирует радикальное неестественное мгновенное падение уровня. Такое падение уровня может обнаруживаться по кратковременному уровню Таким образом, еще один эффективный способ запуска перенастройки посредством анализа сигнала состоит в том, чтобы обнаруживать событие во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Подходящей разновременностью Вышеприведенная технология эффективна при запуске перенастройки, когда уровень нового звукового контента значительно ниже, чем старого, но она иногда может быть чувствительной к ложному запуску перенастройки во время нормального звукового контента. Описанная технология ищет падение в суммарном уровне сигнала, и иногда доминирующая часть звукового сигнала, например удар в барабан, может демонстрировать такое поведение, в то время как оставшаяся часть сигнала не может. Доминирующая сигнальная составляющая, однако, осуществляет наиболее значительный вклад в общий уровень, а потому может заставлять запускаться перенастройку. Чтобы справляться с таким непредусмотренным запуском, схема обнаружения может быть улучшена обнаружением перенастройки, когда уровень сигнала демонстрирует значительное падение уровня одновременно по множеству полос частот (например, всем полосам частот) в пределах порогового периода времени. Этим способом все такие полосы частот осуществляют равный вклад в процесс обнаружения перенастройки, независимо от абсолютного уровня в любой данной полосе. Для реализации такой технологии сначала вычисляется мгновенный уровень в пределах множества полос частот. Этот уровень представлен в качестве где Набор частотных характеристик По мгновенному уровню для каждой полосы, Для звуковых сигналов реального мира, На практике хорошо работает настройка Фиг.6 показывает структурную схему АРУ, воплощающей аспекты настоящего изобретения. Цифровой звуковой входной сигнал Реализация Изобретение может быть реализовано в аппаратных средствах или программном обеспечении либо сочетании обоих (например, программируемых логических матрицах). Если не указан иной способ действий, алгоритмы, включенные в состав в качестве части изобретения, по своей природе, не имеют отношения к какому бы то ни было конкретному компьютеру или другому устройству. В частности, различные машины общего применения могут использоваться с программами, написанными в соответствии с доктринами, приведенными в материалах настоящей заявки, или может быть более удобным сконструировать более специализированное устройство (например, интегральные схемы) для выполнения требуемых этапов способа. Таким образом, изобретение может быть реализовано в одной или более компьютерных программах, выполняющихся в одной или более программируемых компьютерных системах, каждая из которых содержит по меньшей мере один процессор, по меньшей мере одну систему хранения данных (в том числе энергозависимую и энергонезависимую память и/или запоминающие элементы), по меньшей мере одно устройство или порт ввода и по меньшей мере одно устройство или порт вывода. Управляющая программа применяется к входным данным для выполнения функций, описанных в материалах настоящей заявки, и формирует выходную информацию. Выходная информация подводится в одно или более устройств вывода известным образом. Каждая такая программа может быть реализована на любом желательном компьютерном языке (включая машинные, компоновочные или высокоуровневые процедурные, логические или объектно-ориентированные языки программирования) для общения с компьютерной системой. В любом случае язык может быть компилируемым или интерпретируемым языком. Каждая такая компьютерная программа предпочтительно хранится на или загружается в запоминающие носители или устройство (например, твердотельную память или носители либо магнитные или оптические носители), удобочитаемые программируемым компьютером общего применения или специального назначения, для конфигурирования и управления компьютером, когда запоминающие носители или устройства считываются компьютерной системой, чтобы выполнять процедуры, описанные в материалах настоящей заявки. Обладающая признаками изобретения система также может считаться реализуемой в качестве машиночитаемого запоминающего носителя, сконфигурированного компьютерной программой, где запоминающий носитель, сконфигурированный таким образом, побуждает компьютерную систему работать специальным и предопределенным образом для выполнения функций, описанных в материалах настоящей заявки. Было описано некоторое количество вариантов осуществления изобретения. Тем не менее, будет понятно, что различные модификации могут быть произведены не выходя из сущности и объема изобретения. Например, некоторые из этапов, описанных в материалах настоящей заявки, могут быть независящими от очередности и таким образом могут выполняться в очередности, отличной от той, которая описана. Изобретение относится к обработке звуковых сигналов и предназначено для перенастройки при обработке динамических свойств аудио для быстрой адаптации к изменениям контента в звуковом сигнале. Технический результат - обеспечение адаптации к изменениям контента в звуковом сигнале. В процессоре или способе обработки динамических свойств аудио используют механизм или последовательность операций перенастройки, для того чтобы быстро адаптироваться к изменениям контента в звуковом сигнале. Сигнал перенастройки может формироваться посредством анализа самого звукового сигнала, или перенастройка может запускаться от внешнего события, такого как изменение канала на телевизионном приемнике или изменение выбора входа на аудио/видеоприемнике. В случае внешнего пускового сигнала один или более признаков состояния процессора динамических свойств для текущего источника звука могут сохраняться и ассоциативно связываться с таким источником звука перед переключением на новый источник звука. Затем, если система переключается обратно на первый источник звука, процессор динамических свойств может быть перенастроен на состояние, сохраненное ранее, или его приближение. 2 н. и 12 з.п.ф-лы, 6 ил. 1. Способ обработки звукового сигнала, состоящий в том, что: 2. Способ по п.1, дополнительно содержащий этапы, на которых обнаруживают второй тип события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, Lsilence, на всем протяжении временного интервала, не меньшего чем другое пороговое значение времени, tsilence, и 3. Способ по п.1, в котором перенастройка последовательности операций регулировки динамических свойств убыстряет скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале. 4. Способ по п.1, в котором перенастройка последовательности операций регулировки динамических свойств устанавливает значение одного или более параметров управления последовательностью операций или сигнал, функцией которого являются такие один или более параметров управления последовательностью операций, в хранимое значение или значение по умолчанию. 5. Способ по п.1, в котором перенастройка последовательности операций регулировки динамических свойств уменьшает значение одной или более постоянных времени, применяемых при определении одного или более параметров управления последовательностью операций, или сигнала, функцией которого являются такие один или более параметров управления последовательностью операций. 6. Способ по п.1, дополнительно содержащий этапы, на которых 7. Способ по п.6, в котором сигнал запуска перенастройки указывает одно или более из 8. Устройство обработки звукового сигнала, содержащее 9. Устройство по п.8, дополнительно содержащее 10. Устройство по п.8, в котором упомянутое средство перенастройки последовательности операций регулировки динамических свойств убыстряет скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале. 11. Устройство по п.8, в котором упомянутое средство для перенастройки последовательности операций регулировки динамических свойств устанавливает значение одного или более параметров управления последовательностью операций или сигнал, функцией которого являются такие один или более параметров управления последовательностью операций, в хранимое значение или значение по умолчанию. 12. Устройство по п.8, в котором упомянутое средство перенастройки последовательности операций регулировки динамических свойств уменьшает значение одной или более постоянных времени, применяемых при определении одного или более параметров управления последовательностью операций, или сигнала, функцией которого являются такие один или более параметров управления последовательностью операций. 13. Устройство по п.8, дополнительно содержащее 14. Устройство по п.13, в котором сигнал запуска перенастройки указывает одно или более из
меняют динамические свойства звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств,
обнаруживают первый тип события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Ldrop, в пределах временного интервала, не большего чем пороговое значение времени, tdrop, при этом упомянутое обнаружение обнаруживает снижение уровня звукового сигнала во множестве полос частот, и
перенастраивают последовательность операций регулировки динамических свойств в ответ на обнаружение такого первого типа изменения.
перенастраивают последовательность операций регулировки динамических свойств в ответ на обнаружение такого второго типа изменения.
принимают подаваемый извне сигнал запуска перенастройки, указывающий изменение в звуковом сигнале, и перенастраивают последовательность операций регулировки динамических свойств в ответ на сигнал запуска перенастройки.
действия пользователя, изменяющего канал,
действия пользователя, изменяющего источники входного сигнала,
действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед,
переключения с одного файла на другой,
изменения программы,
переключения с одного формата кодирования звука на другой, и
изменения параметров кодирования.
средство изменения динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств,
средство обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Ldrop, в пределах временного интервала, не большего чем пороговое значение времени, tdrop, при этом упомянутое средство обнаружения обнаруживает снижение уровня звукового сигнала во множестве полос частот, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения.
средство обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, Lsilence, на всем протяжении временного интервала, не меньшего чем другое пороговое значение времени, tsilence, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения.
средство приема подаваемого извне сигнала запуска перенастройки, указывающего изменение в звуковом сигнале, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на сигнал запуска перенастройки.
действия пользователя, изменяющего канал, действия пользователя, изменяющего источники входного сигнала,
действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед,
переключения с одного файла на другой,
изменения программы,
переключения с одного формата кодирования звука на другой, и
изменения параметров кодирования.




