ПРИНЦИП ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИО ДЛЯ АУДИОКАНАЛОВ И АУДИООБЪЕКТОВ

25-08-2017 дата публикации

Номер:

RU2016105518A

Автор: КРАЧМЕР Михаэль (DE), КЮХ Фабиан (DE), ФЮГ Зимоне (DE), ЭРТЕЛЬ Кристиан (DE), ДИК Саша (DE), ПЛОГСТИС Ян (DE), МУРТАЗА Адриан (RO), БОРСС Кристиан (DE), ШТЕНЦЕЛЬ Ханне (DE), ХИЛЬПЕРТ Йоханнес (DE), ЗИЛЬЦЛЕ Андреас (DE), КУНТЦ Ахим (DE), АДАМИ Александер (DE), ХЕРРЕ Юрген (DE), ХЕЛЬЦЕР Андреас (DE)

Принадлежит: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.

Контакты: 129090, Москва, ул. Б.Спасская, 25, строение 3, ООО "Юридическая фирма Городисский и Партнеры"

Номер заявки: 55-10-201618

Дата заявки: 16-07-2014

ФОРМУЛА ИЗОБРЕТЕНИЯ

1. Аудиокодер для кодирования входных аудиоданных (101), чтобы получать выходные аудиоданные (501), содержащий:

входной интерфейс (100), выполненный с возможностью приема множества аудиоканалов, множества аудиообъектов и метаданных, связанных с одним или более из множества аудиообъектов;

микшер (200), выполненный с возможностью сведения множества объектов и множества каналов таким образом, чтобы получать множество предварительно сведенных каналов, причем каждый предварительно сведенный канал содержит аудиоданные канала и аудиоданные по меньшей мере одного объекта;

базовый кодер (300), выполненный с возможностью базового кодирования входных данных базового кодера; и

модуль (400) сжатия метаданных, выполненный с возможностью сжатия метаданных, связанных с одним или более из множества аудиообъектов,

при этом аудиокодер выполнен с возможностью работать в обоих режимах группы по меньшей мере из двух режимов, содержащих первый режим, в котором базовый кодер выполнен с возможностью кодировать множество аудиоканалов и множество аудиообъектов, принимаемых посредством входного интерфейса в качестве входных данных базового кодера, и второй режим, в котором базовый кодер (300) выполнен с возможностью приема, в качестве входных данных базового кодера, множества предварительно сведенных каналов, сформированных посредством микшера (200), и кодировать множество предварительно сведенных каналов.

2. Аудиокодер по п. 1, дополнительно содержащий:

кодер (800) пространственных аудиообъектов для формирования одного или более транспортных каналов и параметрических данных из входных данных кодера пространственных аудиообъектов,

при этом аудиокодер выполнен с возможностью дополнительно работать в третьем режиме, в котором базовый кодер (300) кодирует один или более транспортных каналов, извлекаемых из входных данных кодера пространственных аудиообъектов, причем входные данные кодера пространственных аудиообъектов содержат множество аудиообъектов или два или более из множества аудиоканалов.

3. Аудиокодер по п. 1, дополнительно содержащий:

при этом аудиокодер выполнен с возможностью дополнительно работать в еще одном дополнительном режиме, в котором базовый кодер кодирует транспортные каналы, извлекаемые посредством кодера (800) пространственных аудиообъектов из предварительно сведенных каналов в качестве входных данных кодера пространственных аудиообъектов.

4. Аудиокодер по п. 1, дополнительно содержащий модуль соединения для соединения вывода входного интерфейса (100) с вводом базового кодера (300) в первом режиме и для соединения вывода входного интерфейса (100) с вводом микшера (200) и соединения вывода микшера (200) с вводом базового кодера (300) во втором режиме, и

контроллер (600) режима для управления модулем соединения в соответствии с индикатором режима, принимаемым из пользовательского интерфейса или извлекаемым из входных аудиоданных (101).

5. Аудиокодер по п. 1, дополнительно содержащий:

выходной интерфейс (500) для предоставления выходного сигнала в качестве выходных аудиоданных (501), причем выходной сигнал содержит, в первом режиме, вывод базового кодера (300) и сжатые метаданные и содержит, во втором режиме, вывод базового кодера (300) без метаданных, и содержит, в третьем режиме, вывод базового кодера (300), вспомогательную SAOC-информацию и сжатые метаданные, и содержит, в еще одном дополнительном режиме, вывод базового кодера (300) и вспомогательную SAOC-информацию.

6. Аудиокодер по п. 1,

в котором микшер (200) выполнен с возможностью предварительного рендеринга множества аудиообъектов с использованием метаданных и индикатора относительно позиции каждого канала в компоновке для воспроизведения, с которой ассоциированы множество каналов,

при этом микшер (200) выполнен с возможностью сводить аудиообъект по меньшей мере с двумя аудиоканалами и с помощью этого далее с общим количеством аудиоканалов, когда аудиообъект должен быть размещен по меньшей мере между двумя аудиоканалами в компоновке для воспроизведения, как определено посредством метаданных.

7. Аудиокодер по п. 1,

дополнительно содержащий модуль (420) распаковки метаданных для распаковки сжатых метаданных, выводимых посредством модуля (400) сжатия метаданных, и

при этом микшер (200) выполнен с возможностью сводить множество объектов в соответствии с распакованными метаданными, при этом операция сжатия, выполняемая посредством модуля (400) сжатия метаданных, представляет собой операцию сжатия с потерями, содержащую этап квантования.

8. Аудиодекодер для декодирования кодированных аудиоданных, содержащий:

входной интерфейс (1100), выполненный с возможностью приема кодированных аудиоданных, причем кодированные аудиоданные содержат множество кодированных каналов или множество кодированных объектов либо сжатые метаданные, связанные с множеством кодированных объектов;

базовый декодер (1300), выполненный с возможностью декодирования множества кодированных каналов и множества кодированных объектов;

модуль (1400) распаковки метаданных, выполненный с возможностью распаковки сжатых метаданных,

процессор (1200) объектов, выполненный с возможностью обработки множества декодированных объектов с использованием распакованных метаданных, чтобы получать определенное число выходных каналов (1205), содержащих аудиоданные из объектов и декодированных каналов; и

постпроцессор (1700), выполненный с возможностью преобразования определенного числа выходных каналов (1205) в выходной формат,

при этом аудиодекодер выполнен с возможностью обходить процессор объектов и подавать множество декодированных каналов в постпроцессор (1700), когда кодированные аудиоданные не содержат кодированные аудиообъекты, и подавать множество декодированных объектов и множество декодированных каналов в процессор (1200) объектов, когда кодированные аудиоданные содержат кодированные каналы и кодированные объекты.

9. Аудиодекодер по п. 8, в котором постпроцессор (1700) выполнен с возможностью преобразовывать определенное число выходных каналов (1205) в бинауральное представление или в формат воспроизведения, имеющий меньшее число каналов относительно числа выходных каналов,

при этом аудиодекодер выполнен с возможностью управлять постпроцессором (1700) в соответствии с управляющим входом, извлекаемым из пользовательского интерфейса или извлеченным из кодированного аудиосигнала.

10. Аудиодекодер по п. 8, в котором процессор объектов содержит:

модуль рендеринга объектов для рендеринга декодированных объектов с использованием распакованных метаданных; и

микшер (1220) для сведения подготовленных посредством рендеринга объектов и декодированных каналов таким образом, чтобы получать определенное число выходных каналов (1205).

11. Аудиодекодер по п. 8, в котором процессор (1200) объектов содержит:

декодер по стандарту пространственного кодирования аудиообъектов для декодирования одного или более транспортных каналов и ассоциированной параметрической вспомогательной информации, представляющей кодированные аудиообъекты, при этом декодер по стандарту пространственного кодирования аудиообъектов выполнен с возможностью подготавливать посредством рендеринга декодированные аудиообъекты в соответствии с информацией рендеринга, связанной с размещением аудиообъектов, и управлять процессором объектов таким образом, чтобы сводить подготовленные посредством рендеринга аудиообъекты и декодированные аудиоканалы, с тем чтобы получать определенное число выходных каналов (1205).

12. Аудиодекодер по п. 8, в котором процессор (1200) объектов содержит декодер (1800) по стандарту пространственного кодирования аудиообъектов для декодирования одного или более транспортных каналов и ассоциированной параметрической вспомогательной информации, представляющей кодированные аудиообъекты и кодированные аудиоканалы,

при этом декодер по стандарту пространственного кодирования аудиообъектов выполнен с возможностью декодировать кодированные аудиообъекты и кодированные аудиоканалы с использованием одного или более транспортных каналов и параметрической вспомогательной информации, при этом процессор объектов выполнен с возможностью подготавливать посредством рендеринга множество аудиообъектов с использованием распакованных метаданных и декодировать каналы и сводить их с подготовленными посредством рендеринга объектами, с тем чтобы получать определенное число выходных каналов (1205).

13. Аудиодекодер по п. 8, в котором процессор (1200) объектов содержит декодер (1800) по стандарту пространственного кодирования аудиообъектов для декодирования одного или более транспортных каналов и ассоциированной параметрической вспомогательной информации, представляющей кодированные аудиообъекты или кодированные аудиоканалы,

при этом декодер по стандарту пространственного кодирования аудиообъектов выполнен с возможностью транскодировать ассоциированную параметрическую информацию и распакованные метаданные в транскодированную параметрическую вспомогательную информацию, применимую для непосредственного рендеринга выходного формата, при этом постпроцессор (1700) выполнен с возможностью вычисления аудиоканалов выходного формата с использованием декодированных транспортных каналов и транскодированной параметрической вспомогательной информации, или

при этом декодер по стандарту пространственного кодирования аудиообъектов выполнен с возможностью непосредственно микшировать с повышением и подготавливать посредством рендеринга сигналы каналов для выходного формата с использованием декодированных транспортных каналов и параметрической вспомогательной информации.

14. Аудиодекодер по п. 8,

в котором процессор (1200) объектов содержит декодер по стандарту пространственного кодирования аудиообъектов для декодирования одного или более транспортных каналов, выводимых посредством базового декодера (1300), и ассоциированных параметрических данных и распакованных метаданных, чтобы получать множество подготовленных посредством рендеринга аудиообъектов,

при этом процессор (1200) объектов дополнительно выполнен с возможностью подготавливать посредством рендеринга декодированные объекты, выводимые посредством базового декодера (1300);

при этом процессор (1200) объектов дополнительно выполнен с возможностью сводить подготовленные посредством рендеринга декодированные объекты с декодированными каналами,

при этом аудиодекодер дополнительно содержит выходной интерфейс (1730) для вывода содержимого вывода микшера (1220) в громкоговорители,

при этом постпроцессор дополнительно содержит:

модуль бинаурального рендеринга для рендеринга выходных каналов в два бинауральных канала с использованием передаточных функций восприятия звука человеком или бинауральных импульсных характеристик, и

преобразователь (1720) форматов для преобразования выходных каналов в выходной формат, имеющий меньшее число каналов относительно выходных каналов микшера (1220), с использованием информации относительно схемы размещения для воспроизведения.

15. Аудиодекодер по п. 8,

в котором множество кодированных канальных элементов или множество кодированных аудиообъектов кодированы как элементы канальных пар, одноканальные элементы, низкочастотные элементы или четырехканальные элементы, при этом четырехканальный элемент содержит четыре исходных канала или объекта, и

при этом базовый декодер (1300) выполнен с возможностью декодировать элементы канальных пар, одноканальные элементы, низкочастотные элементы или четырехканальные элементы в соответствии со вспомогательной информацией, включенной в кодированные аудиоданные, указывающие элемент канальной пары, одноканальный элемент, низкочастотный элемент или четырехканальный элемент.

16. Аудиодекодер по п. 8,

в котором базовый декодер (1300) выполнен с возможностью применять операцию полнополосного декодирования с использованием операции заполнения шумом без операции репликации полос спектра.

17. Аудиодекодер по п. 14, в котором элементы, содержащие модуль (1710) бинаурального рендеринга, преобразователь (1720) форматов, микшер (1220), SAOC-декодер (1800) и базовый декодер (1300) и модуль (1210) рендеринга объектов, работают в области гребенки квадратурных зеркальных фильтров (QMF), при этом данные области квадратурных зеркальных фильтров передаются из одного из элементов в другой из элементов без обработки посредством гребенки синтезирующих фильтров и последующей обработки посредством гребенки аналитических фильтров.

18. Аудиодекодер по п. 8,

в котором постпроцессор (1700) выполнен с возможностью микшировать с понижением каналы, выводимые посредством процессора (1200) объектов, в формат, имеющий три или более канала и имеющий меньшее число каналов относительно числа выходных каналов (1205) процессора (1200) объектов, с тем чтобы получать промежуточное понижающее микширование и подготавливать посредством бинаурального рендеринга (1210) каналы промежуточного понижающего микширования в двухканальный бинауральный выходной сигнал.

19. Аудиодекодер по п. 8, в котором постпроцессор (1700) содержит:

управляемый понижающий микшер (1722) для применения матрицы понижающего микширования; и

контроллер (1724) для определения конкретной матрицы понижающего микширования с использованием информации относительно конфигурации каналов вывода процессора (1200) объектов и информации относительно намеченной схемы размещения для воспроизведения.

20. Аудиодекодер по п. 8,

в котором базовый декодер (1300) или процессор (1200) объектов являются управляемыми, и

в котором постпроцессор (1700) выполнен с возможностью управлять базовым декодером (1300) или процессором (1200) объектов в соответствии с информацией относительно выходного формата таким образом, что рендеринг, приводящий к обработке декорреляции объектов или каналов, не возникающих в качестве отдельных каналов в выходном формате, уменьшается или исключается, либо таким образом, что для объектов или каналов, не возникающих в качестве отдельных каналов в выходном формате, операции повышающего микширования или декодирования выполняются, как если объекты или каналы должны возникать в качестве отдельных каналов в выходном формате, за исключением того, что деактивируется обработка декорреляции для объектов или каналов, не возникающих в качестве отдельных каналов в выходном формате.

21. Аудиодекодер по п. 8,

в котором базовый декодер (1300) выполнен с возможностью осуществлять декодирование с преобразованием и декодирование на основе репликации полос спектра для одноканального элемента и выполнять декодирование с преобразованием, параметрическое стереодекодирование и декодирование для воспроизведения полосы спектра для элементов канальных пар и четырехканальных элементов.

22. Способ кодирования входных аудиоданных (101), чтобы получать выходные аудиоданные (501), содержащий этапы, на которых:

принимают (100) множество аудиоканалов, множество аудиообъектов и метаданные, связанные с одним или более из множества аудиообъектов;

сводят (200) множество объектов и множество каналов таким образом, чтобы получать множество предварительно сведенных каналов, причем каждый предварительно сведенный канал содержит аудиоданные канала и аудиоданные по меньшей мере одного объекта;

подвергают базовому кодированию (300) для базового кодирования входных данных; и

сжимают (400) метаданные, связанные с одним или более из множества аудиообъектов,

при этом способ кодирования входных аудиоданных работает в двух режимах группы из двух или более режимов, содержащих первый режим, в котором базовое кодирование кодирует множество аудиоканалов и множество аудиообъектов, принимаемых в качестве базового кодирования входных данных, и второй режим, в котором базовое кодирование (300) принимает, в качестве входных данных базового кодирования, множество предварительно сведенных каналов, сформированных посредством сведения (200), и подвергает базовому кодированию множество предварительно сведенных каналов.

23. Способ декодирования кодированных аудиоданных, содержащий этапы, на которых:

принимают (1100) кодированные аудиоданные, причем кодированные аудиоданные содержат множество кодированных каналов или множество кодированных объектов либо сжатые метаданные, связанные с множеством объектов;

подвергают базовому декодированию (1300) множество кодированных каналов и множество кодированных объектов;

распаковывают (1400) сжатые метаданные,

обрабатывают (1200) множество декодированных объектов с использованием распакованных метаданных, чтобы получать определенное число выходных каналов (1205), содержащих аудиоданные из объектов и декодированных каналов; и

преобразуют (1700) определенное число выходных каналов (1205) в выходной формат,

при этом в способе декодирования кодированных аудиоданных обработка (1200) множества декодированных объектов обходится, и множество декодированных каналов подается в постобработку (1700), когда кодированные аудиоданные не содержат аудиообъекты, и множество декодированных объектов и множество декодированных каналов подаются в обработку (1200) множества декодированных объектов, когда кодированные аудиоданные содержат кодированные каналы и кодированные объекты.

24. Постоянный носитель информации, содержащий сохраненную на нем компьютерную программу для осуществления при выполнении на компьютере или процессоре способа по п. 22 или 23.

CPC - классификация

G G1 G10 G10L G10L1 G10L19 G10L19/G10L19/0 G10L19/00 G10L19/008 G10L19/02 G10L19/028 G10L19/1 G10L19/18 G10L19/2 G10L19/20 G10L19/22 H H0 H04 H04S H04S2 H04S24 H04S240 H04S2400 H04S2400/H04S2400/0 H04S2400/03 H04S2400/1 H04S2400/11 H04S3 H04S3/H04S3/0 H04S3/00 H04S3/008

IPC - классификация

G G1 G10 G10L G10L1 G10L19 G10L19/G10L19/0 G10L19/00 G10L19/008 G10L19/03 G10L19/032 G10L19/2 G10L19/22 H H0 H04 H04S H04S3 H04S3/H04S3/0 H04S3/00

Получить PDF