15-07-2016 дата публикации
Номер: KR0101640188B1
... 본 발명은 심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하기 위한 음성 검출 장치에 관한 것으로서, 보다 구체적으로는 음성 검출 장치가, (1) 학습 단계에서, 주변 잡음에 의해 오염된 음성 신호를 입력 받고, 입력된 음성 신호의 분산 값에 기초하여, 사전(a priori) 신호 대 잡음비(SNR), 사후(a posteriori) 신호 대 잡음비(SNR) 및 우도비(likelihood ratio, LR)를 이용한 특징 벡터를 추출하는 단계; (2) 상기 학습 단계에서, 상기 추출된 특징 벡터의 결과를 이용하여, 복수의 비선형 은닉 층을 갖는 심화 신경망의 가중치 및 바이어스를 초기화하여 상기 심화 신경망을 선행 학습시키는 단계; (3) 상기 학습 단계에서, 상기 추출된 특징 벡터의 결과와 음성의 존재/부재에 대한 레이블링 값을 이용하여, 기울기 하강 기반의 역전이 알고리즘에 기초하여 상기 심화 신경망을 최적화시키는 단계; 및 (4) 분류 단계에서, 상기 특징벡터 추출 방법을 통해서 얻어진 특징벡터로부터 상기 학습된 심화신경망을 통해서 얻어진 결과를 이용한 결정 함수에 기초하여, 상기 입력된 음성 신호를 음성 구간 또는 잡음 구간으로 분류하는 단계를 포함하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하는 음성 검출 장치에 따르면, 학습 단계에서, 주변 잡음에 의해 오염된 음성 신호를 입력 받고, 입력된 음성 신호의 분산 값에 기초하여, 사전(a priori) 신호 대 잡음비(SNR), 사후(a posteriori) 신호 대 잡음비(SNR) 및 우도비(likelihood ratio, LR)를 이용한 특징 벡터를 추출하며, 상기 추출된 특징 벡터의 결과를 이용하여, 복수의 비선형 은닉 층을 갖는 심화 신경망의 가중치 및 바이어스를 초기화하여 상기 심화 신경망을 선행 학습시키고, 상기 추출된 특징 벡터의 결과와 음성의 존재/부재에 대한 레이블링 값을 이용하여, 기울기 ...
Подробнее