G - Physics – 10 – L
Patent
G - Physics
10
L
G10L 19/00 (2006.01) G10L 21/02 (2006.01)
Patent
CA 2341712
A multi-rate speech codec supports a plurality of encoding bit rate modes by adaptively selecting encoding bit rate modes to match communication channel restrictions. In higher bit rate encoding modes, an accurate representation of speech through CELP (code excited linear prediction) and other associated modeling parameters are generated for higher quality decoding and reproduction. For each bit rate mode selected, pluralities of fixed or innovation subcodebooks are selected for use in generating innovation vectors. The speech coder distinguishes various voice signals as a function of their voice content. For example, a Voice Activity Detection (VAD) algorithm selects an appropriate coding scheme depending on whether the speech signal comprises active or inactive speech. The encoder may consider varying characteristics of the speech signal including sharpness, a delay correlation, a zero-crossing rate, and a residual energy. In another embodiment of the present invention, code excited linear prediction is used for voice active signals whereas random excitation is used for voice inactive signals; the energy level and spectral content of the voice inactive signal may also be used for noise coding. The multi-rate speech codec may employ distributed detection and compensation processing the speech signal. For high quality perceptual speech reproduction, the speech codec may perform noise detection in both an encoder and decoder. The noise detection may be coordinated between the encoder and decoder. Similarly, noise compensation may be performed in a distributed manner among both the decoder and the encoder.
Un codec vocal à débits multiples accepte une pluralité de modes de codage à débit binaire en sélectionnant de façon adaptative les modes de codage à débit binaire de manière à faire face aux restrictions de canaux de communication. Dans des modes de codage à débit binaire plus élevé, une représentation vocale précise est créée par PLCOSE/TNP (prévision linéaire par codes d'ondes de signaux excitateurs en transmission numérique de la parole) et d'autres paramètres associés de modélisation, de manière à produire un décodage et une reproduction de meilleure qualité. Pour chaque mode à débit binaire sélectionné, des pluralités de sous-tables de codes fixées ou d'innovation sont sélectionnées en vue d'être utilisées pour générer des vecteurs d'innovation. Le codeur vocal distingue les divers signaux vocaux en fonction de leur contenu vocal. Par exemple, un algorithme de Détection d'Activité Vocale (VAD) sélectionne un système approprié de codage selon que le signal vocal possède un contenu vocal actif ou inactif. Les caractéristiques variantes du signal vocal, dont son acuité, une corrélation des retards, un taux de passage par zéro et l'énergie résiduelle, peuvent être prises en compte par le codeur vocal. Dans un autre mode de réalisation de cette invention, la prévision linéaire par codes est utilisée pour les signaux actifs vocaux, tandis que l'excitation aléatoire est utilisée pour les signaux inactifs vocaux. Le niveau d'énergie et le contenu spectral du signal inactif vocal peuvent être également utilisés pour le codage du bruit. La détection répartie et la compensation traitant le signal vocal peuvent être utilisées par le codec vocal à débits multiples. Afin d'obtenir une reproduction vocale de perception de haute qualité, la détection du bruit dans un codeur et un décodeur peut être effectuée par le codec vocal. Il est possible de coordonner la détection du bruit entre le codeur et le décodeur. De manière analogue, la compensation du bruit peut être effectuée à la fois entre le codeur et le décodeur dans un mode de répartition.
Benyassine Adil
Gao Yang
Su Huan-Yu
Thyssen Jes
Cassan Maclean
Conexant Systems Inc.
Mindspeed Technologies Inc.
LandOfFree
Speech codec employing speech classification for noise... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Speech codec employing speech classification for noise..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Speech codec employing speech classification for noise... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1701026