Speech signal quantization using human auditory models in...

G - Physics – 10 – L

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G10L 19/00 (2006.01) G10L 19/02 (2006.01) G10L 19/12 (2006.01)

Patent

CA 2219358

A speech compression system called "Transform Predictive Coding" or TPC, provides encoding for 7 kHz band speech at 16 kHz sampling at a target bit- rate of 16 or 32 kb/s one or two bits per sample. The system uses short and long term prediction to remove redundancy. The prediction residual is transformed and coded in the frequency domain as shown on the figure by (110) after accepting time domain data from (60) and parameter input from (100), which corrects the spectrum for auditory perception. The TPC coder uses only open-loop quantization as shown by (70) and therefore has low complexity. The speech quality is transparent at 32 kb/s, is very good at 24 kb/s, and is acceptable at 16 kb/s.

La présente invention concerne un système de compression de la parole dénommé "Codage Prédictif par Transformée" ou TPC (pour "Transform Predictive Coding") qui permet de coder la parole de la bande des 7 Khz (échantillonnée à 16 Khz) en atteignant un débit binaire de 16 ou 32 k-octets/s, à raison de 1 à 2 bits par échantillon. Pour annuler les redondances, le système utilise un dispositif prédictif à court terme et à long terme. Le résiduel de prédiction subit une transformation et un codage dans le domaine de fréquences représenté dans la figure, et ce, au niveau du processeur de transformée (110) après prise en compte des données du domaine temporel de l'additionneur (60) et l'entrée des paramètres depuis le processeur de réponse d'amplitude à filtre de mise en forme (100), ce qui corrige le spectre en vue de la perception auditive. Le vocodeur TPC n'utilise qu'une quantification en boucle ouverte comme le démontre la présence d'un extracteur/interpolateur de hauteur de son (70), ce qui fait que le vocodeur TPC n'est que faiblement complexe. La parole est de qualité transparente à 32 k-octets/s, de très bonne qualité à 24 k-octets/s, et acceptable à 16 k-octets/s.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Speech signal quantization using human auditory models in... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Speech signal quantization using human auditory models in..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Speech signal quantization using human auditory models in... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-2070612

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.