G - Physics – 10 – L
Patent
G - Physics
10
L
G10L 15/10 (2006.01) G10L 15/12 (2006.01) G10L 15/14 (2006.01)
Patent
CA 2264773
A speech processing system (10) incorporates an analogue to digital converter (16) to digitise input speech signals for Fourier transformation to produce short-term spectral cross-sections. These cross-sections are compared with one hundred and fifty reference patterns in a store (34), the patterns having respective stored sets of formant frequencies assigned thereto by a human expert. Six stored patterns most closely matching each input cross-section are selected for further processing by dynamic programming, which indicates the pattern which is a best match to the input cross-section by using frequency- scale warping to achieve alignment. The stores formant frequencies of the best matching pattern are modified by the frequency warping, and the results are used as formant frequency estimates for the input cross-section. The frequencies are further refined on the basis of the shape of the input cross- section near to the chosen formants. Formant amplitudes are produced from input cross-section amplitudes at estimated formant frequencies. The formant frequencies and amplitudes are used with a computer (25) to provide speech indications or with a Hidden Markov Model word matcher (24) to provide word recognition.
Un système (10) de traitement de la parole comprend un convertisseur analogique-numérique (16) qui numérise des signaux vocaux d'entrée pour produire, au moyen d'une transformée de Fourier, des sections transversales spectrales à court terme. Ces sections transversales sont comparées avec cent cinquante modèles de référence enregistrés dans une mémoire (34), chacun des modèles incluant des séries mémorisées de fréquences des formants qui lui sont attribués par un expert humain. Six modèles mémorisés, correspondant le plus étroitement à chacune des sections transversales, sont sélectionnés pour subir un nouveau traitement par programmation dynamique, lequel indique le modèle constitutant un meilleur appariement avec la section transversale d'entrée en utilisant une distorsion amplitude-fréquence pour réaliser un alignement. Les fréquences des formants mémorisées du modèle constitutant le meilleur appariement sont modifiées par la distorsion de fréquence, et les résultats sont utilisés pour estimer la fréquence des formants pour la section transversale d'entrée. Les fréquences sont de nouveau affinées en fonction de la forme de la section transversale d'entrée placée à proximité des formants sélectionnés. Des amplitudes de formants sont obtenues à partir d'amplitudes de la section transversale d'entrée, à des fréquences de formants estimées. Les fréquences et amplitudes de formants sont utilisées à l'aide d'un ordinateur (25) pour produire des indications vocales ou d'un concordeur de mots (24) utilisant le modèle de Markov caché pour réaliser la reconnaissance vocale.
Fetherstonhaugh & Co.
Qinetiq Limited
The Secretary Of State For Defence Of The United Kingdom Of Grea
LandOfFree
Speech processing system does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Speech processing system, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Speech processing system will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1827343