G - Physics – 10 – L
Patent
G - Physics
10
L
G10L 15/00 (2006.01) G10L 15/04 (2006.01) G10L 21/00 (2006.01) G10L 21/04 (2006.01)
Patent
CA 2577726
A system (300) is provided for training an acoustic model (330) for use in speech recognition . In particular, such a system (300) may b used to perform training based on a spoken audio stream (302) and a non-literal transcript (304) of the spoken audio stream (302). Such a system (300) may identify text (308) in the non-literal transcript (304) which represents concepts having multiple spoken forms. The system (300) may attempt to identify the actual spoken form in the audio stream which produced the corresponding text in the non- literal transcript (304), and thereby produce a revised transcript which more accurately represents the spoken audio stream (302). The revised, and more accurate, transcript may be used to train the acoustic model (330), thereby producing a better acoustic model than tha which would be produced using conventional techniques, which perform training based directly on the original non-literal transcript.
L'invention concerne un système d'adaptation d'un modèle acoustique utilisé en reconnaissance vocale. Un tel système peut être utilisé pour procéder à une adaptation basée sur un flux audio vocal et une transcription non littérale du flux audio vocal. Un tel système peut identifier un texte dans la transcription non littérale représentant des concepts adoptant de multiples formes vocales. Le système peut tenter d'identifier la forme vocale réelle dans le flux audio ayant généré le texte correspondant dans la transcription non littérale, générant ainsi une transcription révisée représentant plus précisément le flux audio vocal. La transcription révisée et plus précise peut être utilisée pour adapter le modèle acoustique, générant ainsi un modèle acoustique amélioré par rapport à celui obtenu à l'aide de techniques classiques, procédant à une adaptation basée directement sur la transcription non littérale originale.
Finke Michael
Fritsch Juergen
Koll Detlef
Woszczyna Monika
Yegnanarayanan Girija
Borden Ladner Gervais Llp
Multimodal Technologies Inc.
Multimodal Technologies Llc
LandOfFree
Document transcription system training does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Document transcription system training, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Document transcription system training will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1425065