Speech recognition method using a two-pass search

G - Physics – 10 – L

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G10L 15/08 (2006.01) G10L 15/14 (2006.01) G10L 9/00 (1995.01)

Patent

CA 2163017

A speech recognition method uses a two-pass search to match an unknown utterance to a vocabulary word. Words in the vocabulary are represented by concatenated allophone models and the vocabulary is represented as a network. On the first pass of the search, a one- state duration constrained model is used to search the vocabulary network. The one-state model has as its transition probability the maximum observed transitional probability (model distance) of the unknown utterance for the corresponding allophone model. Words having top scores are chosen from the first pass search, and rescored using a full Viterbi trellis with the complete allophone models and model distances. The rescores are sorted to provide a few top choices. Using a second set of speech parameters these few top choices are again rescored. Comparison of the scores using each set of speech parameters determines a recognition choice. Post processing is also possible to further enhance recognition accuracy. Test results indicate that the two pass search provides approximately the same recognition accuracy as a full Viterbi search of the vocabulary network.

Un procédé de reconnaissance de la parole utilise une recherche à deux passages pour faire correspondre une prononciation inconnue avec un mot de vocaculaire. Les mots dans le vocabulaire sont représentés par des modèles allophones concaténés et le vocabulaire est représenté comme un réseau. Lors du premier passage de la recherche, un modèle forcé d'une durée d'état 1 est utilisé, pour rechercher le réseau de vocabulaire. Pour sa probabilité transitionnelle, ce modèle d'état 1 a la probabilité transitionnelle maximale observée (distance de modèle) de la prononciation inconnue, pour le modèle allophone correspondant. Les mots ayant des scores élevés sont choisis d'après la première recherche et ils sont retraités en utilisant un treillis de Viterbi complet avec les modèles allophones complets et les distances de modèles. Les nouveaux scores sont triés pour obtenir un choix limité. En utilisant un second jeu de paramètres de la parole ce choix limité est de nouveu traité. La comparaison des scores en utilisant chaque jeu de paramètres de la parole définit un choix de reconnaissance. Un traitement ultérieur est également possible pour améliorer encore la précision de la reconnaissance. Les résultats des essais indiquent que la recherche à deux passages donne approximativement la même précision de reconnaissance que la recherche de Viterbi complète du réseau vocabulaire.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Speech recognition method using a two-pass search does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Speech recognition method using a two-pass search, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Speech recognition method using a two-pass search will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1412839

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.