G - Physics – 10 – L
Patent
G - Physics
10
L
G10L 17/00 (2006.01)
Patent
CA 2609247
Disclosed herein is an automatic dual-step, text~ independent, language- independent speaker voice-print creation and speaker recognition method, wherein a neural network-based technique is used in a first step and a Markov model-based technique is used in the second step. In particular, the first step uses a neural network-based technique for decoding the content of what is uttered by the speaker in terms of language~ independent acoustic-phonetic classes, wherein the second step uses the sequence of language-independent acoustic-phonetic classes from the first step and employs a Markov model-based technique for creating the speaker voice-print and for recognizing the speaker. The combination of the two steps enables improvement in the accuracy and efficiency of the speaker voice-print creation and of the speaker recognition, without setting any constraints on the lexical content of the speaker utterance and on the language thereof.
L'invention porte sur un procédé de création automatique, en deux étapes, d'empreintes vocales d'un locuteur non liées à un texte, non liées à un langage et sur un procédé de reconnaissance du locuteur. Pour cela, on utilise, dans une première étape, une technique basée sur un réseau neuronal et, dans une seconde étape, une technique basée sur un modèle markovien. La première étape utilise, notamment, une technique basée sur un réseau neuronal pour décoder le contenu d'émission de paroles du locuteur en termes de classes acoustiques-phonétiques non liées à un langage. La seconde étape utilise la séquence des classes acoustiques-phonétiques non liées à un langage, à partir de la première étape, et utilise une technique basée sur le modèle markovien pour créer l'empreinte vocale du locuteur et pour reconnaître le locuteur. La combinaison des deux étapes permet d'améliorer la précision et l'efficacité de la création d'empreintes vocales du locuteur et de la reconnaissance du locuteur sans mettre de contraintes quelconques sur le contenu lexical de l'émission de paroles du locuteur et sur son langage.
Colibro Daniele
Fissore Luciano
Vair Claudio
Loquendo S.p.a.
Ridout & Maybee Llp
LandOfFree
Automatic text-independent, language-independent speaker... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Automatic text-independent, language-independent speaker..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Automatic text-independent, language-independent speaker... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1486352