G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01) G10L 15/18 (2006.01)
Patent
CA 2321112
A language model (70) is used in a speech recognition system (60) which has access to a first, smaller data store (72) and a second, larger data store (74). The language model (70) is adapted by formulating an information retrieval query based on information contained in the first data store (72) and querying the second data store (74), Information retrieved from the second data store (74) is used in adapting the language model (70). Also, language models are used in retrieving information from the second data store (74). Language models are built based on information in the first data store (72), and based on information in the second data store (74). The perplexity of a document in the second data store (74) is determined, given the first language model, and given the second language model. Relevancy of the document is determined based upon the first and second perplexities. Documents are retrieved which have a relevancy measure that exceeds a threshold level.
La présente invention concerne un modèle de langage (70) utilisé dans un système de reconnaissance de la parole (60) qui a accès à une première mémoire (72) de taille réduite et une seconde mémoire (74) de taille plus importante. Le modèle de langage (70) est adapté par formulation d'une demande de recherche d'information en fonction des données contenues dans la première mémoire (72) et interrogation de la seconde mémoire (74). L'information extraite de la seconde mémoire (74) sert à adapter le modèle de langage (70). Par ailleurs, on utilise des modèles de langage pour rechercher des informations dans la seconde mémoire (74). Ces modèles de langage sont élaborés à partir d'informations contenues dans la première mémoire (72) et dans la seconde mémoire (74). La complexité d'un document dans la seconde mémoire (74) est déterminée en fonction du premier et du second modèle de langage. La pertinence du document est déterminée en fonction de la première et de la seconde complexité. Sont extraits les documents dont l'indice de pertinence dépasse une valeur de seuil.
Huang Xuedong D.
Mahajan Milind V.
Microsoft Corporation
Oyen Wiggs Green & Mutala Llp
LandOfFree
Information retrieval and speech recognition based on... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Information retrieval and speech recognition based on..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Information retrieval and speech recognition based on... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1557868