G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2653932
Indexing, searching, and retrieving the content of speech documents (including but not limited to recorded books, audio broadcasts, recorded conversations) is accomplished by finding and retrieving speech documents that are related to a query term at a conceptual level, even if the speech documents does not contain the spoken (or textual) query terms. Concept-based cross-media information retrieval is used. A term-phoneme/document matrix is constructed from a training set of documents. Documents are then added to the matrix constructed from the training data. Singular Value Decomposition is used to compute a vector space from the term-phoneme/document matrix. The result is a lower-dimensional numerical space where term-phoneme and document vectors are related conceptually as nearest neighbors. A query engine computes a cosine value between the query vector and all other vectors in the space and returns a list of those term-phonemes and/or documents with the highest cosine value.
L'invention propose l'indexation, la recherche et la récupération du contenu de documents vocaux (y compris, mais sans y être limités, le contenu de livres enregistrés, de diffusions audio, de conversations enregistrées) en trouvant et en récupérant des documents vocaux qui sont en relation avec un terme d'interrogation à un niveau conceptuel, même si les documents vocaux ne contiennent pas les termes d'interrogation parlés (ou textuels). Une récupération d'informations multimédia à partir d'un concept est utilisée. Une matrice terme-phonème/document est construite à partir d'un ensemble de documents d'apprentissage. Les documents sont ensuite ajoutés à la matrice construite à partir des données d'apprentissage. Une Décomposition en Valeurs Singulières est utilisée pour calculer un espace vectoriel à partir de la matrice terme-phonème/document. Le résultat est un espace numérique de dimension inférieure dans lequel les vecteurs terme/phonème et document sont en relation conceptuelle sous forme de voisins les plus proches. Un moteur d'interrogations calcule une valeur de cosinus entre le vecteur d'interrogation et tous les autres vecteurs dans l'espace et renvoie une liste de ces terme-phonèmes et/ou documents ayant obtenu la valeur de cosinus la plus élevée.
Bassu Devasis
Behrens Clifford A.
Egan Dennis
Borden Ladner Gervais Llp
Telcordia Licensing Company Llc
Telcordia Technologies Inc.
LandOfFree
Concept based cross media indexing and retrieval of speech... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Concept based cross media indexing and retrieval of speech..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Concept based cross media indexing and retrieval of speech... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1418555