G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2337079
A search system for information retrieval comprises a data structure in the form of a non-evenly spaced sparse suffix tree for storing suffixes of words and/or symbols, or sequences thereof, in a text T, a metric M comprising combining edit distance metrics for an approximate degree of matching respectively between words and/or symbols, or between sequences thereof, in the text T and a query Q, the latter distance metric including weighting cost functions for edit operations which transform a sequence S of the text into a sequence P of the query Q, and search algorithms for determining the degree of matching respectively between words and/or symbols, or between sequences thereof, in respectively the text T and the query Q, such that information R is retrieved with a specified degree of matching with the query Q. Optionally the search system also comprises algorithms for determining exact matching such that information R may be retrieved with an exact degree of matching with the query Q. A method in the search system comprises generating the data structure as a word-spaced sparse suffix tree, storing sequence information of the words in the text T in the generated suffix tree, generating a combined edit distant metric for words or sequences thereof in the text T and a query word q or sequences thereof in the query Q and including word-weighting cost functions for the sequence-transforming edit operations, and determining the degree of matching between retrieved information R and a query Q. - Use in an approximate search engine.
L'invention porte sur un système de recherche d'informations comportant; une structure de données de stockage d'un texte T; un métrique M combiné de mesure du niveau de concordance évaluant le niveau approximatif de concordance entre des mots et/ou des symboles, ou des phrases en étant faites, du texte T, et des mots ou symboles d'une séquence P; des fonctions de pondération des mots dans des opérations de mise au point de textes transformant une séquence S de mots ou de symboles en une séquence P; et un algorithme de recherche déterminant le niveau de concordance entre des mots ou séquences de mots dans une représentation présentant respectivement le texte T et la question Q. L'algorithme recherche la structure de données en posant la question Q et récupère l'information correspondant spécifiquement. L'invention porte en outre sur un procédé lié à un système de recherche d'informations produisant un arbre à suffixe de mots clairsemés stockant des suffixes de mots d'un texte T sous forme d'une séquence de mots d'information, recourant à un métrique de mesure du niveau de concordance entre les séquences de mots S et P, comportant des fonctions de coût pondérées en mots pour les opérations de mise au point de textes, et déterminant les correspondances entre les séquences de mots Sr des informations R récupérées et les séquences de mots Pq de la demande Q en calculant le niveau de concordance pour toutes les correspondances. L'invention porte en outre sur son utilisation dans un automate de recherche par approximation.
Fast Search & Transfer Asa
Norton Rose Or S.e.n.c.r.l. S.r.l./llp
Yahoo! Inc.
LandOfFree
A search system and method for retrieval of data, and the... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with A search system and method for retrieval of data, and the..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and A search system and method for retrieval of data, and the... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1605167