A search system and method for retrieval of data, and the...

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/30 (2006.01)

Patent

CA 2337079

A search system for information retrieval comprises a data structure in the form of a non-evenly spaced sparse suffix tree for storing suffixes of words and/or symbols, or sequences thereof, in a text T, a metric M comprising combining edit distance metrics for an approximate degree of matching respectively between words and/or symbols, or between sequences thereof, in the text T and a query Q, the latter distance metric including weighting cost functions for edit operations which transform a sequence S of the text into a sequence P of the query Q, and search algorithms for determining the degree of matching respectively between words and/or symbols, or between sequences thereof, in respectively the text T and the query Q, such that information R is retrieved with a specified degree of matching with the query Q. Optionally the search system also comprises algorithms for determining exact matching such that information R may be retrieved with an exact degree of matching with the query Q. A method in the search system comprises generating the data structure as a word-spaced sparse suffix tree, storing sequence information of the words in the text T in the generated suffix tree, generating a combined edit distant metric for words or sequences thereof in the text T and a query word q or sequences thereof in the query Q and including word-weighting cost functions for the sequence-transforming edit operations, and determining the degree of matching between retrieved information R and a query Q. - Use in an approximate search engine.

L'invention porte sur un système de recherche d'informations comportant; une structure de données de stockage d'un texte T; un métrique M combiné de mesure du niveau de concordance évaluant le niveau approximatif de concordance entre des mots et/ou des symboles, ou des phrases en étant faites, du texte T, et des mots ou symboles d'une séquence P; des fonctions de pondération des mots dans des opérations de mise au point de textes transformant une séquence S de mots ou de symboles en une séquence P; et un algorithme de recherche déterminant le niveau de concordance entre des mots ou séquences de mots dans une représentation présentant respectivement le texte T et la question Q. L'algorithme recherche la structure de données en posant la question Q et récupère l'information correspondant spécifiquement. L'invention porte en outre sur un procédé lié à un système de recherche d'informations produisant un arbre à suffixe de mots clairsemés stockant des suffixes de mots d'un texte T sous forme d'une séquence de mots d'information, recourant à un métrique de mesure du niveau de concordance entre les séquences de mots S et P, comportant des fonctions de coût pondérées en mots pour les opérations de mise au point de textes, et déterminant les correspondances entre les séquences de mots Sr des informations R récupérées et les séquences de mots Pq de la demande Q en calculant le niveau de concordance pour toutes les correspondances. L'invention porte en outre sur son utilisation dans un automate de recherche par approximation.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

A search system and method for retrieval of data, and the... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with A search system and method for retrieval of data, and the..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and A search system and method for retrieval of data, and the... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1605167

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.