System and method for reducing the search scope in a lexicon

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/27 (2006.01) G06F 17/30 (2006.01) G06K 9/72 (2006.01)

Patent

CA 2222590

A system and method for more efficiently comparing an unverified string to a lexicon, which filters the lexicon through multiple steps to reduce the number of entries to be directly compared with the unverified string. The method begins by preparing the lexicon with an n-gram encoding, partitioning and hashing process, which can be accomplished in advance of any processing of unverified strings. The unknown is compared first by partitioning and hashing it in the same way to reduce the lexicon in a computationally inexpensive manner. This is followed by an encoded vector comparison step, and finally by a direct string comparison step, which is the most computationally expensive. The reduction of the lexicon is accomplished without arbitrarily eliminating any large portions of the lexicon that might contain relevant candidates. At the same time, the method avoids the need to compare the unverified string directly or indirectly with all the entries in the lexicon. The final candidate list includes only highly possible and ranked candidates for the unverified string, and the size of the final list is adjustable.

Le procédé et le système décrits permettent de comparer de manière plus efficace une chaîne non vérifiée de caractères avec un lexique, le lexique étant filtré en étapes multiples afin de réduire le nombre d'entrées à comparer directement avec la chaîne non vérifiée de caractères. Le procédé commence par une préparation du lexique par codage à n grammes, cloisonnement et hachage. Cette préparation peut se faire avant que toute chaîne non vérifiée de caractères ne soit traitée. On compare la chaîne inconnue premièrement en la cloisonnant et en la hachant de manière similaire afin de réduire le lexique au moyen de peu de calculs. L'étape suivante est une étape de comparaison du vecteur codé et la dernière étape est une étape de comparaison directe de la chaîne de caractères, cette dernière étape nécessitant le plus de calculs. La réduction du lexique est réalisée sans éliminer de façon arbitraire de grandes parties du lexique susceptibles de contenir des candidats pertinents. En même temps, le procédé permet de ne pas comparer la chaîne non vérifiée de caractères à toutes les entrées du lexique, que ce soit directement ou indirectement. La liste définitive de candidats comprend uniquement des candidats très probables et de haut rang de similitude avec la chaîne non vérifiée de caractères, et la taille de la liste définitive est ajustable.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

System and method for reducing the search scope in a lexicon does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with System and method for reducing the search scope in a lexicon, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for reducing the search scope in a lexicon will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1458709

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.