G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/27 (2006.01) G06F 17/30 (2006.01) G06K 9/72 (2006.01)
Patent
CA 2222590
A system and method for more efficiently comparing an unverified string to a lexicon, which filters the lexicon through multiple steps to reduce the number of entries to be directly compared with the unverified string. The method begins by preparing the lexicon with an n-gram encoding, partitioning and hashing process, which can be accomplished in advance of any processing of unverified strings. The unknown is compared first by partitioning and hashing it in the same way to reduce the lexicon in a computationally inexpensive manner. This is followed by an encoded vector comparison step, and finally by a direct string comparison step, which is the most computationally expensive. The reduction of the lexicon is accomplished without arbitrarily eliminating any large portions of the lexicon that might contain relevant candidates. At the same time, the method avoids the need to compare the unverified string directly or indirectly with all the entries in the lexicon. The final candidate list includes only highly possible and ranked candidates for the unverified string, and the size of the final list is adjustable.
Le procédé et le système décrits permettent de comparer de manière plus efficace une chaîne non vérifiée de caractères avec un lexique, le lexique étant filtré en étapes multiples afin de réduire le nombre d'entrées à comparer directement avec la chaîne non vérifiée de caractères. Le procédé commence par une préparation du lexique par codage à n grammes, cloisonnement et hachage. Cette préparation peut se faire avant que toute chaîne non vérifiée de caractères ne soit traitée. On compare la chaîne inconnue premièrement en la cloisonnant et en la hachant de manière similaire afin de réduire le lexique au moyen de peu de calculs. L'étape suivante est une étape de comparaison du vecteur codé et la dernière étape est une étape de comparaison directe de la chaîne de caractères, cette dernière étape nécessitant le plus de calculs. La réduction du lexique est réalisée sans éliminer de façon arbitraire de grandes parties du lexique susceptibles de contenir des candidats pertinents. En même temps, le procédé permet de ne pas comparer la chaîne non vérifiée de caractères à toutes les entrées du lexique, que ce soit directement ou indirectement. La liste définitive de candidats comprend uniquement des candidats très probables et de haut rang de similitude avec la chaîne non vérifiée de caractères, et la taille de la liste définitive est ajustable.
Finlayson & Singlehurst
United Parcel Service Of America Inc.
LandOfFree
System and method for reducing the search scope in a lexicon does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with System and method for reducing the search scope in a lexicon, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for reducing the search scope in a lexicon will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1458709