G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01) G06F 17/27 (2006.01)
Patent
CA 2710753
A computer-based method for character string matching of a candidate character string with a plurality of character string records stored in a database is described. The method includes a) identifying a set of reference character strings in the database, the reference character strings identified utilizing an optimization search for a set of dissimilar character strings, b) generating an n-gram representation for one of the reference character strings in the set of reference character strings, c) generating an n-gram representation for the candidate character string, d) determining a similarity between the n-gram representations, e) repeating steps b) and d) for the remaining reference character strings in the set of identified reference character strings, and f) indexing the candidate character string within the database based on the determined similarities between the n-gram representation of the candidate character string and the reference character strings in the identified set.
La présente invention concerne un procédé informatique permettant la mise en correspondance d'une chaîne de caractères candidate avec une pluralité d'enregistrements de chaînes de caractères mémorisés dans une base de données. Le procédé consiste à a) identifier un ensemble de chaînes de caractères de référence dans la base de données, les chaînes de caractères de référence étant identifiées à l'aide d'une recherche d'optimisation portant sur un ensemble de chaînes de caractères dissemblables, b) générer une représentation à n-grammes pour une des chaînes de caractères de référence dans l'ensemble de chaînes de caractères de référence, c) générer une représentation à n-grammes pour la chaîne de caractères candidate, d) déterminer une similarité entre les représentations à n-grammes, e) recommencer les étapes b) et d) pour les autres chaînes de caractères de référence dans l'ensemble de chaînes de caractères de référence identifiées, et f) indexer la chaîne de caractères candidate dans la base de données sur la base des similarités déterminées entre les représentations à n-grammes de la chaîne de caractères candidate et des chaînes de caractères de référence dans l'ensemble identifié.
Mcgeehan Thomas
Merz Christopher J.
Craig Wilson And Company
Mastercard International Incorporated
LandOfFree
Methods and systems for implementing approximate string... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Methods and systems for implementing approximate string..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Methods and systems for implementing approximate string... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1662056