Methods and systems for implementing approximate string...

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/30 (2006.01) G06F 17/27 (2006.01)

Patent

CA 2710753

A computer-based method for character string matching of a candidate character string with a plurality of character string records stored in a database is described. The method includes a) identifying a set of reference character strings in the database, the reference character strings identified utilizing an optimization search for a set of dissimilar character strings, b) generating an n-gram representation for one of the reference character strings in the set of reference character strings, c) generating an n-gram representation for the candidate character string, d) determining a similarity between the n-gram representations, e) repeating steps b) and d) for the remaining reference character strings in the set of identified reference character strings, and f) indexing the candidate character string within the database based on the determined similarities between the n-gram representation of the candidate character string and the reference character strings in the identified set.

La présente invention concerne un procédé informatique permettant la mise en correspondance d'une chaîne de caractères candidate avec une pluralité d'enregistrements de chaînes de caractères mémorisés dans une base de données. Le procédé consiste à a) identifier un ensemble de chaînes de caractères de référence dans la base de données, les chaînes de caractères de référence étant identifiées à l'aide d'une recherche d'optimisation portant sur un ensemble de chaînes de caractères dissemblables, b) générer une représentation à n-grammes pour une des chaînes de caractères de référence dans l'ensemble de chaînes de caractères de référence, c) générer une représentation à n-grammes pour la chaîne de caractères candidate, d) déterminer une similarité entre les représentations à n-grammes, e) recommencer les étapes b) et d) pour les autres chaînes de caractères de référence dans l'ensemble de chaînes de caractères de référence identifiées, et f) indexer la chaîne de caractères candidate dans la base de données sur la base des similarités déterminées entre les représentations à n-grammes de la chaîne de caractères candidate et des chaînes de caractères de référence dans l'ensemble identifié.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Methods and systems for implementing approximate string... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Methods and systems for implementing approximate string..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Methods and systems for implementing approximate string... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1662056

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.