Methods and systems for matching records and normalizing names

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/27 (2006.01) G06F 17/30 (2006.01)

Patent

CA 2750609

Methods and systems are provided for normalizing strings and for matching records. In one implementation, a string is tokenized into compo-nents. Sequences of tags are generated by assigning tags to the components. A sequence of states is deter-mined based on the sequences of tags. A normalized string is generated by normalizing the sequence of the states. A key record including key fields is extracted from a first data source. A candidate record including candidate fields is extracted from a second data source. A numerical record including numerical fields is computed by comparing the key fields and the can-didate fields using comparison functions. Matching functions determined by an additive logistic regres-sion method are applied to the numerical fields. Whether the key record and the candidate record are a match is determined based on a sum of results of the matching functions.

La présente invention concerne des procédés et des systèmes permettant de normaliser des chaînes et de mettre en correspondance des enregistrements. Selon un des modes de réalisation, une chaîne est marquée comme constituée d'éléments. Des séquences de balises sont produites par affectation de balises aux éléments. Une séquence d'états est déterminée à partir des séquences de balises. Une chaîne normalisée est produite par normalisation de la séquence des états. Un enregistrement clé comprenant des champs clés est extrait d'une première source de données. Un enregistrement candidat comprenant des champs candidats est extrait d'une seconde source de données. Un enregistrement numérique comprenant des champs numériques est calculé par comparaison des champs clés et des champs candidats au moyen de fonctions de comparaison. Des fonctions de mise en correspondance déterminées par une méthode de régression logistique additive sont appliquées aux champs numériques. La correspondance entre l'enregistrement clé et l'enregistrement candidat est déterminée en fonction de la somme des résultats des fonctions de mise en correspondance.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Methods and systems for matching records and normalizing names does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Methods and systems for matching records and normalizing names, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Methods and systems for matching records and normalizing names will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1806815

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.