G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/27 (2006.01) G06F 17/30 (2006.01)
Patent
CA 2750609
Methods and systems are provided for normalizing strings and for matching records. In one implementation, a string is tokenized into compo-nents. Sequences of tags are generated by assigning tags to the components. A sequence of states is deter-mined based on the sequences of tags. A normalized string is generated by normalizing the sequence of the states. A key record including key fields is extracted from a first data source. A candidate record including candidate fields is extracted from a second data source. A numerical record including numerical fields is computed by comparing the key fields and the can-didate fields using comparison functions. Matching functions determined by an additive logistic regres-sion method are applied to the numerical fields. Whether the key record and the candidate record are a match is determined based on a sum of results of the matching functions.
La présente invention concerne des procédés et des systèmes permettant de normaliser des chaînes et de mettre en correspondance des enregistrements. Selon un des modes de réalisation, une chaîne est marquée comme constituée d'éléments. Des séquences de balises sont produites par affectation de balises aux éléments. Une séquence d'états est déterminée à partir des séquences de balises. Une chaîne normalisée est produite par normalisation de la séquence des états. Un enregistrement clé comprenant des champs clés est extrait d'une première source de données. Un enregistrement candidat comprenant des champs candidats est extrait d'une seconde source de données. Un enregistrement numérique comprenant des champs numériques est calculé par comparaison des champs clés et des champs candidats au moyen de fonctions de comparaison. Des fonctions de mise en correspondance déterminées par une méthode de régression logistique additive sont appliquées aux champs numériques. La correspondance entre l'enregistrement clé et l'enregistrement candidat est déterminée en fonction de la somme des résultats des fonctions de mise en correspondance.
Templar Valentina
Wasson Mark
Zhang Ling Qin
Blake Cassels & Graydon Llp
Lexisnexis Group
LandOfFree
Methods and systems for matching records and normalizing names does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Methods and systems for matching records and normalizing names, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Methods and systems for matching records and normalizing names will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1806815