G - Physics – 06 – K
Patent
G - Physics
06
K
G06K 9/62 (2006.01)
Patent
CA 2575229
Methods and systems of mapping of an optical character recognition (OCR) text string to a code included in a coding dictionary by supplementing the Levenshtein Distance Algorithm (LDA) with additional information in the form of adjustments based on particular character substitutions, insertions and deletions together with weighting based on multiple alternatives for the OCR text string. In one embodiment, an OCR text string mapping method (100) includes receiving (110) an OCR text string, comparing (120) it with selected text strings from a coding dictionary, computing (130) modified Levenshtein distances associated with the comparisons by determining (140) substitution penalties, determining (150) insertion penalties, determining (160) deletion penalties and combining (170) the penalties, selecting (180) the best matching text string from the coding dictionary based on the modified Levenshtein distances, determining (190) whether a maximum threshold distance is met, and assigning (200) a code associated with the best matching text string to the OCR text string when met, and assigning (210) a null or no code when not met.
Des méthodes et des systèmes de mise en correspondance d'une chaîne de texte de reconnaissance optique de caractères à un code inclus dans un dictionnaire de codage en complémentant l'algorithme de la distance de Levenshtein avec des renseignements supplémentaires sous forme d'ajustements basés sur des remplacements, des ajouts et des suppressions de caractères particuliers de concert avec une pondération basée sur de multiples alternatives pour la chaîne de texte de reconnaissance optique de caractères. Dans une réalisation, une méthode de mise en correspondance de chaîne de texte de reconnaissance optique de caractères (100) comprend la réception (110) d'une chaîne de texte de reconnaissance optique de caractères, la comparaison (120) avec des chaînes de texte sélectionnées d'un dictionnaire de codage, le calcul (130) des distances de Levenshtein modifiées associés aux comparaisons en déterminant (140) les pénalités de remplacement, en déterminant (150) les pénalités d'ajout, en déterminant (160) les pénalités de suppression et en combinant (170) les pénalités, la sélection (180) de la chaîne de texte à appariement supérieur à partir du dictionnaire de codage basé sur les distances de Levenshtein modifiées, en déterminant (190) si une distance de seuil maximale est satisfaite et en assignant (200) un code associé à la chaîne de texte à appariement supérieur de la chaîne de texte de reconnaissance optique de caractères si une distance de seuil maximale est satisfaite, et en assignant (210) un code nul ou aucun code si une distance de seuil maximale n'est pas satisfaite.
Kopchik Kurt P.
Oxman Oren I.
Withum Timothy O.
Lockheed Martin Corporation
Ridout & Maybee Llp
LandOfFree
Modified levenshtein distance algorithm for coding does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Modified levenshtein distance algorithm for coding, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Modified levenshtein distance algorithm for coding will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1627336