Modified levenshtein distance algorithm for coding

G - Physics – 06 – K

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06K 9/62 (2006.01)

Patent

CA 2575229

Methods and systems of mapping of an optical character recognition (OCR) text string to a code included in a coding dictionary by supplementing the Levenshtein Distance Algorithm (LDA) with additional information in the form of adjustments based on particular character substitutions, insertions and deletions together with weighting based on multiple alternatives for the OCR text string. In one embodiment, an OCR text string mapping method (100) includes receiving (110) an OCR text string, comparing (120) it with selected text strings from a coding dictionary, computing (130) modified Levenshtein distances associated with the comparisons by determining (140) substitution penalties, determining (150) insertion penalties, determining (160) deletion penalties and combining (170) the penalties, selecting (180) the best matching text string from the coding dictionary based on the modified Levenshtein distances, determining (190) whether a maximum threshold distance is met, and assigning (200) a code associated with the best matching text string to the OCR text string when met, and assigning (210) a null or no code when not met.

Des méthodes et des systèmes de mise en correspondance d'une chaîne de texte de reconnaissance optique de caractères à un code inclus dans un dictionnaire de codage en complémentant l'algorithme de la distance de Levenshtein avec des renseignements supplémentaires sous forme d'ajustements basés sur des remplacements, des ajouts et des suppressions de caractères particuliers de concert avec une pondération basée sur de multiples alternatives pour la chaîne de texte de reconnaissance optique de caractères. Dans une réalisation, une méthode de mise en correspondance de chaîne de texte de reconnaissance optique de caractères (100) comprend la réception (110) d'une chaîne de texte de reconnaissance optique de caractères, la comparaison (120) avec des chaînes de texte sélectionnées d'un dictionnaire de codage, le calcul (130) des distances de Levenshtein modifiées associés aux comparaisons en déterminant (140) les pénalités de remplacement, en déterminant (150) les pénalités d'ajout, en déterminant (160) les pénalités de suppression et en combinant (170) les pénalités, la sélection (180) de la chaîne de texte à appariement supérieur à partir du dictionnaire de codage basé sur les distances de Levenshtein modifiées, en déterminant (190) si une distance de seuil maximale est satisfaite et en assignant (200) un code associé à la chaîne de texte à appariement supérieur de la chaîne de texte de reconnaissance optique de caractères si une distance de seuil maximale est satisfaite, et en assignant (210) un code nul ou aucun code si une distance de seuil maximale n'est pas satisfaite.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Modified levenshtein distance algorithm for coding does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Modified levenshtein distance algorithm for coding, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Modified levenshtein distance algorithm for coding will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1627336

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.