G - Physics – 06 – K
Patent
G - Physics
06
K
G06K 9/20 (2006.01) G06T 3/00 (2006.01)
Patent
CA 2192436
A system and method automatically detect user defined zones in a document image of a form, compensating for skew and displacement of the image with inspect to an original image of form. The system provides a mechanism to input an image for a form document, such as a scanner. The system processes the image to reduce its resolution and to remove significant skew. The image is presented to the user to define the zones. These zones are areas from which the user desires to extract meaningful data through optical character recognition, such as names, dates, addresses, and items on an invoice form. The system further processes the image to remove horizontal and vertical lines, and to create a number of blocks, representing either text or image data. The lines are removed and the blocks form by runlength smoothing with various parameters. The blocks form clusters of connected pixels. The blocks are labeled such that any set of connected blocks share a unique identification value. Additional data is collected on the commonly labeled blocks to select those blocks useful to definition of a template. The template is a collection of vectors between the centroids of each of the selected blocks. A second document image for processing is obtained, and similarly processed to minimize, deskew, and identify blocks and vectors therein. The vectors in the second document image are compared with vectors in a user selected template to determine the location of user defined zones in the second document image.
Ce systeme et ce procédé permettent de détecter automatiquement des zones définies par un utilisateur dans une image d'un document tel qu'un formulaire, en compensant l'inclinaison et le déplacement de cette image par rapport à une image originale du formulaire. Ce système comprend un mécanisme d'introduction d'images dans un document tel qu'un formulaire, un scanneur par exemple. Ce système traite l'image pour en réduire la résolution et en supprimer une inclinaison significative. L'image est présentée à l'utilisateur qui y définit des zones, à savoir des endroits dont il souhaite extraire, par reconnaissance optique de caractères, des données significatives telles que noms, dates, adresses et articles indiqués sur une facture. Ce système traite aussi l'image pour en supprimer les lignes horizontales et verticales et pour créer un certain nombre de blocs représentant des données d'image ou de texte. Ces lignes sont supprimées et les blocs sont formés par lissage de longueur de passe avec différents paramètres. Ils constituent des ensembles de pixels reliés et sont étiquetés de façon que tout jeu de blocs reliés partage une valeur d'identification unique. Des données supplémentaires sont collectées sur ces blocs à étiquetage commun, ce qui permet de choisir ceux des blocs utiles pour définir un gabarit qui est constitué d'un ensemble de vecteurs placés entre les centres de gravité de chacun des blocs choisis. On obtient une deuxième image de document, qui est traitée de la même manière pour en réduire la résolution et la redresser, et pour qu'y soient identifiés des blocs et des vecteurs. Les vecteurs de cette deuxième image de document sont comparés à ceux d'un gabarit sélectionné par l'utilisateur, ce qui permet de déterminer dans cette image l'emplacement de zones définies par l'utilisateur.
Rebus Technology Inc.
Sim & Mcburney
LandOfFree
System and method for automatic page registration and... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with System and method for automatic page registration and..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for automatic page registration and... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1997310