System and method for automatic page registration and...

G - Physics – 06 – K

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06K 9/20 (2006.01) G06T 3/00 (2006.01)

Patent

CA 2192436

A system and method automatically detect user defined zones in a document image of a form, compensating for skew and displacement of the image with inspect to an original image of form. The system provides a mechanism to input an image for a form document, such as a scanner. The system processes the image to reduce its resolution and to remove significant skew. The image is presented to the user to define the zones. These zones are areas from which the user desires to extract meaningful data through optical character recognition, such as names, dates, addresses, and items on an invoice form. The system further processes the image to remove horizontal and vertical lines, and to create a number of blocks, representing either text or image data. The lines are removed and the blocks form by runlength smoothing with various parameters. The blocks form clusters of connected pixels. The blocks are labeled such that any set of connected blocks share a unique identification value. Additional data is collected on the commonly labeled blocks to select those blocks useful to definition of a template. The template is a collection of vectors between the centroids of each of the selected blocks. A second document image for processing is obtained, and similarly processed to minimize, deskew, and identify blocks and vectors therein. The vectors in the second document image are compared with vectors in a user selected template to determine the location of user defined zones in the second document image.

Ce systeme et ce procédé permettent de détecter automatiquement des zones définies par un utilisateur dans une image d'un document tel qu'un formulaire, en compensant l'inclinaison et le déplacement de cette image par rapport à une image originale du formulaire. Ce système comprend un mécanisme d'introduction d'images dans un document tel qu'un formulaire, un scanneur par exemple. Ce système traite l'image pour en réduire la résolution et en supprimer une inclinaison significative. L'image est présentée à l'utilisateur qui y définit des zones, à savoir des endroits dont il souhaite extraire, par reconnaissance optique de caractères, des données significatives telles que noms, dates, adresses et articles indiqués sur une facture. Ce système traite aussi l'image pour en supprimer les lignes horizontales et verticales et pour créer un certain nombre de blocs représentant des données d'image ou de texte. Ces lignes sont supprimées et les blocs sont formés par lissage de longueur de passe avec différents paramètres. Ils constituent des ensembles de pixels reliés et sont étiquetés de façon que tout jeu de blocs reliés partage une valeur d'identification unique. Des données supplémentaires sont collectées sur ces blocs à étiquetage commun, ce qui permet de choisir ceux des blocs utiles pour définir un gabarit qui est constitué d'un ensemble de vecteurs placés entre les centres de gravité de chacun des blocs choisis. On obtient une deuxième image de document, qui est traitée de la même manière pour en réduire la résolution et la redresser, et pour qu'y soient identifiés des blocs et des vecteurs. Les vecteurs de cette deuxième image de document sont comparés à ceux d'un gabarit sélectionné par l'utilisateur, ce qui permet de déterminer dans cette image l'emplacement de zones définies par l'utilisateur.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

System and method for automatic page registration and... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with System and method for automatic page registration and..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for automatic page registration and... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1997310

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.