G - Physics – 06 – K
Patent
G - Physics
06
K
G06K 9/20 (2006.01)
Patent
CA 2733897
Methods and systems for segmenting printed media pages into individual articles quickly and efficiently. A printed media based image that may include a variety of columns, headlines, images, and text is input into the system which comprises a block segmenter and a article segmenter system. The block segmenter identifies and produces blocks of textual content from a printed media image while the article segmenter system determines which blocks of textual content belong to one or more articles in the printed media image based on a classifier algorithm. A method for segmenting printed media pages into individual articles is also presented.
L'invention concerne des procédés et des systèmes pour segmenter rapidement et efficacement des pages de support imprimé en articles individuels. Une image fondée sur un support imprimé qui peut comprendre une variété de colonnes, titres, images, et texte est entrée dans le système qui comprend un segmenteur de bloc et un système de segmenteur d'article. Le segmenteur de bloc identifie et produit des blocs de contenu textuel à partir d'une image de support imprimé, tandis que le système de segmenteur d'article détermine quels blocs de contenu textuel appartiennent à un ou plusieurs articles dans l'image de support imprimé sur la base d'un algorithme de classifieur. Un procédé pour segmenter des pages de support imprimé en articles individuel est également présenté.
Chaudhury Krishnendu
Jain Ankur
Sahasranaman Vivek
Saxena Shobhit
Google Inc.
Gowling Lafleur Henderson Llp
LandOfFree
Segmenting printed media pages into articles does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Segmenting printed media pages into articles, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Segmenting printed media pages into articles will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1761011