G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/27 (2006.01) G06Q 30/00 (2006.01)
Patent
CA 2364295
A parsing technique suitable for use in electronic commerce that avoids the disadvantages of known monolithic parsers. The parsing system generates code specific to each input document and data stream type, which may then be updated as needed to handle document-specific idiosyncrasies without requiring modifications to the core parser code. As a user (10) defines parsing rules for extracting data from a representative sample document (15), a visual trainer (16) automatically generates code in the background, referred to as a filer (17), that is specific to that document and that embodies the rules for extracting data from that particular document. The generated code may be modified manually (18) as needed to account for any idiosyncratic conditions associated with the document. Each representative document has associated with it its own filer. A parsing engine (20, 21) comprises a collection of such individual filers appropriate for the types of documents that arise in any given organization. A mapping or other association is maintained between representative document types and their filers. In regular operation, a user selects a data set to be extracted from certain documents. When the parsing engine receives a document in an input data stream, the associated filer is loaded and parses that document for the selected data set. Then another filer is loaded in response to another input document, and so on. The filers may be especially efficiently generated using an object- oriented approach and then dynamically instantiated at run time as may be conveniently achieved, for example, in the Java programming language.
L'invention concerne un système d'analyse destiné à être utilisé dans le commerce électronique. Ce système permet de remédier aux inconvénients présentés par les analyseurs monolithiques connus. Ce système d'analyse génère un code spécifique pour chaque document introduit et chaque type de flux de données, lequel code peut ensuite être mis à jour selon les besoins afin de manipuler des particularités spécifiques de documents sans demander des modifications au code de navigateur central. Pendant qu'un utilisateur (10) définit des règles d'analyse afin d'extraire des données d'un document d'échantillonnage (15) représentatif, un entraîneur visuel (16) génère automatiquement à l'arrière-plan un code, appelé archiveur (17), qui est spécifique de ce document et qui incorpore les règles permettant d'extraire des données de ce document en particulier. Le code généré peut être modifié manuellement (18) selon les besoins afin de rendre compte de toute condition de particularité associée au document. Chaque document représentatif comprend un archiveur associé. Un moteur d'analyse (20, 21) comprend une collection de ces archiveurs individuels appropriée aux types de documents qui se présentent dans n'importe quelle organisation. Une mise en correspondance ou un autre type d'association est maintenue entre des types de document représentatifs et leurs archiveurs. Dans un fonctionnement normal, un utilisateur choisit un jeu de données à extraire de certains documents. Lorsque le moteur d'analyse reçoit un document dans un flux de données introduites, l'archiveur associé est chargé et analyse ce document pour le jeu de données choisi. Un autre archiveur est ensuite chargé en réponse à un autre document introduit, etc. Les archiveurs peuvent être générés de manière particulièrement efficace au moyen d'une approche orientée objet, puis dynamiquement instanciés pendant la durée d'exécution. Cela peut être réalisé sans inconvénient, par exemple, dans le langage de programmation Java.
Clarke William D.
Flynn James P.
Pitney Bowes Docsense Inc.
Sim & Mcburney
LandOfFree
Data parsing system for use in electronic commerce does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Data parsing system for use in electronic commerce, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Data parsing system for use in electronic commerce will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-2040781