Method and apparatus of processing semistructured textual data

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/22 (2006.01) G06F 17/27 (2006.01) G06F 17/30 (2006.01)

Patent

CA 2357048

A method of processing semistructured data, in particular semistructured textual data, to output data which is in accordance with a predetermined structure, wherein said semistructured data is structured into one or more elements according to a given syntax, the actual content of the syntax elements being variable and being called a token, said method comprising: extracting by means of an extractor ("parser") from said semistructured data one or more tokens, said parser being capable of returning at least one token in response to a respective specific command identifying the requested token by a token identifier, wherein said method further comprises: providing a sequence of commands and an associated data structure definition, both together being called a loader, said loader comprising the commands necessary to cause said parser to return the one or more tokens to be extracted; causing by said sequence of commands of said loader said parser to extract said one or more tokens from said semistructured data and further converting said extracted tokens into said predetermined data structure defined by said associated structure definition.

Cette invention concerne un procédé de traitement de données semi-structurées, en particulier de données de texte semi-structurées, pour l'obtention de données conformes à une structure déterminée. Selon ce procédé, les données semi-structurées sont structurées en un ou plusieurs éléments répondant à une syntaxe donnée. Le contenu réel des éléments syntaxiques est variable et porte la désignation de <=marque>=. Le procédé consiste à extraire de données semi-structurées, au moyen d'un analyseur syntaxique, une ou plusieurs marques, ledit analyseur étant capable de restituer au moins une marque en réponse à une commande spécifique permettant d'identifier une marque au moyen d'un identificateur de marques. De plus, ce procédé fait intervenir une séquence de commandes et une définition de structure de données associées, l'ensemble constituant un chargeur. Ce chargeur comprend les commandes nécessaires pour amener l'analyseur syntaxique à restituer la ou les marques à extraire; amener ledit programme, via la séquence de commandes du chargeur, à extraire la ou les marques desdites données semi-structurées, et, en outre, transformer les marques extraites en une structure déterminée de données définie par la définition structurelle associée.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Method and apparatus of processing semistructured textual data does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Method and apparatus of processing semistructured textual data, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Method and apparatus of processing semistructured textual data will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1869073

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.