G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/22 (2006.01) G06F 17/27 (2006.01) G06F 17/30 (2006.01)
Patent
CA 2357048
A method of processing semistructured data, in particular semistructured textual data, to output data which is in accordance with a predetermined structure, wherein said semistructured data is structured into one or more elements according to a given syntax, the actual content of the syntax elements being variable and being called a token, said method comprising: extracting by means of an extractor ("parser") from said semistructured data one or more tokens, said parser being capable of returning at least one token in response to a respective specific command identifying the requested token by a token identifier, wherein said method further comprises: providing a sequence of commands and an associated data structure definition, both together being called a loader, said loader comprising the commands necessary to cause said parser to return the one or more tokens to be extracted; causing by said sequence of commands of said loader said parser to extract said one or more tokens from said semistructured data and further converting said extracted tokens into said predetermined data structure defined by said associated structure definition.
Cette invention concerne un procédé de traitement de données semi-structurées, en particulier de données de texte semi-structurées, pour l'obtention de données conformes à une structure déterminée. Selon ce procédé, les données semi-structurées sont structurées en un ou plusieurs éléments répondant à une syntaxe donnée. Le contenu réel des éléments syntaxiques est variable et porte la désignation de <=marque>=. Le procédé consiste à extraire de données semi-structurées, au moyen d'un analyseur syntaxique, une ou plusieurs marques, ledit analyseur étant capable de restituer au moins une marque en réponse à une commande spécifique permettant d'identifier une marque au moyen d'un identificateur de marques. De plus, ce procédé fait intervenir une séquence de commandes et une définition de structure de données associées, l'ensemble constituant un chargeur. Ce chargeur comprend les commandes nécessaires pour amener l'analyseur syntaxique à restituer la ou les marques à extraire; amener ledit programme, via la séquence de commandes du chargeur, à extraire la ou les marques desdites données semi-structurées, et, en outre, transformer les marques extraites en une structure déterminée de données définie par la définition structurelle associée.
Coupaye Thierry
Etzold Thure
Gowling Lafleur Henderson Llp
Lion Bioscience Ag
LandOfFree
Method and apparatus of processing semistructured textual data does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Method and apparatus of processing semistructured textual data, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Method and apparatus of processing semistructured textual data will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1869073