G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/27 (2006.01)
Patent
CA 2381251
A computerized method for extracting information from natural-language text data includes a parser (12) for parsing the text data to determine the grammatical structure of the text data and a phrase regularizer (13) for regularizing the parsed text data to form structured word terms. The parsing step, which can be performed in one or more parsing modes, includes the step of referring to a domain parameter having a value indicative of a domain from which the text data originated, wherein the domain parameter corresponds to one or more rules of grammar within a knowledge base (110) related to the domain to be applied for parsing the text data. Preferably, the structured output is mapped back to the words in the original sentences of the text data input using XML tags via a tagger (16).
L'invention concerne un procédé informatisé qui permet d'extraire des informations à partir de données texte en langage naturel. Ledit procédé comprend notamment un analyseur (12) destiné à analyser les données texte afin de déterminer leur structure grammaticale, et un régularisateur (13) de phrase permettant de régulariser les données texte analysées afin de former des mots structurés. La phase d'analyse, que l'on peut exécuter en au moins un mode d'analyse, consiste à se rapporter à un paramètre de domaine ayant une valeur indicative du domaine d'origine desdites données, ledit paramètre de domaine correspondant à au moins une règle de grammaire dans une base de connaissance (110) relative au domaine à appliquer pour analyser lesdites données. De préférence, le résultat structuré est mappé et renvoyé aux mots dans les phrases d'origine des entrées de données texte au moyen d'étiquettes XML par le biais d'un identificateur (16).
Smart & Biggar
The Trustees Of Columbia University In The City Of New York
LandOfFree
System and method for language extraction and encoding does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with System and method for language extraction and encoding, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for language extraction and encoding will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1372269