G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/27 (2006.01)
Patent
CA 2546896
A fact extraction tool set ("FEX") finds and extracts targeted pieces of information from text using linguistic and pattern matching technologies, and in particular, text annotation and fact extraction. Text annotation tools break a text, such as a document, into its base tokens and annotate those tokens or patterns of tokens with orthographic, syntactic, semantic, pragmatic and other attributes. A user-defined "Annotation Configuration" controls which annotation tools are used in a given application. XML is used as the basis for representing the annotated text. A tag uncrossing tool resolves conflicting (crossed) annotation boundaries in an annotated text to produce well-formed XML from the results of the individual annotators. The fact extraction tool is a pattern matching language which is used to write scripts that find and match patterns of attributes that correspond to targeted pieces of information in the text, and extract that information.
L'invention concerne un ensemble d'outils d'extraction de faits ("FEX") destinés à trouver et à extraire des informations ciblées d'un texte à l'aide de technologies lingüistiques et de mise en correspondance de caractéristiques, et en particulier, l'annotation de texte et l'extraction de faits. Les outils d'annotation de texte divisent un texte, par exemple un document, en unités lexicales de base et apportent des annotations à ces unités lexicales ou aux caractéristiques des unités lexicales comprenant des attributs orthographiques, syntactiques, sémantiques, pragmatiques ou autres. Une "configuration d'annotation" définie par l'utilisateur définit les outils d'annotation utilisés dans une application donnée. Un langage XML est utilisé comme base de représentation du texte annoté. Un outil de désactivation des étiquettes permet de résoudre les annotations conflictives (barrées) dans un texte annoté afin d'obtenir un langage XML adapté à partir des résultats des annotateurs individuels. L'outil d'extraction de faits est un langage de mise en correspondance de caractéristiques, utilisé pour écrire des scripts qui permettent de trouver et de mettre en correspondance des caractéristiques d'attributs correspondant à des informations ciblées du texte, et extraire ces informations.
Chen Shian-Jung
Koutsomitopoulou Eleni
Loritz Donald
Templar Valentina
Wasson Mark
Lexisnexis A. Division Of Reed Elsevier Inc.
Ridout & Maybee Llp
LandOfFree
Extraction of facts from text does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Extraction of facts from text, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Extraction of facts from text will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1438692