G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/28 (2006.01) G06F 17/27 (2006.01) G06F 17/30 (2006.01)
Patent
CA 2227383
This invention provides a method and apparatus for automated search and retrieval processing that includes a tokenizer, a noun phrase analyzer, and a morphological analyzer. The tokenizer includes a parser that extracts characters from the stream of text, and identifying element for identifying a token formed of characters in the stream of text that include lexical matter, and a filter for assigning tags to those tokens requiring further linguistic analysis. The tokenizer, in a single pass through the stream of text, determines the further linguistic processing suitable to each particular token contained in the stream of text. The noun phrase analyzer annotates tokens with tags identifying characteristics of the tokens and contextually analyzes each token. During processing, the noun phrase analyzer can also disambiguate individual token characteristics and identify agreement between tokens. Themorphological analyzer organizes, utilizes, analyzes, and generates morphological data related to the tokens. In particular, the morphological analyzer locates a stored lexical expression representative of a candidate token found in a stream of natural language text, identifies a paradigm for the candidate token based upon the stored lexical expression, and applies transforms contained within the identified paradigm to the candidate token.
L'invention porte sur un procédé et un appareil de recherche et extraction automatiques comportant un jetoneur, un analyseur de syntagmes et un analyseur morphologique. Le jetoneur comporte un analyseur qui extrait des caractères du flux de texte, un identificateur de jetons formés de caractères du flux de texte renfermant une matière lexicale et un filtre attribuant des repères à ceux des jetons requérant un supplément d'analyse linguistique. Le jetoneur détermine en un deuxième passage du flux le supplément de traitement linguistique convenant à chacun des jetons particuliers du flux de texte. L'analyseur de syntagmes marque les jetons de repères mettant en évidence certaines de leurs caractéristiques, puis en effectue l'analyse contextuelle. Pendant le traitement, l'analyseur de syntagmes peut également désambiguïser certaines caractéristiques individuelles des jetons et identifier certaines concordances entre eux. L'analyseur morphologique qui organise, utilise analyse et produit des caractéristiques morphologiques relatives aux jetons a en particulier comme tâche la localisation d'une expression lexicale stockée représentatives d'un jeton candidat présent dans un flux de texte de langage naturel l'identification d'un paradigme correspondant au jeton candidat sur la base d'une expression lexicale stockée, et l'application au jeton candidat de transformées contenues dans le paradigme identifié.
Boone Keith
Carus Alwin B.
Haque Ateeque R.
Wiesner Michael
Inso Corporation
Riches Mckenzie & Herbert Llp
Vantage Technology Holdings
LandOfFree
Method and apparatus for automated search and retrieval... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Method and apparatus for automated search and retrieval..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Method and apparatus for automated search and retrieval... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-2091667