G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2248793
A statistical thesaurus is built dynamically, from the same text collection that is being searched, allowing improved generation of expanded query terms. The thesaurus is dynamic in that thesaurus records are collected, ranked, accessed, and applied dynamically. Thesaurus "records" are actually formed as indexed documents arranged in "collections". The collections are preferably distinguished based on text source. Each record has terms assembled in indexed groups which inherently reflect a ranking based on relevance to an initial query. After an initial query is received, the appropriate collection(s) of records may be searched by a conventional search and retrieval engine, the searches inherently returning records ranked by degree of relevance due the record indexing scheme. A record ranking scheme avoids contamination of relevant records by less relevant records. The record selection and the expansion query term generation processes are each divided into parallel threads. The separate threads correspond to respective text sources to enable the improved expansion query term generation to be provided in real time.
Un thésaurus statistique est construit de manière dynamique à partir de la collection de textes dans laquelle la recherche est en train de se faire, ce qui permet une meilleure génération des termes d'interrogation étendue. Le thésaurus est dynamique dans en ce que l'on peut collecter et classer les enregistrements du thésaurus, y accéder et les appliquer de manière dynamique. Ces "enregistrements" sont constitués sous forme de documents indexés disposés en "collections". Celles-ci se distinguent de préférence les unes des autres sur la base du texte source. Chaque enregistrement comporte des termes assemblés en groupes indexés, qui reflètent intrinsèquement un classement basé sur la pertinence par rapport à une interrogation initiale. Une fois qu'une interrogation initiale est reçue, un moteur de recherche et d'extraction conventionnel peut faire des recherches dans la ou les collections(s) appropriées(s) d'enregistrements, les recherches ramenant intrinsèquement des enregistrements classés par degré de pertinence grâce au schéma d'indexation des enregistrements. Celui-ci empêche la contamination d'enregistrements pertinents par des enregistrements moins pertinents. La sélection des enregistrements et les processus de génération des termes d'interrogation étendue sont divisés en tâches élémentaires parallèles. Ces dernières correspondent à différentes sources de textes, ce qui permet de procéder en temps réel à la génération de termes d'interrogation étendue.
Holt John D.
Lu Xin Allan
Miller David James
Lexis-Nexis A. Division Of Reed Elsevier Inc.
Ridout & Maybee Llp
LandOfFree
Statistical thesaurus, method of forming same, and use... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Statistical thesaurus, method of forming same, and use..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Statistical thesaurus, method of forming same, and use... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1535016