G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2551803
Methods and systems for syntactically indexing and searching data sets to achieve more accurate search results and for indexing and searching data sets using entity tags alone or in combination therewith are provided. Example embodiments provide a Syntactic Query Engine ("SQE") that parses, indexes, and stores a data set, as well as processes natural language queries subsequently submitted against the data set. The SQE comprises a Query Preprocessor, a Data Set Preprocessor, a Query Builder, a Data Set Indexer, an Enhanced Natural Language Parser ("ENLP"), a data set repository, and, in some embodiments, a user interface. After preprocessing the data set, the SQE parses the data set according to a variety of levels of parsing and determines as appropriate the entity tags and syntactic and grammatical roles of each term to generate enhanced data representations for each object in the data set. The SQE indexes and stores these enhanced data representations in the data set repository. Upon subsequently receiving a query, the SQE parses the query also using a variety of parsing levels and searches the indexed stored data set to locate data that contains similar terms used in similar grammatical roles and/or with similar entity tag types as indicated by the query. In this manner, the SQE is able to achieve more contextually accurate search results more frequently than using traditional search engines.
L'invention concerne des procédés et des systèmes pour indexer et rechercher de manière syntaxique des ensembles de données, de manière à atteindre des résultats de recherche plus précis et pour indexer et rechercher des ensembles de données au moyen de marqueurs d'identité utilisés seuls ou en combinaison. Dans des modes de réalisation, un moteur de recherche syntaxique (SQE) analyse, indexe et stocke un ensemble de données, et traite des demandes de langage naturel soumises ultérieurement à l'ensemble de données. Le SQE comprend un processeur de demandes, un préprocesseur d'ensembles de données, un dispositif de construction de demandes, un indexeur d'ensemble de données, et un dispositif d'analyse de langage naturel amélioré (ENLP), un référentiel d'ensemble de données, et dans certains modes de réalisation, une interface utilisateur. Après le prétraitement de l'ensemble de données, le SQE analyse l'ensemble de données selon une pluralité de niveaux d'analyse et détermine les marqueurs d'entité convenables et les rôles grammaticaux et syntaxiques de chaque terme pour produire des représentations de données améliorées pour chaque objet dans l'ensemble de données. Le SQE indexe et stocke lesdites représentations de données améliorées dans le référentiel d'ensemble de données. Lors de la réception d'une demande, le SQE analyse la demande également au moyen de niveaux d'analyse et recherche l'ensemble de données stockées, indexées pour situer les données contenant des termes similaires utilisés dans des rôles grammaticaux similaires et/ou des types de marqueurs d'entités similaires indiquées par la demande. De cette manière, le SQE est capable d'atteindre des résultats de recherche plus précis contextuellement, de manière plus fréquente que lors de l'utilisation de moteurs de recherche classiques.
Dhillon Navdeep S.
Koperski Krzysztof
Liang Jisheng
Marchisio Giovanni B.
Murua Alejandro
Evri Inc.
Gowling Lafleur Henderson Llp
Insightful Corporation
LandOfFree
Method and system for enhanced data searching does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Method and system for enhanced data searching, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Method and system for enhanced data searching will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1683626