G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2241873
The invention enables evaluation of the content of a set of data to determine whether the data set satisfies one or more queries. The invention enables rapid evaluation of large numbers of data sets much more rapidly than has previously been possible, even when the number of queries is large and/or the queries are complex. The queries are evaluated using an execution plan of query terms that is constructed from one or more specified queries by translating each query term of each query into one or more evidence descriptors and one or more combination operators, and operably relating each of the combination operators to at least one of the evidence descriptors or other combination operators, such that each query is defined by one or more of the evidence descriptors and one or more of the combination operators that are operably related to each other. Preferably, none of the evidence descriptors or combination operators are duplicated in the execution plan. The invention can be used to evaluate data sets of a variety of types, such as text documents and databases. The invention can be further optimized to achieve rapid evaluation of a data set with respect to the queries in two steps. First, one or more candidate queries that may be satisfied by the data set are identified by approximately evaluating each query. Second, each of the candidate queries is fully evaluated to determine whether the candidate query is satisfied by the data set.
L'invention permet d'évaluer le contenu d'un ensemble de données pour déterminer si l'ensemble de données permet de satisfaire une ou plusieurs interrogations. L'invention permet d'évaluer rapidement de grands nombres d'ensembles de données, à un vitesse considérablement accrue par rapport à l'état actuel de la technique, même lorsque les interrogations sont nombreuses et/ou complexes. On évalue ces interrogations au moyen d'un plan d'exécution des termes de l'interrogation, réalisé à partir d'une ou plusieurs interrogations spécifiées, en convertissant chaque terme d'interrogations individuelles sous la forme d'un ou des plusieurs descripteurs d'éléments probants et d'un ou de plusieurs opérateurs de combinaison; ensuite, un lien opérationnel est établi entre chacun des opérateurs de combinaison et au moins un des descripteurs d'éléments probants ou d'autres opérateurs de combinaison, si bien que chaque interrogation est définie par un ou plusieurs descripteurs d'éléments probants et par un ou plusieurs opérateurs de combinaison reliés entre eux de façon opérationnelle. De préférence, on effectue aucune duplication des descripteurs d'éléments probants ou des opérateurs de combinaison dans le plan d'exécution. En procédant ainsi, il est possible d'évaluer des ensembles de données correspondants à différents types, par exemple, des documents textuels et bases de données. Une optimisation supplémentaire permet d'évaluer rapidement un ensemble de données en deux étapes par rapport aux interrogations. La première étape consiste à évaluer de manière approximative chaque interrogation pour identifier une ou plusieurs interrogations potentielles susceptibles d'être satisfaites au moyen de l'ensemble de données, et la seconde étape consiste à évaluer entièrement toutes les interrogations potentielles pour déterminer si chacune entre elles est satisfaite au moyen de l'ensemble de données considéré.
Smart & Biggar
Verity Inc.
LandOfFree
Evaluation of the content of a data set using multiple... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Evaluation of the content of a data set using multiple..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Evaluation of the content of a data set using multiple... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1680688