G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2401170
The method and apparatus enable information to be retrieved from an electronic database based on a probabilistic approach and some query processing. In one aspect, records of a database are parsed into record tokens using a pattern action language before an index for the records is created. In another aspect, a table of index tokens is created wherein the table comprises a frequency of occurrence in the database for each index token and each index token comprises a phonetic equivalent for a respective record token. In one aspect, a query is parsed into query tokens using a pattern action language, a search token is generated from a query token, and the search token is used to access database records. In another aspect, a search token comprises a phonetic equivalent for a query token or a token that qualifies as similar to a query token and search token and a search token is used to access database records. The qualification of a token as similar to a query token is based on a comparison of the query token to a database dictionary using an information theoretic algorithm. In yet another aspect, a token is selected, the selected token is used to access database records, a likelihood of relevance to the query is calculated for each of the records, and the highest likelihood of relevance to the query is compared to a continuation threshold. If the continuation threshold is exceeded, no more records are accessed and the accessed records are output. If the continuation threshold is not exceeded, the selected search token is eliminated from the set of available search tokens, and a new token is selected for accessing database records.
L'invention concerne un procédé et un appareil permettant l'extraction d'informations d'une base de données électronique sur la base d'une approche probabiliste et de d'un traitement de requête. Selon un aspect, les documents d'une base de données sont analysés sous forme de jetons au moyen d'un langage de modèle d'action avant qu'un indice des documents ne soit créé. Selon un autre aspect, une table de jetons de l'indice est créée, laquelle table comprend une fréquence d'occurrence dans la base de données de chaque jeton de l'indice et chaque jeton de l'indice comprend un équivalent phonétique pour un jeton de l'indice respectif. Selon un aspect, une demande est analysée sous forme de jetons de demande au moyen d'un langage de modèle d'action, un jeton de recherche est généré à partir d'un jeton de demande, lequel jeton de recherche permet d'accéder aux documents de la base de données. Selon un autre aspect, un jeton de recherche comprend un équivalent phonétique pour un jeton de demande ou un jeton qualifié comme étant similaire à un jeton de demande et un jeton de recherche permet d'accéder aux documents de la base de données. La qualification d'un jeton comme étant similaire à un jeton de demande se base sur une comparaison du jeton de demande avec un dictionnaire de base de données au moyen d'un algorithme théorique d'information. Dans un aspect supplémentaire, un jeton choisi permet d'accéder aux documents de la base de données, une probabilité de pertinence par rapport à la demande est calculée pour chaque document et la plus élevée de ces probabilités est comparée à un seuil de continuation. Si ce seuil est dépassé, il n'est plus possible d'accéder à aucun document et les documents auxquels on a déjà accédé sont sortis. En revanche, si ce seuil n'est pas dépassé, le jeton de recherche choisi est éliminé de l'ensemble de jetons de recherches disponibles et un nouveau jeton est choisi afin d'accéder aux documents de la base de données.
Jaro Matthew A.
Smart & Biggar
Vality Technology Incorporated
LandOfFree
Probabilistic matching engine does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Probabilistic matching engine, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Probabilistic matching engine will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1724515