G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01)
Patent
CA 2540241
A method of determining cluster attractors for a plurality of documents comprising at least one term. The method comprises calculating, in respect of each term, a probability distribution indicative of the frequency of occurrence of the, or each, other term that co-occurs with said term in at least one of said documents. Then, the entropy of the respective probability distribution is calculated. Finally, at least one of said probability distributions is selected as a cluster attractor depending on the respective entropy value. The method facilitates very small clusters to be formed enabling more focused retrieval during a document search.
L'invention concerne un procédé de détermination d'attracteurs de grappes pour une pluralité de documents comprenant au moins un terme. Le procédé comprend le calcul, par rapport à chaque terme, d'une distribution théorique, indicatrice de la fréquence d'apparition du terme ou de chaque autre terme, ou d'un autre terme se co-présentant avec ledit terme dans au moins l'un desdits documents. On calcule ensuite l'entropie de la distribution théorique respective. Enfin, l'une desdites distributions théoriques est sélectionnée en tant qu'attracteur de grappes, en fonction de la valeur respective d'entropie. Le procédé facilite la formation de grappes très petites, ce qui permet d'avoir une extraction plus focalisée lors d'une recherche de documents.
Dobrynin Vladimir
Patterson David
Bereskin & Parr Llp/s.e.n.c.r.l.,s.r.l.
St. Petersburg State University
University Of Ulster
LandOfFree
Computer aided document retrieval does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Computer aided document retrieval, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Computer aided document retrieval will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1786649