Method and system for similarity search and clustering

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/30 (2006.01)

Patent

CA 2470899

Provided is a similarity search method that makes use of a localized distance metric. The data includes a collection of items, wherein each item is associated with a set of properties. The distance between two items is defined in terms of the number of items in the collection that are associated with the set of properties common to the two items. A query is generally composed of a set of properties. The distance between a query and an item is defined in terms of the number of items in the collection that are associated with the set of properties common to the query and the item. The properties can be of various types, such as binary, partially ordered, or numeric. The distance metric may be applied explicitly or implicitly for similarity search. One embodiment of this invention uses random walks such that the similarity search can be performed exactly or approximately, trading-off between accuracy and performance. The distance metric of the present invention can also be the basis for matching and clustering applications. In these contexts, the distance metric of the present invention may be used to build a graph, to which matching or clustering algorithms can be applied.

L'invention concerne un procédé de recherche de similarités faisant appel à l'utilisation d'une mesure de distance localisée. Ces données comprennent un ensemble d'éléments, chaque élément étant associé à un ensemble de propriétés. La distance entre deux éléments est définie en termes du nombre d'éléments d'un ensemble qui sont associés à l'ensemble de propriétés communes aux deux éléments. Une demande est généralement composée d'un ensemble de propriétés. La distance entre une demande et un élément est définie en termes du nombre d'éléments de l'ensemble qui sont associés à l'ensemble de propriétés communes à la demande et à l'élément. Ces propriétés peuvent être de types variés, notamment binaires partiellement ordonnées, ou numériques. Cette mesure de distance peut être appliquée explicitement ou implicitement pour une recherche de similarités. Un mode de réalisation de l'invention fait appel à des marches aléatoires de sorte que la recherche de similarités peut être effectuée exactement ou approximativement, selon que l'on recherche l'exactitude ou la performance. La mesure de distance de la présente invention peut également constituer une base pour des applications de correspondances et de mise en grappe. Dans ces contextes, la mesure de distance de l'invention peut être utilisée pour construire un graphique, auquel peuvent s'appliquer des algorithmes de correspondances ou de mise en grappe.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Method and system for similarity search and clustering does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Method and system for similarity search and clustering, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Method and system for similarity search and clustering will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1515860

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.