G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/30 (2006.01) G06F 17/22 (2006.01) G06F 17/27 (2006.01)
Patent
CA 2486358
A method, system and computer program for automatically discovering concepts from a corpus of documents (302) and automatically generating a labeled concept hierarchy (310). The method invloves extraction of signatures (304) from the corpus of documents (302). The similarity between signatures is computed using a statistical measure (306). The frequency distribution of signatures is refined to alleviate any inacuracy in the similarity meaure (508). The signatures are also disambiguated to address the polysemy problem. The similarity measure is recomputed based on the refined frequency distribution and disambiguated signatures (510). The recomputed similarity measure reflects actual similarity between signatures.
L'invention porte sur un procédé, un système et un programme informatique permettant de découvrir automatiquement des concepts à partir d'un corpus de documents et de générer automatiquement une hiérarchie conceptuelle marquée. Le procédé consiste à extraire des signatures du corpus de documents. La similarité entre les signatures est calculée au moyen d'une mesure statistique. La distribution statistique des signatures est précisée afin de corriger toute imprécision dans la mesure de similarité. Les signatures sont également désambiguisées afin de résoudre le problème de polysémie. La mesure de similarité est à nouveau calculée en fonction de la distribution statistique précisée et des signatures désambiguisées. La mesure de similarité recalculée reflète la similarité actuelle entre les signatures. La mesure de similarité recalculée est alors utilisée pour regrouper les signatures reliées. Les signatures sont regroupées afin de générer des concepts et ces concepts sont placés dans une hiérarchie conceptuelle. Cette hiérarchie conceptuelle génère automatiquement une demande d'un concept particulier et extrait les documents pertinents associés au concept.
Chung Christina
Liu Jinhui
Luk Alpha
Mao Jianchang
Taank Sumit
Blake Cassels & Graydon Llp
Verity Inc.
LandOfFree
System and method for automatically discovering a hierarchy... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with System and method for automatically discovering a hierarchy..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for automatically discovering a hierarchy... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1502144