Corpus clustering, confidence refinement, and ranking for...

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/30 (2006.01)

Patent

CA 2519236

A computer-implemented method for processing a plurality of toponyms, the method involving: in a large corpus, identifying geo-textual correlations among readings of the toponyms within the plurality of toponyms; and for each toponym selected from the plurality of toponyms, using the identified geo- textual correlations to generate a value for a confidence that the selected toponym refers to a corresponding geographic location. Also a method of generating information useful for ranking a document that includes a plurality of toponyms for which there is a corresponding plurality of (toponym,place) pairs, there being associated with each (toponym,place) pair of said plurality of (toponym,place) pairs a corresponding value for a confidence that the toponym of that (toponym,place) pair refers to the place of that (toponym,place) pair. This further method includes, for a selected (toponym,place) pair of the plurality of (toponym,place) pairs, (1) determining if another toponym is present within the document that has an associated place that is geographically related to the place of the selected (toponym, place) pair; and (2) if a toponym is identified within the document that has an associated place that is geographically related to the place of the selected (toponym, place) pair, boosting the value of the confidence for the selected (toponym,place) pair.

L'invention concerne une méthode assistée par ordinateur pour traiter une pluralité de toponymes. Cette méthode consiste à: dans un large corpus, identifier des corrélations géotextuelles parmi des lectures de toponymes appartenant à une pluralité de toponymes; et pour chaque toponyme sélectionné à partir de la pluralité de toponymes, utiliser les corrélations géotextuelles identifiées pour générer une valeur indiquant le degré de confiance avec lequel le toponyme sélectionné se réfère à un emplacement géographique correspondant. L'invention concerne également une méthode de génération d'informations utiles pour établir un rang pour un document comprenant une pluralité de toponymes pour lesquels il existe une pluralité correspondante de paires (toponyme, emplacement), à chaque paire (toponyme, emplacement) étant associée une valeur correspondante de degré de confiance selon laquelle le toponyme de cette paire se réfère à l'emplacement de l'autre paire (toponyme, emplacement). L'invention concerne également une méthode consistant à, pour une paire (toponyme, emplacement) sélectionnée, (1) déterminer si un autre toponyme est présent à l'intérieur du document qui présente un emplacement associé qui est géographiquement associé à l'emplacement de la paire (toponyme, emplacement) sélectionnée; et (2) si un toponyme est identifié à l'intérieur du document qui présente un emplacement associé géographiquement associé à l'endroit de la paire (toponyme, emplacement) sélectionnée, augmenter la valeur du degré de confiance pour la paire (toponyme, emplacement) sélectionnée.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Corpus clustering, confidence refinement, and ranking for... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Corpus clustering, confidence refinement, and ranking for..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Corpus clustering, confidence refinement, and ranking for... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1710030

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.