Document characteristic analysis device for document to be...

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/30 (2006.01)

Patent

CA 2542438

An index entry word extraction device includes: input means (1) for inputting a document-to-be-surveyed d and documents-to-be-compared P; index entry word extraction means (120) for extracting an index entry word from the document-to- be-surveyed d; first appearance frequency calculation means (142) for calculating a function value IDF (P) of the appearance frequency of the extracted index entry word in the documents-to-be-compared P; similar documents selecting means (160) for selecting similar documents S similar to the document-to-be-surveyed d in the documents-to-be-compared P according to the data on the document-to-be-surveyed d; second appearance frequency calculation means (171) for calculating the function value IDF (S) of the appearance frequency of the extracted index entry word in the similar documents S; and output means (4) for outputting each index entry and its positioning data according to the combination of the function values of the respective appearance frequencies in the documents-to-be-compared and the similar documents which have been calculated. Thus, it is possible to accurately grasp the feature of the document-to-be-surveyed.

Dispositif d'extraction de mots d'entrée dans un index qui comporte un moyen d'entrée (1) destiné à entrer un document à étudier d et des documents de comparaison P, un moyen d'extraction (120) de mots d'entrée dans un index destiné à extraire un mot d'entrée dans un index du document à étudier d, un premier moyen de calcul (142) de la fréquence d'apparition destiné à calculer une valeur fonctionnelle IPF (P) de la fréquence d'apparition du mot d'entrée dans un index extrait dans les documents de comparaison P, un moyen de sélection (160) de documents similaires destiné à sélectionner des documents similaires S au document à étudier d dans les documents de comparaison P selon les données du document à étudier d, un second moyen de calcul (171) de la fréquence d'apparition destiné à calculer la valeur fonctionnelle IDF (S) de la fréquence d'apparition du mot d'entrée dans un index extrait dans les documents similaires S et un moyen de sortie (4) pour produite chaque entrée d'index et ses données de positionnement selon la combinaison des valeurs fonctionnelles des fréquences d'apparition respectives dans les documents de comparaison et les documents similaires qui ont été calculées. Par conséquent, il est possible saisir de manière précise les caractéristiques du document à étudier.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Document characteristic analysis device for document to be... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Document characteristic analysis device for document to be..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Document characteristic analysis device for document to be... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1543737

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.