G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/27 (2006.01)
Patent
CA 2363834
A summary of an input document is generated by extracting at least one sentence from the document and parsing the extracted sentences into components, such as in a parse tree (110). Sentence reduction processing is performed to mark components which can be removed from the parse trees (135). Sentence reduction can include context importance processing, probabilistic processing, and linguistic knowledge based processing, probabilistic processing includes identifying sentence combination operations and establishing rules for applying the sentence combination operations to mark the parse trees to merge at least two sentences (140). Sentence combination processing also provides a paste operation to operate on the marked components to effect the indicated removal and combination of sentence components, thereby generating summary sentences for the input document.
Selon cette invention, on génère un résumé d'un document entrant en extrayant au moins une phrase dudit document et en effectuant le parsage par composants des phrases extraites, par analogie avec un arbre de parsage (110). Le traitement par réduction de phrases s'effectue de manière à marquer les composants pouvant être retirés des arbres de parsage (135). La réduction de phrases peut comprendre le traitement du contexte par importance, le traitement probabiliste et le traitement fondé sur les connaissances linguistiques. Le traitement par combinaison de phrases consiste à identifier les opérations de combinaison de phrases et à établir des règles pour appliquer les opérations de combinaison de phrases afin de marquer les arbres de parsage destinés à faire fusionner au moins deux phrases (140). Le traitement par combinaison de phrases comprend aussi une opération de collage appliquée aux composants marqués pour effectuer le retrait et la combinaison indiqués de composants d'une phrase, ce qui permet de générer des phrases de résumé à partir du document d'entrée.
Jing Hongyan
Mckeown Kathleen R.
Blake Cassels & Graydon Llp
The Trustees Of Columbia University In The City Of New York
LandOfFree
Cut and paste document summarization system and method does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Cut and paste document summarization system and method, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Cut and paste document summarization system and method will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1896838