G - Physics – 06 – F
Patent
G - Physics
06
F
G06F 17/00 (2006.01)
Patent
CA 2654088
A set of candidate parallel pages is identified based on trigger words in one or more pages downloaded from a given network location (such as a website). A set of document trees representing each of the candidate pages are aligned to identify translationally parallel content and hyperlinks. The parallel content is further fed into conventional sentence aligner for parallel sentences. And the parallel hyperlinks usually refer to other parallel documents, and lead to a recursive mining of parallel documents.
Un ensemble de pages parallèles candidates est identifié sur la base de mots de déclenchement dans une ou plusieurs pages téléchargées à partir d'un emplacement réseau donné (tel qu'un site Internet). Un ensemble d'arbres de documents représentant chacun des pages candidates sont alignés pour identifier un contenu et des hyper-liens parallèles en translation. Le contenu parallèle est en outre adressé à un dispositif d'alignement de phrase classique pour des phrases parallèles. Et les hyper-liens parallèles se réfèrent généralement à d'autres documents parallèles, et mènent à une découverte récursive de documents parallèles.
Niu Cheng
Shi Lei
Zhou Ming
Microsoft Corporation
Smart & Biggar
LandOfFree
Aligning hierarchal and sequential document trees to... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Aligning hierarchal and sequential document trees to..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Aligning hierarchal and sequential document trees to... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-2044899