H - Electricity – 04 – L
Patent
H - Electricity
04
L
H04L 12/54 (2006.01) H04L 12/58 (2006.01)
Patent
CA 2441390
A system (10) and method (100) for efficiently processing messages (70) stored in multiple message stores (41) is described. Metadata (35) identifying a range of topically identical messages (47) extracted from a plurality of message stores (41) storing a multiplicity of messages (70) to be processed is iteratively copied. The metadata (35) for the extracted range of topically identical messages (47) is categorized. Those messages (70) containing substantially duplicative content within the extracted range are identified as duplicate messages (47). Those non-duplicate messages (44) within the extracted range are tallied into an ordering of conversation thread length (46). Those messages (70) whose content is recursively-included content (72, 73) within another of the tallied non-duplicate messages (44) are classified as near-duplicate messages (45). The remaining messages (71) are designated as unique messages (44) containing substantially non-duplicative content (71).
L'invention concerne un système (10) et un procédé (100) permettant de traiter efficacement des messages (70) stockés dans plusieurs mémoires de message (41). Des métadonnées (35) sont copiées de façon itérative, ces métadonnées identifiant une gamme de messages à sujet identique (47) extraits d'une pluralité de mémoires de message (41) stockant plusieurs messages (70) à traiter. Les métadonnées (35) pour la gamme extraite de messages à sujet identique (47) sont catégorisées. Les messages (70) ayant un contenu sensiblement duplicatif compris dans la gamme extraite sont identifiés comme étant des messages dupliqués (47). Les messages non dupliqués (44) compris dans la gamme extraite sont inventoriés dans un ordonnancement de longueur de sujet de conversation (46). Les messages (70) dont le contenu est inclus de manière récursive (72, 73) dans un autre des messages non dupliqués inventoriés (44) sont classés en tant que messages quasi dupliqués (45). Les messages restants (71) sont qualifiés de messages uniques (44) ayant un contenu sensiblement non duplicatif (71).
Mcdonald David Thomas
Attenex Corporation
Osler Hoskin & Harcourt Llp
Preston Gates Ellis Llp
LandOfFree
System and method for identifying unique messages stored in... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with System and method for identifying unique messages stored in..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System and method for identifying unique messages stored in... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1517799