System for identifying common digital sequences

H - Electricity – 03 – M

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

H03M 7/30 (2006.01) G06F 7/00 (2006.01) G06F 7/06 (2006.01) G06F 7/22 (2006.01) G06F 12/00 (2006.01) G06F 17/30 (2006.01) H04L 23/00 (2006.01)

Patent

CA 2426577

A system and method for unorchestrated determination of data sequences using "sticky byte" factoring to determine breakpoints in digital sequences such that common sequences can be identified. Sticky byte factoring provides an efficient method of dividing a data set into pieces that generally yields near optimal commonality. This is effectuated by employing a rolling hashsum and, in an exemplary embodiment disclosed herein, a threshold function to deterministically set divisions in a sequence of data. Both the rolling hash and the threshold function are designed to require minimal computation. This low overhead makes it possible to rapidly partition a data sequence for presentation to a factoring engine or other applications that prefer subsequent synchronization across the data set.

La présente invention concerne un système et un procédé permettant la détermination non orchestrée de séquences de données par factorisation de <=multiplets collants>= de façon à déterminer des cassures dans des séquences numériques de sorte qu'on puisse identifier des séquences communes. La factorisation de multiplets collants offre une technique efficace de division d'un ensemble de données en morceaux qui produit en général une communité d'élément presque optimale. On effectue cette opération en utilisant un bloc de hachage déroulant et, dans un mode de réalisation de l'invention, une fonction seuil destinée à établir des division de façon déterministe dans une séquence de données. Le hachage déroulant et la fonction seuil sont conçus pour nécessiter un minimum de calcul. Cette faible surcharge de système permet une partition rapide d'une séquence de données en vue d'une présentation à un moteur de factorisation ou à d'autres applications qui préfèrent une synchronisation subséquente dans l'ensemble de données.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

System for identifying common digital sequences does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with System for identifying common digital sequences, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and System for identifying common digital sequences will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1394138

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.