Indexing and searching ideographic characters on a networked...

G - Physics – 06 – F

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G06F 17/30 (2006.01) G06F 17/22 (2006.01)

Patent

CA 2409199

The system and method allows the retrieval, indexing and searching of information stored on computers connected by a communications network, where that information comprises ideographic, logographic or pictographic characters, which are encoded using two bytes per character. The binary value which encodes a particular character contained in a given document is converted into hexadecimal text format, which is then prefixed with a predetermined marker character to indicate that it is the hexadecimal value of a double-byte character. That value is then added to a sequential string of such values for each of such characters in that document. The marker characters are then removed from this string, leaving a series of alphanumeric characters separated at set intervals by blank spaces. Each set of characters demarcated by a blank space is then indexed as if it were a standard word such as an English word, albeit a meaningless one. A unique index entry is created for each such word and phase (up to a predetermined combination of such words) which the search engine encounters, and incorporates positional data which points to the location on a networked system of computers of each occurrence of that particular word or phase which the search engine has encountered. Search queries are then met by retrieving the positional data associated with each character or sequence of characters contained in the search query to determine whether any occurrence of those characters which has been encountered by the search engine meets the criteria of the user.

L'invention concerne un système et un procédé permettant d'extraire, d'indexer et de rechercher des informations stockées dans des ordinateurs connectés par un réseau de communications, ces informations comprenant des caractères idéographiques, logographiques ou pictographiques qui sont codés au moyen de deux octets par caractère. La valeur binaire qui code un caractère particulier contenu dans un document donné est convertie en format de texte hexadécimal, et un caractère marqueur prédéterminé y est ensuite préfixé pour indiquer qu'il s'agit de la valeur hexadécimale d'un caractère à deux octets. Cette valeur est ensuite ajoutée à une chaîne séquentielle de valeurs analogues pour chacun des caractères du document. Les caractères marqueurs sont ensuite éliminés de la chaîne, ce qui permet d'obtenir une série de caractères alphanumériques séparés à intervalles fixes par des espaces vides. Chaque ensemble de caractères démarqués par un espace vide est ensuite indexé comme s'il s'agissait d'un mot standard tel qu'un mot anglais, aussi insignifiant soit-il. Une entrée unique d'index est produite pour chaque mot ou expression (combinaison prédéterminée de mots) rencontré(e) par le moteur de recherche ; cette entrée incorpore des données de position qui désignent l'emplacement de l'occurrence de chaque mot ou expression particulier(ère) sur un réseau d'ordinateurs. Des demandes de recherche sont ensuite traitées par l'extraction des données de position associées à chaque caractère ou séquence de caractères contenu(e) dans la demande de recherche afin de déterminer si le moteur de recherche a trouvé une occurrence des caractères répondant aux critères de l'utilisateur.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Indexing and searching ideographic characters on a networked... does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Indexing and searching ideographic characters on a networked..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Indexing and searching ideographic characters on a networked... will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-1668451

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.