Segmentation approach for speech recognition systems

G - Physics – 10 – L

Patent

Rate now

  [ 0.00 ] – not rated yet Voters 0   Comments 0

Details

G10L 15/14 (2006.01) G10L 15/04 (2006.01) G10L 15/16 (2006.01) G10L 15/02 (2006.01)

Patent

CA 2404306

Phonetic units are identified in a body of utterance data according to a novel segmentation approach. A body of received utterance data is processed (204) and a set of candidate phonetic unit boundaries is determined (206) that defines a set of candidate phonetic units. The set of phonetic unit boundaries is determined based upon changes in Cepstral coefficient values, changes in utterance energy, changes in phonetic classification, broad category analysis (retroflex, back vowels, front vowels) and sonorant onset detection. The set of candidate phonetic unit boundaries is filtered by priority and proximity to other candidate phonetic units and by silence regions. The set of candidate phonetic units is filtered using no-cross region analysis (210) to generate a set of filtered candidate phonetic units. No-cross region analysis generally involves discarding candidate phonetic units that completely span an energy up, energy down, dip or broad category type no-cross region. Finally, a set of phonetic units is selected from the set of filetered candidate phonetic units based upon the probabilities of candidate boundaries defining the ends of the unit and within the unit.

Selon l'invention, des unités sont identifiées dans un corps de données d'énoncé selon une nouvelle technique de segmentation. Un corps de données d'énoncé reçues est traité (204), un ensemble de frontières d'unités phonétiques candidates étant déterminé (206). Cet ensemble définit un ensemble d'unités phonétiques candidates. Ledit ensemble de frontières d'unités phonétiques est déterminé sur la base des changements de valeurs de coefficient cepstral, des changements d'énergie d'énoncé, des changements de classification phonétique, de l'analyse de grandes catégories (rétroflexion, voyelles arrière, voyelles avant) et de la détection de début sonore. L'ensemble de frontières d'unités phonétiques candidates est filtré par priorité et proximité par rapport à d'autres unités phonétiques candidates et par zones de silence. L'ensemble d'unités phonétiques candidates est filtré au moyen d'une analyse de zones sans croisement (210) de manière à produire un ensemble d'unités phonétiques candidates filtré. L'analyse de zones sans croisement implique généralement l'élimination d'unités phonétiques concurrentes recouvrant complètement une zone sans croisement du type "augmentation d'énergie", "baisse d'énergie", "baisse/montée d'énergie" ou "grande catégorie". Finalement, un ensemble d'unités phonétiques est choisi parmi l'ensemble d'unités phonétiques candidates filtré sur la base des probabilités des frontières candidates définissant les extrémités de l'unité et l'intérieur de l'unité.

LandOfFree

Say what you really think

Search LandOfFree.com for Canadian inventors and patents. Rate them and share your experience with other people.

Rating

Segmentation approach for speech recognition systems does not yet have a rating. At this time, there are no reviews or comments for this patent.

If you have personal experience with Segmentation approach for speech recognition systems, we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Segmentation approach for speech recognition systems will most certainly appreciate the feedback.

Rate now

     

Profile ID: LFCA-PAI-O-2028128

  Search
All data on this website is collected from public sources. Our data reflects the most accurate information available at the time of publication.