G - Physics – 10 – L
Patent
G - Physics
10
L
G10L 13/08 (2006.01) G10L 5/04 (1995.01)
Patent
CA 2161540
Text may be converted to audible signals, such as speech, by first training a neural network using recorded audio messages (204). To begin the training, the recorded audio messages are converted into a series of audio frames (205) having a fixed duration (213). Then, each audio frame is assigned a phonetic representation (203) and a target acoustic representation, where the phonetic representation (203) is a binary word that represents the phone and articulation characteristics of the audio frame, while the target acoustic representation is a vector of audio information such as pitch and energy. After training, the neural network is used in conversion of text into speech. First, text that is to be converted is translated to a series of phonetic frames of the same form as the phonetic representations (203) and having the fixed duration (213). Then the neural network produces acoustic representations in response to context descriptions (207) that include some of the phonetic frames. The acoustic representations are then converted into a speech wave form by a synthesizer.
Pour transformer du texte en signaux sonores tels que des signaux vocaux on forme tout d'abord un réseau neuronal à l'aide de messages sonores enregistrés (204). Pour commencer l'apprentissage, les messages sonores enregistrés sont convertis en une série de séquences sonores (205) d'une durée prédéterminée (213). Une représentation phonétique (203) et une représentation acoustique cible sont ensuite attribuées à chaque séquence, ladite représentation phonétique (203) étant un mot binaire qui représente les caractéristiques phonémique et d'articulation de la séquence sonore, la représentation acoustique cible étant quant à elle un vecteur d'informations sonores telles que la hauteur et la puissance. Après l'apprentissage, le réseau neuronal est utilisé pour convertir du texte en sons vocaux. Le texte à convertir est tout d'abord transformé en une série de séquences phonétiques ayant la même forme que les représentations phonétiques (203) et une durée prédéterminée (213); puis le réseau neuronal produit des représentations acoustiques en réponse aux descriptions (207) du contexte qui incluent certaines des séquences phonétiques; et pour terminer, les représentations acoustiques sont converties en signal vocal par un synthétiseur.
Corrigan Gerald Edward
Gerson Ira Alan
Karaali Orhan
Gowling Lafleur Henderson Llp
Motorola Inc.
LandOfFree
A method and apparatus for converting text into audible... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with A method and apparatus for converting text into audible..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and A method and apparatus for converting text into audible... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1924102