G - Physics – 10 – L
Patent
G - Physics
10
L
G10L 11/00 (2006.01) G10L 13/06 (2006.01) G10L 21/06 (2006.01)
Patent
CA 2483607
An apparatus enabling automatic determination of a portion that reliably represents a feature of a speech waveform includes: an acoustic/prosodic analysis unit (92) calculating, from data, distribution of an energy of a prescribed frequency range of the speech waveform on a time axis, and for extracting, among various syllables of the speech waveform, a range that is generated stably, based on the distribution and the pitch of the speech waveform; cepstral analysis unit (94) estimating, based on the spectral distribution of the speech waveform on the time axis, a range of the speech waveform of which change is well controlled by a speaker; and a pseudo-syllabic center extracting unit (96) extracting, as a portion of high reliability of the speech waveform, that range which has been estimated to be the stably generated range and of which change is estimated to be well controlled by the speaker.
L'invention concerne un dispositif qui identifie automatiquement, avec une fiabilité élevée, une portion de signal présentant une caractéristique de signal vocal. Ce dispositif comprend un analyseur (92) acoustique/de rythme permettant de calculer la distribution de l'énergie dans une zone fréquence prédéterminée correspondant à une forme de signal vocal dans des données par rapport à un axe temporel, et d'extraire une zone dans laquelle les syllabes du signal vocal sont prononcées de manière stable en fonction de la distribution et de la hauteur tonale du signal vocal, un analyseur (94) de spectre permettant d'estimer une zone dans laquelle une modification du signal vocal est effectuée de préférence par un locuteur en fonction de la distribution du spectre du signal vocal sur l'axe des temps, et un extracteur (96) de noyau pseudo-syllabique qui décide que la zone extraite en tant que zone à prononciation stable et la modification effectuée de préférence par un locuteur constituent une portion de signal vocal présentant une fiabilité élevée.
Campbell Nick
Mokhtari Parham
Advanced Telecommunication Research Institute International
Japan Science And Technology Agency
Moffat & Co.
LandOfFree
Syllabic nuclei extracting apparatus and program product... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Syllabic nuclei extracting apparatus and program product..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Syllabic nuclei extracting apparatus and program product... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1499182