ASR Server Telecom ASR Server Desktop Portal Głosowy
Co to jest? Przykładowe zastosowania Produkt dla infolinii Produkt dla firm Częste pytania
Architektura systemu Specyfikacja Rozpoznawanie mowy Synteza mowy Sieci Neuronowe Algorytmy Ewolucyjne
ZTM Warszawa PJWSTK Korporacja taksówkowa Giełda Papierów Wartościowych
Firma Media o nas Aktualności Partnerzy Kariera Kontakt

Synteza Mowy

p_zdj12Synteza mowy to problem inżynieryjny polegający na zamianie tekstu na sygnał mowy. Programy dokonujące takiej konwersji nazywa się syntezatorami mowy. Aby zbudować syntezator mowy należy najpierw nagrać duży korpus zbalansowanych fonetycznie zdań. Do nagrań powinien zostać wykorzystany profesjonalny mówca, najlepiej z głębokim głosem, ponieważ taki jest najlepiej zrozumiały. Po nagraniu korpusu tworzy się bazę krótkich fragmentów mowy: fonemów, difonów, a nawet większych jednostek. Gdy syntezator mowy dostaje polecenie zamiany tekstu na mowę najpierw konwertuje go do postaci fonetycznej za pomocą alfabetu fonetycznego. Znając już sekwencję fonemów znajdującą się w wypowiedzi pozostaje ostatnie zadanie: należy przeszukać całą bazę krótkich fragmentów mowy i znaleźć taką ich sekwencję, aby w połączeniu reprezentowała pożądaną przez użytkownika wypowiedź. Primespeech jest partnerem firmy Loquendo, która produkuje jeden z najlepszych syntezatorów mowy dla języka polskiego.


Syntezator mowy stworzony przez Krzysztofa Szklanny został zaprezentowany w TVP Info (fragment).

Dowiedz się jak portal głosowy usprawni Twój biznes:

Imię:
Nazwisko:
Email:
Telefon:
Pytanie:
 


Prospekt:

Pobierz prospekt reklamowy


Realizacje:









   Copyright © 2008 - 2010 Primespeech. Wszelkie prawa zastrzeżone.