ASR Server Telecom ASR Server Desktop Portal Głosowy
Co to jest? Przykładowe zastosowania Produkt dla infolinii Produkt dla firm Częste pytania
Architektura systemu Specyfikacja Rozpoznawanie mowy Synteza mowy Sieci Neuronowe Algorytmy Ewolucyjne
ZTM Warszawa PJWSTK Korporacja taksówkowa Giełda Papierów Wartościowych
Firma Media o nas Aktualności Partnerzy Kariera Kontakt

Rozpoznawanie Mowy

rozpoznawanie mowy Primespeech jest jedyną polską firmą produkującą systemy rozpoznawania mowy przeznaczone na rynek telekomunikacyjny. Głównym celem Primespeech jest dalszy rozwój naszej, autorskiej technologii rozpoznawania mowy. Obecnie Primespeech posiada cztery produkty wykorzystujące automatyczne rozpoznawanie mowy: Portal głosowy, ASR Server Telecom i ASR Server Desktop. Najnowszym produktem Primespeech jest Transkrypcja Automatyczna.



Transkrypcja Automatyczna

Nowy produkt Primespeech – Transkrypcja Automatyczna - pozwala na zamianę dowolnej, nieograniczonej niczym wypowiedzi na tekst. Technologia rozpoznawania mowy w tym produkcie wykorzystuje koneksjonistyczny model języka, który umożliwia modelowanie kontekstu wypowiedzi o wiele dokładniej od tradycyjnych modeli n-gramowych. Światowa literatura przedmiotu potwierdza, że skuteczność rozpoznawania mowy systemów wykorzystujących koneksjonistyczne modele jest nawet o 30% wyższa w porównaniu do standardowych metod. Transkrypcja Automatyczna Primespeech jest zaawansowanym produktem wymagającym tuningu domenowego zapewniającego optymalną jakość działania procesu rozpoznawania mowy.


Technologia rozpoznawania mowy

Rozpoznawanie mowy Primespeech jest najlepiej działającym systemem tego typu dla języka Polskiego. Rozpoznawanie mowy polskiej wymaga nowoczesnych technologii - nasz system używa zespołu skomplikowanych sieci neuronowych, które zostały wyuczone na głosach ponad 10.000 osób. Proces trenowania zespołu używanych przez nas sieci neuronowych wymaga kilku tygodni przy użyciu do tego celu klastra serwerów. Parametry systemu rozpoznawania mowy zostały następnie dostrojone używając dedykowanych algorytmów ewolucyjnych. Kombinacja wielkich korpusów treningowych i najnowocześniejszych algorytmów sztucznej inteligencji pozwoliła stworzyć najlepsze na rynku produkty oparte o rozpoznawanie mowy. Nasz system rozpoznawania mowy ma również detektor mowy, który potrafi dyskryminować mowę i ciszę. Dzięki temu główny zespół sieci neuronowych nie jest angażowany w kosztowne obliczenia gdy osoba nic nie mówi. Taka architektura pozwala na uruchomienie kilkudziesięciu równolegle prowadzonych rozmów na jednym serwerze.

Co to jest rozpoznawanie mowy?

Automatyczne rozpoznawanie mowy jest multidyscyplinarną dziedziną, która jest najbardziej związana z informatyką. Zadaniem systemów rozpoznawania mowy jest zamiana wypowiedzianych słów na tekst. Od strony technicznej budowa takiego systemu jest o wiele trudniejsza niż budowa syntezatora mowy. Jest wiele różnych podejść inżynieryjnych do tego problemu. Jednym z najnowszych jest użycie sztucznych sieci neuronowych. Nasi inżynierowie stworzyli system rozpoznawania mowy bazujący właśnie na tej technologii. Sieci neuronowe do pewnego stopnia naśladują działanie ludzkiego mózgu i są najlepszym osiągnięciem współczesnej techniki z dziedziny sztucznej inteligencji. Dodatkowym ich atutem jest automatyczna adaptacja do nowych słów i warunków akustycznych - sieci neuronowe same się uczą na próbkach nowych głosów. W rezultacie jakość rozpoznawania mowy z czasem rośnie.

Dowiedz się jak portal głosowy usprawni Twój biznes:

Imię:
Nazwisko:
Email:
Telefon:
Pytanie:
 


Prospekt:

Pobierz prospekt reklamowy


Realizacje:









   Copyright © 2008 - 2012 Primespeech. Wszelkie prawa zastrzeżone.