Primespeech jest jedyną polską firmą produkującą systemy rozpoznawania mowy przeznaczone na rynek telekomunikacyjny. Głównym celem Primespeech jest dalszy rozwój naszej, autorskiej technologii rozpoznawania mowy. Obecnie Primespeech posiada cztery produkty wykorzystujące automatyczne rozpoznawanie mowy: Portal głosowy, ASR Server Telecom i ASR Server Desktop. Najnowszym produktem Primespeech jest Transkrypcja Automatyczna.
Nowy produkt Primespeech – Transkrypcja Automatyczna - pozwala na zamianę dowolnej, nieograniczonej niczym wypowiedzi na tekst. Technologia rozpoznawania mowy w tym produkcie wykorzystuje koneksjonistyczny model języka, który umożliwia modelowanie kontekstu wypowiedzi o wiele dokładniej od tradycyjnych modeli n-gramowych. Światowa literatura przedmiotu potwierdza, że skuteczność rozpoznawania mowy systemów wykorzystujących koneksjonistyczne modele jest nawet o 30% wyższa w porównaniu do standardowych metod. Transkrypcja Automatyczna Primespeech jest zaawansowanym produktem wymagającym tuningu domenowego zapewniającego optymalną jakość działania procesu rozpoznawania mowy.
Rozpoznawanie mowy Primespeech jest najlepiej działającym systemem tego typu dla języka Polskiego. Rozpoznawanie mowy polskiej wymaga nowoczesnych technologii - nasz system używa zespołu skomplikowanych sieci neuronowych, które zostały wyuczone na głosach ponad 10.000 osób. Proces trenowania zespołu używanych przez nas sieci neuronowych wymaga kilku tygodni przy użyciu do tego celu klastra serwerów. Parametry systemu rozpoznawania mowy zostały następnie dostrojone używając dedykowanych algorytmów ewolucyjnych. Kombinacja wielkich korpusów treningowych i najnowocześniejszych algorytmów sztucznej inteligencji pozwoliła stworzyć najlepsze na rynku produkty oparte o rozpoznawanie mowy. Nasz system rozpoznawania mowy ma również detektor mowy, który potrafi dyskryminować mowę i ciszę. Dzięki temu główny zespół sieci neuronowych nie jest angażowany w kosztowne obliczenia gdy osoba nic nie mówi. Taka architektura pozwala na uruchomienie kilkudziesięciu równolegle prowadzonych rozmów na jednym serwerze.
Automatyczne rozpoznawanie mowy jest multidyscyplinarną dziedziną, która jest najbardziej związana z informatyką. Zadaniem systemów rozpoznawania mowy jest zamiana wypowiedzianych słów na tekst. Od strony technicznej budowa takiego systemu jest o wiele trudniejsza niż budowa syntezatora mowy. Jest wiele różnych podejść inżynieryjnych do tego problemu. Jednym z najnowszych jest użycie sztucznych sieci neuronowych. Nasi inżynierowie stworzyli system rozpoznawania mowy bazujący właśnie na tej technologii. Sieci neuronowe do pewnego stopnia naśladują działanie ludzkiego mózgu i są najlepszym osiągnięciem współczesnej techniki z dziedziny sztucznej inteligencji. Dodatkowym ich atutem jest automatyczna adaptacja do nowych słów i warunków akustycznych - sieci neuronowe same się uczą na próbkach nowych głosów. W rezultacie jakość rozpoznawania mowy z czasem rośnie.