Portal głosowy jest rozproszonym systemem sieciowym. Składa się z 3 podstawowych programów, które komunikują się ze sobą przez sieć lokalną: Gateway, TTS Server (Text-To-Speech Server) i ASR Server (Automatic Speech Recognition Server). Rozproszona architektura zapewnia łatwą skalowalność systemu. W przypadku wdrożenia na 4 linie wszystkie 3 programy można zainstalować na jednym serwerze. W przypadku wdrożenia na 120 linii system może działać na 8 serwerach: 1 serwer pracujący jako Gateway, 1 jako TTS i 6 serwerów pracujących jako ASR. W tym przypadku każdy ASR Server będzie mógł prowadzić do 20 równoległych dialogów, co razem da 120 równolegle obsługiwanych rozmów. Każdy z powyższych programów jest wielowątkowy i wykorzystuje w pełni wieloprocesorowe serwery i komputery z procesorami czterordzeniowymi.

Primespeech Gateway
Primespeech Gateway jest programem, który zawsze działa na komputerze ze specjalnymi kartami telefonicznymi. Primespeech jest partnerem firmy Dialogic, która produkuje najwyższej jakości sprzęt telefoniczny do zastosowań profesjonalnych. Używane przez nas karty telefoniczne mają osobne procesory DSP na każdy kanał, co w połączeniu z najlepszym na rynku systemem rozpoznawania mowy daje niespotykaną dotąd jakość rozpoznawania. Gateway wspiera zarówno karty analogowe jak i cyfrowe. Może używać analogowej karty telefonicznej i korzystać z publicznej, komutowanej sieci telefonicznej, albo w przypadku kart cyfrowych korzystać z linii T1/E1. Zadaniem Gateway'a jest przekazywanie sygnału z linii telefonicznej do ASR Server'a i odbieranie sygnału z TTS Server'a, a następnie wysyłanie go na odpowiednią linię telefoniczną. Gateway wykonuje również polecenia związane z obsługą linii, np: wysyłanie DTMF, flash albo rozłączenie rozmowy.
Primespeech ASR Server
Ten program jest najważniejszą częścią każdego portalu głosowego. Jego głównym zadaniem jest rozpoznawanie mowy. Dodatkowo ASR Server ma wbudowany moduł adaptacji akustycznej, który pozwala na dotrenowanie zespołu sieci neuronowych do nowych głosów. Zintegrowany detektor mowy odciąża główny zespół sieci neuronowych od kosztownych obliczeń, gdy mówca nic nie mówi. Architektura programu pozwala na uruchomienie dowolnej ilości dialogów na jednym serwerze. Ilość równoległych dialogów jest oczywiście zależna od prędkości komputera i ilości pamięci. ASR Server używa systemu automatycznego rozpoznawania mowy Primespeech.
Primespeech TTS Server
TTS Server to wielowątkowy program ze zintegrowanym syntezatorem mowy. Ponieważ syntezator mowy może być uruchomiony tylko w ograniczonej ilości instancji (na ile pozwala licencja), to TTS Server synchronizuje polecenia syntezy tak, aby zostały one wykonane w optymalnej kolejności. Oprócz mowy syntetycznej TTS Server może też odgrywać mowę wcześniej nagraną przez profesjonalnego mówcę. Jakość mowy profesjonalnego mówcy będzie zawsze lepsza od mowy syntetycznej. Użycie kombinacji gotowych nagrań i syntezatora mowy daje najlepsze rezultaty zarówno pod względem jakości jak i ceny. Stałe części dialogu są nagrane przez profesjonalnego mówcę w studiu nagraniowym a nieznane wcześniej frazy syntezowane w czasie rzeczywistym.
Prmespeech Voice Portal Manager
Voice Portal Manager jest systemem zarządzania portalem głosowym przez dowolną przeglądarkę internetową. Pozwala on na zalogowanie się do serwisu przez bezpieczny protokół SSL. Po zalogowaniu się użytkownik może sterować całym portalem głosowym; może m.in. wyłączyć lub zresetować cały system, zmienić ilość operatorów dostępnych w infolinii, zmodyfikować bazę osób i telefonów, zmienić informacje odtwarzane przez portal, lub odsłuchać nagrane rozmowy. Dodatkowo istnieje możliwość przeglądania obszernych statystyk i wykresów. Pokazują one m.in. dystrybucję rozmów w czasie, długość rozmów czy procentowy rozkład pytań w zależności od tematu.