Beszédtechnológia
Az ALL az utóbbi években a beszéd- és nyelvtechnológiák területén is elkezdte kutatási eredményeit hasznosítani. A korábbi kutatási és fejlesztési tapasztalatok, valamint az újszerű megközelítések a beszédtechnológia területén is gyors sikereket hoztak. A beszédtechnológiai kutatások eredményeként létrejött egy magyar nyelvű hangos tárak indexelésére és keresésre szolgáló egyedülálló technológia és jelenleg erőteljesen haladunk a folytonos beszédfelismerés gyakorlati alkalmazásának megvalósítása felé. A nyelvtechnológia kutatásaink során létrehoztuk egy szemantikus kereső rendszer prototípusát. A szemantikus kereső segítségével a szokásos szó alapú keresésnél az emberhez sokkal közelebb álló tartalom alapú kereséseket valósíthatunk meg.
Nagyszótáras beszédfelismerés
Az ALL beszédfelismerője nagyszótárral (több, mint 300 000 szóval) működő rendszer, amely egy adott nyelven elhangzó, lexikálisan nyílt (nem-korlátozott), folyamatos beszéd automatikus felismerését (beszédről szövegre való leképzését) teszi lehetővé.
Beszédinformáció
Az ALL kifejlesztett egy olyan rendszert, amely audiovizuális archívumokban hangzó (beszéd) formában megőrzött, szöveges átirattal nem rendelkező anyagok visszakeresését teszi lehetővé.
Beszédarchivumok kategorizálása
Az ALL kifejlesztett egy olyan – beszédfelismerésre támaszkodó – eszközt, ami lehetővé teszi a (beszéd típusú hanganyaggal ellátott) archívumok tematikus kategorizálását, illetve strukturálását.
Hang-vezérelt rendszerek bemeneti komponense
Az ALL kifejlesztett egy beszélő-független, kisszótáras (max. 1000-szóval működő), speciális parancsnyelvi beszédfelismerő alkalmazást, amely bizonyos típusú, manuálisan kezelt elektronikus rendszerek (pl. egy épületben működtetett lift, segélyhívó, stb.) beszéddel történő irányítását teszi lehetővé.
Nagyszótáras diktáló rendszer
Az ALL fejlesztés alatt álló diktáló rendszere mikrofonos inputtal működő, beszélő-független, nagyszótáras (több, mint 300 000-szavas), folyamatos beszédfelismerő alkalmazás, amely egy adott szakterületen használt résznyelv jellemző lexikális sajátosságaira, szakzsargonjára és tipikus sztereotípiáira specializálódik.
Beszélő azonosítás
Az ALL kifejlesztett egy szoftver terméket, amely beszédet (is) tartalmazó audiovizuális file-okban
lokalizálni tudja azokat a beszédszakaszokat, amelyekben egy adott személy hangja hallható, illetve
azonosítani tudja az egyes beszédszakaszokban hallható személyeket.
Audiovizuális fájlok hangtípus szerinti szegmentálása
A beszédfelismerő inputját képző audiovizuális file-ok általában nemcsak beszédet, hanem más típusú szegmenseket/hangszakaszokat (zene, ének, stb.) is tartalmaznak. Az ALL kifejlesztett egy olyan szoftver rendszert, amely az input file tartalmát hangtípus szerint szegmentálja.
Kép szinkronizálása a felismert szöveggel
Az ALL kifejlesztett egy – a beszédfelismerő outputját hasznosító – szoftvert, amely videó file-ok képi anyagát szinkronizálja az elhangzott beszédből felismert szöveggel.