SignALL
Audiovizuális file-ok hangtípus szerinti szegmentálása
A SignALL az Alkalmazott Logikai Labor által kifejlesztett olyan új eljáráson alapuló technológiát alkalmazó program, ami az input audio vagy video file tartalmát hangtípus szerint szegmentálja Mivel, a beszédfelismerő inputját képző audiovizuális file-ok általában beszédet és más típusú szegmenseket/hangszakaszokat mint, például zene, ének, stb. is tartalmaznak, ezek szétválasztásában jelent megoldást a SignALL
A szoftver számára a különböző hangtípusok felismeréséhez szükséges tudást egy olyan (adatkomponensként integrálható) specifikus akusztikus modell biztosítja, amelynek elemei egy-egy hangtípus realizációira jellemző, az adott hangtípust más hangtípusoktól megkülönböztető akusztikus jegyeit modellezik. A hangtípus szerinti szegmentálás az akusztikus beszédfelismeréssel analóg módon működik, célja azonban nem az elhangzott beszédet leíró fonémasor kinyerése, hanem a különböző típusú hangszegmensek határainak felismerése.
A szoftver mind önálló termékként, mind a beszédfelismerő jelfeldolgozó moduljába beépítve hasznosítható.
A beszédfelismerés részeként a szoftver
o a beszédszakaszok határainak detektálását, és
o a hosszabb beszédszakaszok tördelését
valósítja meg.
Ez a rendszer teszi lehetővé a nem csak beszédet tartalmazó audiovizuális file-ok beszédszakaszainak lokalizálását és az egyes beszédszakaszokban elhangzó beszédek felismerését, valamint a beszéd-információ vegyes tartalmú audiovizuális archívumokból való visszakereshetőségét.