FőoldalEnglish

SignALL

Audiovizuális file-ok hangtípus szerinti szegmentálása

 A SignALL az Alkalmazott Logikai Labor által kifejlesztett olyan új eljáráson alapuló technológiát alkalmazó program, ami az input audio vagy video file tartalmát hangtípus szerint szegmentálja Mivel, a beszédfelismerő inputját képző audiovizuális file-ok általában beszédet és más típusú szegmenseket/hangszakaszokat mint, például zene, ének, stb. is tartalmaznak, ezek szétválasztásában jelent megoldást a SignALL

A szoftver számára a különböző hangtípusok felismeréséhez szükséges tudást egy olyan (adatkomponensként integrálható) specifikus akusztikus modell biztosítja, amelynek elemei egy-egy hangtípus realizációira jellemző, az adott hangtípust más hangtípusoktól megkülönböztető akusztikus jegyeit modellezik. A hangtípus szerinti szegmentálás az akusztikus beszédfelismeréssel analóg módon működik, célja azonban nem az elhangzott beszédet leíró fonémasor kinyerése, hanem a különböző típusú hangszegmensek határainak felismerése.

A szoftver mind önálló termékként, mind a beszédfelismerő jelfeldolgozó moduljába beépítve hasznosítható.

A beszédfelismerés részeként a szoftver

o      a beszédszakaszok határainak detektálását, és

o      a hosszabb beszédszakaszok tördelését

valósítja meg.

Ez a rendszer teszi lehetővé a nem csak beszédet tartalmazó audiovizuális file-ok beszédszakaszainak lokalizálását és az egyes beszédszakaszokban elhangzó beszédek felismerését, valamint a beszéd-információ vegyes tartalmú audiovizuális archívumokból való visszakereshetőségét.