SearchPert-ALL
Beszéd-információ visszanyerése audiovizuális archívumokból
Az Alkalmazott Logikai Laboratórium kifejlesztett egy olyan rendszert, amely audiovizuális archívumokban hangzó (beszéd) formában megőrzött, szöveges átirattal nem rendelkező anyagok tartalmának visszakeresését teszi lehetővé.
A rendszer két modulból áll. Az egyik modul felkészíti az archívum file-jaiban fellehető beszédszegmenseket a későbbi visszakeresésre, a másik modul pedig megfelelő eszközt biztosít a végfelhasználók számára a beszéd-információ visszanyerésének megvalósítására. Az archívumban tárolt file-ok közül azok válnak visszakereshetővé, amelyek előzőleg átesnek az előkészítési/indexelési fázison. Az archívumban korábban megőrzött, illetve az ott megjelenő új file-ok indexelése az archívumot működtető szakemberek felügyelete alá tartozik.
A keresés számára kifejlesztett modul a szöveges adattárakból való visszakereséseknél megszokott keresési feltétel megfogalmazását igényli, amelyre egy találati listával válaszol. A találati lista sorai beszédszakaszokat azonosítanak, és informálják a felhasználót:
o az adott beszédszakaszt tartalmazó file nevéről,
o a beszédszakasznak az őt tartalmazó file-on belüli relatív pozíciójáról, valamint arról, hogy
o milyen szavak vagy frázisok előfordulása eredményezte a találatot az adott beszédszakaszban.
A felhasználó a találati listában jelölheti ki a visszahallgatni kívánt beszédszakaszt. Ennek hatására a rendszer kikeresi és betölti a kiválasztott beszédszakaszt tartalmazó file-t, és a média lejátszót a beszédszakasz elejére pozícionálja.
Az archivált file-okat keresésre előkészítő modul magyar és angol nyelvekre működik, a visszakeresést támogató modul nyelv-független.
Az SearchPert-ALL megbízhatóságát a szöveges adattárakból történő információ-visszanyerés teljesítményének jellemzésére definiált standard minőségi mutatók (MANNING) formális kiértékelésével mértük. A mért értékek megfelelnek a legjobb szöveges információ-visszanyerési rendszerek teljesítményének.
Az ALL rendszerét integráló komplett EASAIER rendszert eddig a British Library és a Caledonian University (BBC audiovizuális archívumát kezelő) Spoken Words részlege telepítette.
Kipróbálható a Demo verziója: Beszédfelismerés demó