Beszéd-információ visszanyerése audiovizuális archívumokból
Az EASAIER (Enabling Access to Sound Archives through Integration, Enrichment and Retrieval http://www.elec.qmul.ac.uk/easaier/) nevű EU FP6 project keretében az ALL (Alkalmazott Logikai Laboratórium) kifejlesztett egy olyan rendszert, amely audiovizuális archívumokban hangzó (beszéd) formában megőrzött, szöveges átirattal nem rendelkező anyagok visszakeresését teszi lehetővé.
A rendszer két önálló modulból áll. Az egyik modul egy beszédfelismerő alkalmazás, amely felkészíti az archívum file-jaiban fellehető beszédszegmenseket a későbbi visszakeresésre, a másik modul pedig megfelelő eszközt biztosít a végfelhasználók számára az archívumban tárolt beszéd-információ visszanyerésének megvalósítására.
Az archivált file-ok előfeldolgozását megvalósító modul először lokalizálja az input file-on belüli beszédszegmenseket, majd sorra véve a file beszédszegmenseit
o felismeri, hogy az adott szegmensben mi hangzott el, és
o a felismert szavakkal indexeli a szegmenst.
Az előfeldolgozást végző modul a felismert szövegek bázisán úgynevezett ”full-text” indexelést végez, és az így keletkezett index dokumentumokat egy adatbázisban helyezi el.
Az archívumban tárolt file-ok közül azok válnak visszakereshetővé, amelyek előzőleg átesnek az előkészítési/indexelési fázison. Az archívumban korábban megőrzött, illetve az ott megjelenő új file-ok indexelése az archívumot működtető szakemberek felügyelete alá tartozik
A keresés számára kifejlesztett modul a szöveges adattárakból való visszakereséseknél megszokott keresési feltétel megfogalmazását igényli, amelyre egy (az index adatbázisban tárolt információ alapján összeállított) találati listával válaszol. A találati lista sorai beszédszakaszokat azonosítanak, és informálják a felhasználót:
o az adott beszédszakaszt tartalmazó file nevéről,
o a beszédszakasznak az őt tartalmazó file-on belüli relatív pozíciójáról, valamint arról, hogy
o milyen szavak és/vagy frázisok előfordulása eredményezte a találatot az adott beszédszakaszban.
A felhasználó a találati listában jelölheti ki a visszahallgatni kívánt beszédszakaszt. Ennek hatására a rendszer kikeresi és betölti a kiválasztott beszédszakaszt tartalmazó file-t, és a média lejátszót a beszédszakasz elejére pozícionálja.
Az archivált file-okat keresésre előkészítő modul magyar és angol nyelvekre működik, a visszakeresést támogató modul nyelv-független.
Az ALL beszéd-információ visszanyerésére kifejlesztett rendszerének megbízhatóságát a szöveges adattárakból történő információ-visszanyerés teljesítményének jellemzésére definiált standard minőségi mutatók (MANNING) formális kiértékelésével mértük. A mért értékek megfelelnek a legjobb szöveges információ-visszanyerési rendszerek teljesítményének.
Az ALL rendszerét integráló komplett EASAIER rendszert eddig a British Library és a Caledonian University (BBC audiovizuális archívumát kezelő) Spoken Words részlege telepítette.