FőoldalEnglish

SearchPert-ALL

Beszéd-információ visszanyerése audiovizuális archívumokból

 

Az Alkalmazott Logikai Laboratórium kifejlesztett egy olyan rendszert, amely audiovizuális archívumokban hangzó (beszéd) formában megőrzött, szöveges átirattal nem rendelkező anyagok tartalmának visszakeresését teszi lehetővé.

A rendszer két modulból áll. Az egyik modul felkészíti az archívum file-jaiban fellehető beszédszegmenseket a későbbi visszakeresésre, a másik modul pedig megfelelő eszközt biztosít a végfelhasználók számára a beszéd-információ visszanyerésének megvalósítására. Az archívumban tárolt file-ok közül azok válnak visszakereshetővé, amelyek előzőleg átesnek az előkészítési/indexelési fázison. Az archívumban korábban megőrzött, illetve az ott megjelenő új file-ok indexelése az archívumot működtető szakemberek felügyelete alá tartozik.

A keresés számára kifejlesztett modul a szöveges adattárakból való visszakereséseknél megszokott keresési feltétel megfogalmazását igényli, amelyre egy találati listával válaszol. A találati lista sorai beszédszakaszokat azonosítanak, és informálják a felhasználót:

o      az adott beszédszakaszt tartalmazó file nevéről,

o      a beszédszakasznak az őt tartalmazó file-on belüli relatív pozíciójáról, valamint arról, hogy

o      milyen szavak vagy frázisok előfordulása eredményezte a találatot az adott beszédszakaszban.

A felhasználó a találati listában jelölheti ki a visszahallgatni kívánt beszédszakaszt. Ennek hatására a rendszer kikeresi és betölti a kiválasztott beszédszakaszt tartalmazó file-t, és a média lejátszót a beszédszakasz elejére pozícionálja.

Az archivált file-okat keresésre előkészítő modul magyar és angol nyelvekre működik, a visszakeresést támogató modul nyelv-független.

Az SearchPert-ALL megbízhatóságát a szöveges adattárakból történő információ-visszanyerés teljesítményének jellemzésére definiált standard minőségi mutatók (MANNING) formális kiértékelésével mértük. A mért értékek megfelelnek a legjobb szöveges információ-visszanyerési rendszerek teljesítményének.

Az ALL rendszerét integráló komplett EASAIER rendszert eddig a British Library és a Caledonian University (BBC audiovizuális archívumát kezelő) Spoken Words részlege telepítette.

Kipróbálható a Demo verziója: Beszédfelismerés demó