Bevezetés a

"Hangkódolási Eljárások Vizsgálata Távoktatási Módszerekkel"

című méréshez

1. Bevezetés

Divatszóvá vált a multimédia. Egyre gyakrabban fordul elő távközlési termékek (legyen az software, hardware, avagy folyóirat cikk) nevében. A szó jelentése mögé tekintve nagy eséllyel várhatjuk, hogy az adott termék hang- illetve kép- (divatosabban: audio- és video-) kódolással, átvitellel vagy tárolással kapcsolatos elemeket is tartalmaz. Bár a multimédia fogalom nem szűkíthető le csupán ezekre a területekre, kétségtelen, ezen témák is szorosan illeszkednek a multimédia tárgykörébe. Tanulmányozásuk, kidolgozásuk sok éve tart már, számos komoly eredménnyel. A multimédia fogalom megjelenése egyrészt komoly lendítést jelentett ezeknek a kutatásoknak és fejlesztéseknek, másrészt egy közös célt tűzött ki.

A Budapesti Műszaki Egyetemen (BME) hosszú évek óta folyik a fenti témák oktatása. Az utóbbi hónapok folyamán azonban felmerült az igény egy olyan tárgy kidolgozására, mely a távközlésben alkalmazott kép-, hang- és egyéb információ- átviteli feladatokat a multimédia fogalma köré csoportosítva mutatja be és foglalja rendszerbe. A Telematika és Multimédia tantárgy kidolgozása során született meg a gondolat, hogy a tárgy oktatása közben egyfajta távoktatási kísérletként olyan multimédia rendszereket kapjanak kézbe a hallgatók, amelyek segítségével a tantárgyhoz kapcsolódóan gyakorlati tapasztalatokat szerezhetnek a laboratóriumban vagy otthon a számítógépük előtt ülve az aktuális anyagrészben.

Az oktatás technológia eszköztárában régóta szerepelnek hang-, kép- és videoanyagok. Az ilyen eszközöket alkalmazó tanulási/tanítási módszerek egyre professzionálisabb szintet értek el. A számítógépek alkalmazását az oktatásban is megjósolták már évtizedekkel ezelőtt a tudományos-fantasztikus irodalomban. A technikai feltételek a 90-es évek elejére tették lehetővé a számítógépes oktatóanyagok létrehozását. Megjelentek a multimédia PC-k, és ezzel szabaddá vált az út a multimédia alkalmazások tömeges elterjedése előtt. Azon multimédia termékeknek a száma, amelyek neve mögött valódi távoktatás jelenik meg jelenleg még igen csekély, mivel az eszközök még aránylag fiatalok és a távoktató anyagok kidolgozása hosszú időt (jellemzően 1-2 évet), nagy energiát vesz igénybe.

Ezek a tényezők motiválták azt a fejlesztést, amely a holland Delfti Műszaki Egyetem Információelméleti Tanszékén folyik, és amelynek eredménye egy demonstrációs és távoktatási célú, képkódolási eljárásokat bemutató programcsomag [1]. A BME Távközlési és Telematikai Tanszékén egy hasonló, hang- (és ezen belül is hangsúlyozottan beszéd-) jelek kódolási eljárásait interaktív módon bemutató környezet került kifejlesztésre [2].

A továbbiakban a fent említett két software-t mutatjuk be, majd egy olyan multimédia környezetet ismertetünk, melyben a demonstrációs programcsomagok segítségével interaktív mérések végezhetők. Kitérünk továbbá a multimédia egy speciális megjelenési formájára, mely rohamléptekkel terjed a világméretű nemzetközi számítógép hálózaton, az Internet-en.

2. A HDSP Demo programcsomag

1991-93-ban a Delfti Műszaki Egyetem Információelméleti Tanszékén fejlesztették ki Sun-Sparc munkaállomásokra azt a High Definition Signal Processing nevű demonstrációs programcsomagot (HDSP Demo), melyet a képkódolást oktató tantárgyak (például: Coding for HDTV; Audio and Video Coding; stb.) előadásainak gyakorlati kiegészítésére használnak. A többszáz mérnökóra munkával létrehozott oktatóanyag egy bő egyhetes intenzív tanfolyam kitöltésére elegendő. A megcélzott réteg (azaz a hallgatók, tanfolyam résztvevők) lehetőségeit figyelembe véve elkészült IBM-PC-kre a programcsomag MS-Windows verziója is, melyet az architekturából adódó megszorítások figyelembe vételével dolgoztak ki [1]. Az egyes kódolási eljárásokat implementáló modulok interaktívan, vizuálisan, a gyakorlatban mutatják be az előadásokon elhangzott anyagot. A felhasználó által beállított paraméterekkel vizsgálhatók meg mind a primitív kódolási lépések (mint például: (alul-) mintavételezés, kvantálás (-i hibák), dithering, vektorkvantálás, stb.); a transzformációs algoritmusok (pl. diszkrét koszinusz transzformáció); és az összetett képkódolási algoritmusok (pl. részsávú kódolás, JPEG, MPEG) hatásai. Példaként a differenciális kvantálást (DPCM) bemutató modul grafikus kezelői felülete látható az 1. ábrán. A 2./a,b,c,d ábrákon különböző paraméter- illetve opció-beállításokhoz tartozó kimenetek láthatók.
[Figyelem! Hallgatói mérés előtt célszerű a HDSP Demo Súgóját letölteni és tanulmányozni!]

1. ábra A HDSP Demo DPCM moduljának grafikus kezelői felülete

(a) (b)
(c) (d)

2. ábra PCM és DPCM kódolt képek
(a) 8 bites PCM bemenet; (b) 3 bites PCM kimenet; (c) 3 bites DPCM kimenet; és
(d) a különbség a bemeneti és a DPCM kimeneti kép között

3. A LASC Demo programcsomag

1994 tavaszán a BME Távközlési és Telematikai Tanszékén kezdődött el a Low Bit-rate Audio Signal Coding nevű demonstrációs software (LASC Demo) fejlesztése, amely a fentiekben ismertetett képkódolási programcsomag funkcionális megfelelője hangkódolási eljárások hatásainak bemutatására [3]. A LASC Demo (csakúgy mint a már említett képkódolási demo) moduláris felépítésű, lehetővé téve ezáltal további kódolási eljárásokat bemutató modulokkal való bővítést is. A fejlesztés pillanatnyi állapotában öt modul áll rendelkezésre, amelyek az alulmintavételezés, a kvantálás, a differenciális kvantálás, a részsávú kódolás és a különböző torzítások hatásait mutatják be. A közeljövőben a demonstrációs programcsomag tovább bővül az adaptív DPCM kódolást, a lineáris prediktív kódolást és a vektorkvantálást bemutató modulokkal. Az összehasonlíthatóság (és a hasonlóság bemutatása) kedvéért a 3. ábrán a LASC Demo DPCM moduljának grafikus kezelői felülete látható. A kimeneti jelalakok audiovizuális elemzése lehetőségének csak egyik oldalát képes a 4. ábra megmutatni; a (tetszőleges sorrendű) meghallgatáshoz a PC-kben szabványos MS-Windows kompatibilis hangkártya szükséges.

3. ábra A LASC Demo DPCM moduljának grafikus kezelői felülete

4. ábra Egy kimeneti hullámforma a WaveView programban
Az alsó ablakban látható felnagyítva a felső ablakban kijelölt rész.

A LASC Demo tartalmaz a MS-Windows programok családjában jól ismert WinHelp hypertext formátumú ún. context-sensitive "Súgó"-t (help-et), azaz bármely modul grafikus kezelői felületén a Help-et választva leírást kapunk egyrészt az adott modulhoz tartozó kódolás elméleti hátteréről, másrészt a paraméterezési lehetőségekről, az egyes paraméterek jelentéséről (egy tipikus Reference Manual felépítésének megfelelően). A Subsampling (alulmintavételezés) modul elméletét tárgyaló Súgó egy részlete látható az 5. ábrán.
[Figyelem! Hallgatói mérés előtt célszerű a Súgót letölteni és tanulmányozni!]

5. ábra A LASC Demo-hoz tarozó Help egy részlete

4. Oktatási segédlet

A laboratóriumi gyakorlati oktatás keretében megjelenő demonstráció önálló elvégzését segíti elő és irányítja a hallgatók számára a programcsomaghoz tartozó elektronikus könyvecske. A távoktató programok kedvelt eszköze az Asymetrix cég ToolBook nevű programja, amely a demonstrációs csomagokhoz hasonlóan MS-Windows környezetben működik. A LASC Demo-hoz tartozó ToolBook-os ismertető csak egy rövid felvezetést ad az egyes modulokhoz, bemutatja a működés alapgondolatát (6. ábra), és útmutatást ad az induláshoz. (Ez megfelel egy tipikus Users' Guide Introduction és Getting Started fejezeteinek.) A könyvecske lapozható oldalakra van osztva; az oldalak két féltérre vannak bontva: a jobb térfél egyes régióit a mutató eszközzel (tipikusan az egérrel) érintve a bal térfélen olvasható az azon régióhoz tartozó magyarázat illetve leírás. A 7. ábrán látható a LASC Demo DPCM modulját ismertető oldal egy állapota.

6. ábra A LASC Demo működésének rövid bemutatása ToolBook rendszerben

7. ábra A LASC Demo egy modulját bemutató ToolBook oldal

5. Távoktatás multimédia-hálózaton

Egy világméretű multimédia hálózat robbanásszerű fejlődésének lehetünk tanúi napjainkban. A WWW (WorldWide Web, azaz Világméretű (Pók-)Háló) egy hypermédia kiegészítéssel ellátott világméretű információs rendszer, melynél speciálisan erre a célra kialakított központi számítógépek (server-ek) szolgáltatják az információt. A hypertext domumentumokba html (HyperText Markup Language) formátumú álló- és mozgóképek, hanganyagok és szövegek kerülnek. Ezekhez a WWW browser-ek ("böngésző"-k) segítségével férhetünk hozzá. Az egyik legismertebb ilyen browser az NCSA Mosaic nevű programja, amelyet különféle gépekre (PC, Mac, Sun, RS6000, HP, stb.) és grafikus rendszerekhez (MS-Windows, X-Windows, stb.) is kidolgoztak. A számítógépes hálózaton található szolgáltatások illetve erőforrások azonosítására és az elérési útvonal megadására egységes rendszert (URL, Uniform Resource Locator) dolgoztak ki, amely eltakarja a különböző server-ek egymástól eltérő protokolljait.

8. ábra A LASC Demo-t ismertető WWW egy oldala

Kedvcsinálóként, ha úgy tetszik reklámként, a LASC Demo programcsomag bemutatkozik az Internet hálózat használói számára a WWW browser-ekkel (pl. Mosaic, Cello) "böngészhető" html formátumban. A bemutatkozó oldal (8. ábra) tartalmazza az egyes modulok rövid funkcionális leírását, képességeiket, utalást a project céljára; illusztrációként elérhető minden grafikus felhasználói felület képe. Csábítónak tűnt hangminta beemelése is, ám sajnos itt még nincs meg az egység: különböző server-eken különböző formátumban tárolják a hangot, ezért áttöltésükkor a browser-ek ritkán képesek a visszajátszásra. Mivel a programcsomag futtatható és adatbázis állományait másolási jog nem korlátozza, ezért a rendszer teljes egésze a megfelelő dokumentációval együtt (a multimédia szabályai szerint) egy gombnyomással áttölthető a világ bármely Internet hozzáférésű pontjára.

6. Összefoglalás

A Budapesti Műszaki Egyetem Távközlési és Telematikai Tanszékén hosszú évek óta folyó távközlési oktatás továbbviteleként az utóbbi hónapok folyamán felmerült az igény egy olyan tárgy kidolgozására, mely a távközlésben alkalmazott audio-, video- és egyéb információátviteli feladatokat a multimédia fogalma köré csoportosítva tárgyalja. A Telematika és Multimédia tantárgy kidolgozása során született meg a gondolat, miszerint a tárgy keretében kísérleti jelleggel olyan multimédia rendszereket kapjanak kézbe a hallgatók, amelyek által a laboratóriumban vagy otthon a számítógépük előtt ülve gyakorlati tapasztalatokkal gazdagodhatnak a tananyaghoz kapcsolódóan.

Ennek nyomán kezdődött el az a fejlesztés, amely a holland Delfti Műszaki Egyetem Információelméleti Tanszékén kidolgozott demonstrációs és távoktatási célú, képkódolási eljárásokat bemutató programcsomag (HDSP Demo) ötlete alapján, egy hasonló, hang- (és ezen belül is hangsúlyozottan beszéd-) jelek kódolási eljárásait interaktív módon illusztráló software (LASC Demo) megvalósítását tűzte ki céljául.

Az előzőekben a fent említett két demonstrációs programcsomagot, a HDSP Demo-t és a LASC Demo-t mutattuk be röviden. Ezekhez kapcsolódóan egy olyan ToolBook-os multimédia környezetet ismertettünk, melyben ezen programcsomagok segítségével interaktív, demonstrációs jellegű mérések végezhetők. Kitértünk a multimédia egy speciális megjelenési formájára, a WWW nevű hypermédia információs rendszerre, mely a világméretű nemzetközi számítógép hálózaton, az Internet-en van elterjedőben, és bemutattuk a demonstrációs programok megjelenési formáját ezen a hálózaton.

Mindkét demonstrációs programcsomag bárki számára díjmentesen elérhető: hdspdemo illetve lascdemo. Mivel a fejlesztés tovább folytatódik, a szerzők kérése egy e-mail a marosi@bme-tel.tmit.bme.hu címre a tapasztalatokról, javaslatokról.

Irodalom