Bevezetés a
"Hangkódolási Eljárások Vizsgálata Távoktatási Módszerekkel"
című méréshez
1. Bevezetés
Divatszóvá vált a multimédia. Egyre gyakrabban fordul elő távközlési termékek (legyen az software,
hardware, avagy folyóirat cikk) nevében. A szó jelentése mögé tekintve nagy eséllyel várhatjuk, hogy az adott
termék hang- illetve kép- (divatosabban: audio- és video-) kódolással, átvitellel vagy tárolással kapcsolatos elemeket
is tartalmaz. Bár a multimédia fogalom nem szűkíthető le csupán ezekre a területekre, kétségtelen, ezen témák
is szorosan illeszkednek a multimédia tárgykörébe. Tanulmányozásuk, kidolgozásuk sok éve tart már,
számos komoly eredménnyel. A multimédia fogalom megjelenése egyrészt komoly lendítést jelentett ezeknek a
kutatásoknak és fejlesztéseknek, másrészt egy közös célt tűzött ki.
A Budapesti Műszaki Egyetemen (BME) hosszú évek óta folyik a fenti témák oktatása. Az utóbbi hónapok
folyamán azonban felmerült az igény egy olyan tárgy kidolgozására, mely a távközlésben alkalmazott kép-, hang- és
egyéb információ- átviteli feladatokat a multimédia fogalma köré csoportosítva mutatja be és foglalja rendszerbe. A
Telematika és Multimédia tantárgy kidolgozása során született meg a gondolat, hogy a tárgy oktatása közben
egyfajta távoktatási kísérletként olyan multimédia rendszereket kapjanak kézbe a hallgatók, amelyek segítségével a
tantárgyhoz kapcsolódóan gyakorlati tapasztalatokat szerezhetnek a laboratóriumban vagy otthon a számítógépük
előtt ülve az aktuális anyagrészben.
Az oktatás technológia eszköztárában régóta szerepelnek hang-, kép- és videoanyagok. Az ilyen eszközöket
alkalmazó tanulási/tanítási módszerek egyre professzionálisabb szintet értek el. A számítógépek alkalmazását az
oktatásban is megjósolták már évtizedekkel ezelőtt a tudományos-fantasztikus irodalomban. A technikai feltételek a
90-es évek elejére tették lehetővé a számítógépes oktatóanyagok létrehozását. Megjelentek a multimédia PC-k, és
ezzel szabaddá vált az út a multimédia alkalmazások tömeges elterjedése előtt. Azon multimédia termékeknek a
száma, amelyek neve mögött valódi távoktatás jelenik meg jelenleg még igen csekély, mivel az eszközök még
aránylag fiatalok és a távoktató anyagok kidolgozása hosszú időt (jellemzően 1-2 évet), nagy energiát vesz
igénybe.
Ezek a tényezők motiválták azt a fejlesztést, amely a holland Delfti Műszaki Egyetem Információelméleti
Tanszékén folyik, és amelynek eredménye egy demonstrációs és távoktatási célú, képkódolási eljárásokat bemutató
programcsomag [1]. A BME Távközlési és Telematikai Tanszékén egy hasonló, hang- (és ezen belül is
hangsúlyozottan beszéd-) jelek kódolási eljárásait interaktív módon bemutató környezet került kifejlesztésre [2].
A továbbiakban a fent említett két software-t mutatjuk be, majd egy olyan multimédia környezetet
ismertetünk, melyben a demonstrációs programcsomagok segítségével interaktív mérések végezhetők. Kitérünk
továbbá a multimédia egy speciális megjelenési formájára, mely rohamléptekkel terjed a világméretű nemzetközi
számítógép hálózaton, az Internet-en.
2. A HDSP Demo programcsomag
1991-93-ban a Delfti Műszaki Egyetem Információelméleti Tanszékén fejlesztették ki Sun-Sparc munkaállomásokra
azt a High Definition Signal Processing nevű demonstrációs programcsomagot (HDSP Demo), melyet a
képkódolást oktató tantárgyak (például: Coding for HDTV; Audio and Video Coding; stb.) előadásainak gyakorlati
kiegészítésére használnak. A többszáz mérnökóra munkával létrehozott oktatóanyag egy bő egyhetes intenzív
tanfolyam kitöltésére elegendő. A megcélzott réteg (azaz a hallgatók, tanfolyam résztvevők) lehetőségeit figyelembe
véve elkészült IBM-PC-kre a programcsomag MS-Windows verziója is, melyet az architekturából adódó
megszorítások figyelembe vételével dolgoztak ki [1]. Az egyes kódolási eljárásokat implementáló modulok
interaktívan, vizuálisan, a gyakorlatban mutatják be az előadásokon elhangzott anyagot. A felhasználó által beállított
paraméterekkel vizsgálhatók meg mind a primitív kódolási lépések (mint például: (alul-) mintavételezés, kvantálás (-i
hibák), dithering, vektorkvantálás, stb.); a transzformációs algoritmusok (pl. diszkrét koszinusz transzformáció); és az
összetett képkódolási algoritmusok (pl. részsávú kódolás, JPEG, MPEG) hatásai. Példaként a differenciális kvantálást
(DPCM) bemutató modul grafikus kezelői felülete látható az 1. ábrán. A 2./a,b,c,d ábrákon különböző paraméter-
illetve opció-beállításokhoz tartozó kimenetek láthatók.
[Figyelem! Hallgatói mérés előtt célszerű a
HDSP Demo Súgóját letölteni és tanulmányozni!]
1. ábra A HDSP Demo DPCM moduljának grafikus kezelői felülete
2. ábra PCM és DPCM kódolt képek
(a) 8 bites PCM bemenet; (b) 3 bites PCM kimenet; (c) 3 bites DPCM kimenet; és
(d) a különbség a bemeneti és a DPCM kimeneti kép között
3. A LASC Demo programcsomag
1994 tavaszán a BME Távközlési és Telematikai Tanszékén kezdődött el a Low Bit-rate Audio Signal Coding nevű
demonstrációs software (LASC Demo) fejlesztése, amely a fentiekben ismertetett képkódolási
programcsomag funkcionális megfelelője hangkódolási eljárások hatásainak bemutatására [3]. A LASC Demo
(csakúgy mint a már említett képkódolási demo) moduláris felépítésű, lehetővé téve ezáltal további kódolási
eljárásokat bemutató modulokkal való bővítést is. A fejlesztés pillanatnyi állapotában öt modul áll rendelkezésre,
amelyek az alulmintavételezés, a kvantálás, a differenciális kvantálás, a részsávú kódolás és a különböző torzítások
hatásait mutatják be. A közeljövőben a demonstrációs programcsomag tovább bővül az adaptív DPCM kódolást, a
lineáris prediktív kódolást és a vektorkvantálást bemutató modulokkal. Az összehasonlíthatóság (és a hasonlóság
bemutatása) kedvéért a 3. ábrán a LASC Demo DPCM moduljának grafikus kezelői felülete látható. A kimeneti
jelalakok audiovizuális elemzése lehetőségének csak egyik oldalát képes a 4. ábra megmutatni; a (tetszőleges
sorrendű) meghallgatáshoz a PC-kben szabványos MS-Windows kompatibilis hangkártya szükséges.
3. ábra A LASC Demo DPCM moduljának grafikus kezelői felülete
4. ábra Egy kimeneti hullámforma a WaveView programban
Az alsó ablakban látható felnagyítva a felső ablakban kijelölt rész.
A LASC Demo tartalmaz a MS-Windows programok családjában jól ismert WinHelp hypertext formátumú
ún. context-sensitive "Súgó"-t (help-et), azaz bármely modul grafikus kezelői felületén a Help-et választva
leírást kapunk egyrészt az adott modulhoz tartozó kódolás elméleti hátteréről, másrészt a paraméterezési
lehetőségekről, az egyes paraméterek jelentéséről (egy tipikus Reference Manual felépítésének megfelelően).
A Subsampling (alulmintavételezés) modul elméletét tárgyaló Súgó egy részlete látható az 5. ábrán.
[Figyelem! Hallgatói mérés előtt célszerű a
Súgót letölteni és tanulmányozni!]
5. ábra A LASC Demo-hoz tarozó Help egy részlete
4. Oktatási segédlet
A laboratóriumi gyakorlati oktatás keretében megjelenő demonstráció önálló elvégzését segíti elő és irányítja a
hallgatók számára a programcsomaghoz tartozó elektronikus könyvecske. A távoktató programok kedvelt eszköze az
Asymetrix cég ToolBook nevű programja, amely a demonstrációs csomagokhoz hasonlóan MS-Windows
környezetben működik. A LASC Demo-hoz tartozó ToolBook-os ismertető csak egy rövid felvezetést ad az egyes
modulokhoz, bemutatja a működés alapgondolatát (6. ábra), és útmutatást ad az induláshoz. (Ez megfelel egy tipikus
Users' Guide Introduction és Getting Started fejezeteinek.) A könyvecske lapozható oldalakra van
osztva; az oldalak két féltérre vannak bontva: a jobb térfél egyes régióit a mutató eszközzel (tipikusan az egérrel)
érintve a bal térfélen olvasható az azon régióhoz tartozó magyarázat illetve leírás. A 7. ábrán látható a LASC Demo
DPCM modulját ismertető oldal egy állapota.
6. ábra A LASC Demo működésének rövid bemutatása ToolBook rendszerben
7. ábra A LASC Demo egy modulját bemutató ToolBook oldal
5. Távoktatás multimédia-hálózaton
Egy világméretű multimédia hálózat robbanásszerű fejlődésének lehetünk tanúi napjainkban. A WWW (WorldWide
Web, azaz Világméretű (Pók-)Háló) egy hypermédia kiegészítéssel ellátott világméretű információs rendszer,
melynél speciálisan erre a célra kialakított központi számítógépek (server-ek) szolgáltatják az információt. A
hypertext domumentumokba html (HyperText Markup Language) formátumú álló- és mozgóképek, hanganyagok és
szövegek kerülnek. Ezekhez a WWW browser-ek ("böngésző"-k) segítségével férhetünk hozzá. Az egyik
legismertebb ilyen browser az NCSA Mosaic nevű programja, amelyet különféle gépekre (PC, Mac, Sun, RS6000,
HP, stb.) és grafikus rendszerekhez (MS-Windows, X-Windows, stb.) is kidolgoztak. A számítógépes hálózaton
található szolgáltatások illetve erőforrások azonosítására és az elérési útvonal megadására egységes rendszert (URL,
Uniform Resource Locator) dolgoztak ki, amely eltakarja a különböző server-ek egymástól eltérő protokolljait.
8. ábra A LASC Demo-t ismertető WWW egy oldala
Kedvcsinálóként, ha úgy tetszik reklámként, a LASC Demo programcsomag bemutatkozik az Internet
hálózat használói számára a WWW browser-ekkel (pl. Mosaic, Cello) "böngészhető" html
formátumban. A bemutatkozó oldal (8. ábra) tartalmazza az egyes
modulok rövid funkcionális leírását, képességeiket, utalást a project céljára; illusztrációként elérhető minden grafikus
felhasználói felület képe. Csábítónak tűnt hangminta beemelése is, ám sajnos itt még nincs meg az egység:
különböző server-eken különböző formátumban tárolják a hangot, ezért áttöltésükkor a browser-ek ritkán képesek a
visszajátszásra. Mivel a programcsomag futtatható és adatbázis állományait másolási jog nem korlátozza, ezért a
rendszer teljes egésze a megfelelő dokumentációval együtt (a multimédia szabályai szerint) egy gombnyomással
áttölthető a világ bármely Internet hozzáférésű pontjára.
6. Összefoglalás
A Budapesti Műszaki Egyetem Távközlési és Telematikai Tanszékén hosszú évek óta folyó távközlési oktatás
továbbviteleként az utóbbi hónapok folyamán felmerült az igény egy olyan tárgy kidolgozására, mely a távközlésben
alkalmazott audio-, video- és egyéb információátviteli feladatokat a multimédia fogalma köré csoportosítva tárgyalja.
A Telematika és Multimédia tantárgy kidolgozása során született meg a gondolat, miszerint a tárgy keretében
kísérleti jelleggel olyan multimédia rendszereket kapjanak kézbe a hallgatók, amelyek által a laboratóriumban vagy
otthon a számítógépük előtt ülve gyakorlati tapasztalatokkal gazdagodhatnak a tananyaghoz kapcsolódóan.
Ennek nyomán kezdődött el az a fejlesztés, amely a holland Delfti Műszaki Egyetem Információelméleti
Tanszékén kidolgozott demonstrációs és távoktatási célú, képkódolási eljárásokat bemutató programcsomag (HDSP
Demo) ötlete alapján, egy hasonló, hang- (és ezen belül is hangsúlyozottan beszéd-) jelek kódolási eljárásait
interaktív módon illusztráló software (LASC Demo) megvalósítását tűzte ki céljául.
Az előzőekben a fent említett két demonstrációs programcsomagot, a HDSP Demo-t és a LASC Demo-t
mutattuk be röviden. Ezekhez kapcsolódóan egy olyan ToolBook-os multimédia környezetet ismertettünk, melyben
ezen programcsomagok segítségével interaktív, demonstrációs jellegű mérések végezhetők. Kitértünk a multimédia
egy speciális megjelenési formájára, a WWW nevű hypermédia információs rendszerre, mely a világméretű
nemzetközi számítógép hálózaton, az Internet-en van elterjedőben, és bemutattuk a demonstrációs programok
megjelenési formáját ezen a hálózaton.
Mindkét demonstrációs programcsomag bárki számára díjmentesen elérhető:
hdspdemo illetve
lascdemo. Mivel a fejlesztés tovább folytatódik,
a szerzők kérése egy e-mail a
marosi@bme-tel.tmit.bme.hu címre a tapasztalatokról, javaslatokról.
Irodalom
[1]: Gy. Marosi: "A Video Coding Demonstration Package", Diploma Thesis, Delft Univeristy of Technology, 1993.
[2]: B. Kalotay, Gy. Marosi, P. Tatai: "Developing An Audio Coding Demonstration Package for Educational Purposes", Journal on Communications, 1994, (accepted for publication)
[3]: B. Kalotay, Gy. Marosi: "Low Bit-Rate Audio Signal Coding Demonstration Package", TEMPUS Konferencia, Budapest, 1994.