52. évfolyam (2005) 11-12. szám

A tartalmi feltárás problémái online könyvtári katalógusokban*

Prokné Palik Mária

A könyvtári munka feltételei jelentősen megváltoztak az integrált könyvtári szoftverek megjelenésével. Nagyrészt számítógépes adatbázisok váltották fel a cédulakatalógusokat. A retrospektív adatbevitel során az adatbázisba kerülnek a korábban csak cédulákon szereplő bibliográfiai adatok. A USMARC és a HUNMARC adatcsere-formátum alkalmazása lehetővé tette a számítógépes rekordok könyvtárak közötti cseréjét is. A könyvtári feldolgozás formai része (a bibliográfiai leírás) sikeresen alkalmazkodott az új technikai lehetőségekhez. A tartalmi feldolgozás (osztályozás) területén is szükséges a felzárkózás.

Az ETO-jelzet tartalmának természetes nyelvű megfogalmazása

A különböző könyvtárakban más és más információkereső nyelvet használnak. Ezek közül különleges figyelmet érdemel az ETO, nemcsak azért, mert keletkezését és használatát illetően közel száz évre tekinthetünk vissza, hanem azért is, mert elterjedtségét és egyetemességét nézve is egyedülálló. Ezzel kapcsolatban szeretnék néhány problémát felvetni, és a lehetséges megoldásokat számba venni. Az ETO mesterséges nyelvű információkereső nyelv. Használatát megnehezíti, hogy nem tudjuk megmondani ránézésre a jelzetek jelentését. A múltban tájékoztató könyvtárosok segítették a könyvtárba látogató olvasókat a keresésben. A szakkatalógus szerkesztői választólapokat helyeztek el a katalóguscédulák között. Ezeken feltüntették a főtáblázati számokat meghatározásaikkal együtt. Természetesen az ETO-táblázatok is hozzáférhetők voltak az olvasók számára.

Napjainkban az interneten keresztül is elérhetők a könyvtári adatbázisok. Ezért a tájékoztatás feladatát is az adatbázisnak kellene átvennie. A múltbéli példa is mutatja, nem választható el egymástól a rekordokhoz kapcsolódó konkrét ETO-jelzeteket tartalmazó adatbázis és az ETO-táblázat.

Új tárgykörök osztályozása

Különösen szakkönyvtárainkban kell rendkívül sok új tárgykör osztályozását megoldani. Ezekre azonban általában nincs vagy nem egyértelmű a jelzet a jelenleg használt táblázatokban. Így aztán könyvtáranként más és más megoldás születik egy-egy tárgykör osztályozására. A közös adatbázisokban ezek a különböző alakú jelzetek – egymástól függetlenül – mind megjelennek. Az azonos jelentésű, de különböző alakú jelzetek később gyakran nehézséget okoznak még a hozzáértők számára is. Például gondoljunk a multimédia vagy a számítógépes grafika esetére. Már elég régóta ismerősen csengő kifejezésekről van szó, mindkét témának jelentős az irodalma. Az őket leíró ETO-jelzet azonban teljesen esetleges, a multimédiát leírhatjuk a 007:621.395.43, a 316.774:[681.3], a 316.774:[621.39], a 681.3.019 és a 681.3.069 jelzetekkel is, a számítógépes grafikát pedig jelölheti az 514.182-37:519.688 és az 514.182-37:681.3.019 jelzetek bármelyike. Az ilyen egyedi, egymástól független ETO-jelzetek helyett a nemzetközileg elfogadott szabványos jelzetet kellene használni. Szükség lenne tehát az ETO-t karbantartó konzorcium módosító kiadványainak rendszeres átvételére, ahogyan ez a nyolcvanas évek végéig meg is történt Magyarországon. Várakozással tekintünk tehát a közvetlenül megjelenés előtt álló magyar középkiadás elé.

Retrospektív tartalmi feldolgozás

A retrospektív adatbevitel problémái

Az online adatbázisba általában kétféleképpen kerülnek ETO-jelzetek: egyrészt az új könyvek feldolgozása során az éppen használatban lévő táblázat szerint, másrészt pedig a régi ETO táblázatok alapján készült cédulák adatainak folyamatos retrospektív bevitele révén. Ezek aztán az adatbázis mutatójában egymás mellett, megkülönböztetés nélkül jelennek meg egy-egy böngésző lekérdezés alkalmával.

Van például olyan könyvtár, ahol a személygépkocsikkal kapcsolatos irodalom egyidejűleg keresendő a 629.114.6 és a 629.331 jelzet alatt is. Hasonló módon a fizikai kémiát az 541.1 és az 544 jelzet alatt is meg kell nézni. Másrészt éppen az 544 jelzet az 1958-as ETO-kiadásban a minőségi analízist jelöli, míg a 14/1 verzió (az 1989-es módosító kiadvány, amely magyarul 1991-ben jelent meg) szerint a fizikai kémiára utal. Ez utóbbi példa arra hívja fel a figyelmet, hogy a szinonimák mellett homonimák – a különböző tartalmú, de formailag azonos jelzetek – szétválasztására is megoldást kell találni.

Példánk arra is rámutat, hogy amikor ETO-jelzetről beszélünk, a számjelzet mellett annak természetes nyelvű magyarázatát is ismernünk kell, sőt tudnunk kell azt is, hogy az adott jelzet melyik ETO-kiadáson vagy módosító kiadványon alapul. Meg kell követelnünk, hogy a böngészőben található ETO-jelzetek és az általuk leírt témakörök közötti kapcsolat kölcsönösen egyértelmű legyen.

Láthatjuk, hogy a probléma alapvetően az ETO számváltozásaiból, az új számok bevezetésének különböző üteméből, illetve elmaradásából adódik. Ugyanis emiatt előfordulhat egyrészt, hogy azonos tartalmat különböző alakú jelzetek írnak le, másrészt pedig – bizonyos régi számok újbóli kiosztása miatt – lehet, hogy azonos alakú jelzetek különböző tartalmat takarnak. Ez a helyzet kialakulhat bármely ETO-val dolgozó, retrospektív adatbevitelt is folytató könyvtárban. Megoldást az jelentene, ha a régi ETO-jelzetek adatbázisban való rögzítésén kívül megtörténnék egy visszamenőleges tartalmi feltárás is.

A régi jelzetek átírása

Ha a retrospektív feldolgozás során az elavult, régi jelzetek átírása mellett döntünk, azt is rögzítenünk kell, hogy az ETO-táblázat melyik verziója szerint hajtjuk végre a módosításokat. Annak tudatában kell eljárnunk, hogy az ETO-táblázat folyamatosan változik, a jelenleg használatos verziót a jövőben elkerülhetetlenül új váltja fel, és így a módosítási folyamatot újra és újra meg kell ismételni.

Nagyon fontos ezen utólagos módosítások írásbeli dokumentálása is. Az ETO-adatbázis a különböző jelzetek nagy száma miatt nehezen áttekinthető, és a változtatásokat következetesen kell végrehajtani a teljes adatbázisban, gondolva minden összetett jelzetre is. Például a jelenleg használt táblázatban, mint ismeretes, a (063)-as általánosan közös formai alosztás utal arra, hogy az adott dokumentum valamely konferencia anyagát tartalmazza. Az 1958-as ETO-kiadásban ugyanerre a célra a (061.3)-as jelzet volt fenntartva. Látszólag a karbantartó programban két karakter („1.”) kitörlésével a teljes adatbázisban megkapjuk az új érvényes jelzetet. Azonban a formai alosztások mindig valamely főtáblázati számhoz kapcsolódnak az adatbázisban. A (061.3)-as jelzet nyilván mindig a régi táblázatokból vett – sokszor már érvénytelen – jelzetekhez tartozik. Így a javítás révén olyan összetett jelzetek keletkeznek, amelyeknek egyik eleme a régi, másik pedig az új táblázat szerint értelmezhető. Ezen „vegyes” jelzetek jelentése már teljesen bizonytalan. Ügyelni kell tehát arra, hogy az összetett jelzetek elemeit egymástól függetlenül nem szabad módosítani. Ez azonban a számos jelzet egyedi ellenőrzését igényli.

Azokban a könyvtári rendszerekben, amelyekben a módosítások dokumentálására még nincs lehetőség, komoly veszéllyel jár az átírás, így nem javasolható ezen eljárás alkalmazása. Ajánlatos lenne egy revíziótörténet mezőt bevezetni a rekordokban, amelyre rá lehetne keresni, és utalóként is működhetne. Így követhetővé válna a jelzet története.

Utalók alkalmazása

A múltban a katalógusszerkesztők utalók beépítésével is hozzájárultak az eredményes kereséshez. Így amikor áttértünk az ETO 13/3 verziójáról a 14/1-re, utalókat helyeztek el a katalógusszekrényben az egyes megváltozott jelzetekhez. Például a régi 629.114.6 jelzetnél utalót találhattunk a neki megfelelő új 629.331 jelzetre, és fordítva, a 629.331 jelzetnél is utaló mutatta, hogy az korábban 629.114.6-ként szerepelt. A cédulakatalógusok esetén már bevált utalókat alkalmazhatnánk az online katalógusokban is. Ezt akkor tehetjük meg online módon, ha az online katalógusban lehetőség van az ETO-jelzetek alkotta besorolási adatállomány kezelésére. Az ETO-besorolási adatnak tartalmaznia kell a számjelzetet, természetes nyelvű magyarázatát, továbbá azt, hogy melyik táblázat vagy módosító kiadvány alapján adták az adott jelzetet. Ezenkívül fel kell tüntetnünk, hogy az adott tárgykör osztályozására milyen jelzeteket használtunk régebben, illetve már megszűnt jelzet esetén milyen új jelzet vagy jelzetek váltották fel.

Egy olyan információkereső rendszerre lenne tehát szükség, amely összefüggést teremt az ugyanazon típusú, de különböző korszakból származó ETO-jelzetek között. Ehhez létre kellene hozni a magyarországi jelzetváltozásokat nyomon követő adatbázist. Hazánkban a múltban az ETO teljes kiadása alapján épültek a nagyobb könyvtárak katalógusai.

Egy gráfot képzelhetünk el, amelynek csúcsait a főtáblázati számok (magyarázataikkal és érvényességi idejükkel együtt) alkotják, élei pedig azt mutatják, hogy a jelzetváltozások során az egyes régi jelzeteknek mely új jelzetek lettek megfeleltetve (egy réginek esetleg több új), és fordítva, hogy az egyes új jelzetek mely régi jelzetekből származtathatók. Az adatbázis kialakításához szükséges az összes régi ETO-kiadás, valamint a módosításokat tartalmazó utalók jegyzéke is. Ezek bevitelével kell elkészíteni a gráf számítógépes adatrendszerét és a szükséges eljárásokat, amelyek lehetővé teszik a gráf bejárását mindkét irányban az utalók alapján. Ha ez rendelkezésünkre állna, összevethetnénk egy-egy könyvtár konkrét adatbázisával, és így már jó esélyünk lenne a fentebb említett utalók létrehozására. Eleget tehetnénk ezáltal az információkereső nyelvvel szemben támasztott követelményeknek.

Addig pedig, amíg elkészül ez a teljes kiadáshoz kapcsolódó változat, a középkiadás alapján kellene beépíteni az utalókat, hogy legalább az ebben szereplő jelzetek története követhető legyen.

Végül érdemes lenne elgondolkozni azon, hogy az eddig egymástól függetlenül dolgozó osztályozó műhelyek munkáját miként lehetne összehangolni:

  • Milyen információkereső nyelveket használnak az egyes könyvtárak?
  • Melyik ETO-kiadást?
  • Hol és mennyire követik nyomon az ETO külföldi fejlődését?
  • Az azonos nyelvet használók között milyen alkalmazásbeli különbségek vannak?

A különböző módszerekkel végzett osztályozás eredménye a felhasználók előtt egyszerre látszik egyrészt az interneten, másrészt pedig a közös katalógusokban. Kisebb könyvtáraink tájékoztató munkatársai is jelentős segítséghez jutnának, ha tartalmilag átlátható, jól kereshető adatbázisok állnának rendelkezésükre. Egy adatbázist jól kereshetőnek mondunk, hogyha egy keresés eredményeként kapott találati halmaz mindazokat (szinonima), és csakis azokat (homonima) a rekordokat tartalmazza, amelyek eleget tesznek a keresési feltételben megfogalmazott kívánalmaknak.

Ne feledjük, az információ annyit ér, amennyi megtalálható belőle.

Barátné Hajdu Ágnesnek és Ungváry Rudolfnak itt köszönöm meg értékes tanácsait!

Beérkezett: 2005. IV. 25-én.

A szerző osztályozó könyvtáros a BME OMIKK-ban.
E-mail: mpalik@omikk.bme.hu


* A Networkshop 2005 konferencián (Szeged, 2005. március 30–április 1.) elhangzott előadás alapján.


Irodalom

FEJŐS László: Kell-e még az ETO? Vita a könyvtárosok Katalist levelező fórumán (Összegzés). Budapest, 2000.
http://www.ki.oszk.hu/3k/valcikkek/ valcikkek0003/fejos.html

Nyomtatható verzió