51. évfolyam (2004) 5. szám

Tezaurusz és ontológia, avagy a fogalmi ismertetőjegyek generikus öröklődésének formalizálása

Ungváry Rudolf
Országos Széchényi Könyvtár

A tezauruszokat és osztályozási rendszereket hagyományosan a dokumentumok (források) tartalmi feltárásához és kereséséhez használják. Egyik legfontosabb összetevőjük a fogalmak (osztályok) generikus hierarchialánca, melyben az általánosabb jelentésű fogalom (átfogóbb osztály) ismertetőjegyeit a speciálisabb fogalmak (osztályok) „öröklik”. A szemantikus web kialakítására irányuló törekvések nyomán jelentek meg az ún. ontológiák, melyek a fogalmak (osztályok) generikus hierarchialáncaiból, és velük összekapcsolt, elsőrendű logika szerint megfogalmazott szabályokból állnak. Egyik legfontosabb feladatuk a generikus hierarchia említett öröklődésének, és vele következtetések létrehozásának biztosítása. Az ontológiák áttételesen egyrészt az arisztotelészi kategóriarendszerre, másrészt Ranganathan a modern osztályozást megtermékenyítő többdimenzionális osztályozáselméletére, s ezen keresztül a távol-keleti kultúrákra is visszavezethetők. Az ontológiákat a szakértői rendszerekben és ismeretbázisokban használják, az információkeresés szemantikailag automatizáltabb támogatására. 2003 elején elkészült a szabványajánlásuk (Ontology Web Language = OWL) is. Ennek alkalmazási példája tezauruszokra és osztályozási rendszerekre a tanulmány végén található.

A rendezés kétféle módja

Ha valaki fogalmakból álló rendező rendszert készít, elvileg kétféle módon foghat hozzá (ettől még e két elvről nem kell, hogy tudomása legyen – nem gondolja, de teszi): vagy van a létről magáról, annak egészéről vagy részletéről, szerkezetéről, rendjéről valamilyen elképzelése, netán víziója, vagy a lét leírására használt nyelvről él benne ilyesmi.

Az első esetben osztályozási rendszer (egyes szakterületeken – mint pl. a biológiai rendszertanban – a nevük taxonómia, más területen – mint pl. az igazgatásban – nómenklatúra) születik. Az osztályozási rendszerek lehetnek egyetemesek vagy speciálisak, attól függően, hogy a rend a lét egészére vagy csak annak részletére vonatkozik. Egyetemes rendszer keletkezik például, ha valaki a létet felosztja természeti és társadalmi, azon belül élettelen, biológiai, pszichikai, gazdasági, civilizációs és kulturális szférákra, és e felosztást tovább finomítja (például a fizikai szférát a fizikára, kémiára, földtudományokra stb., például a gazdaságot iparra és kereskedelemre, az ipart őstermelésre, bányászatra, kohászatra, vegyiparra, gépiparra, építőiparra).

A Magyarországon ismertebb osztályozási rendszerek közé tartozik például az Egyetemes Tizedes Osztályozás, a Szolgáltatások Jegyzéke (SZJ), a Foglalkozások Átfogó Osztályozási Rendszere (FEÁOR). E rendszerek osztályait többnyire mesterséges nyelven alkotott jelzetek (kódszók) jelölik (ETO-jelzetek, SZJ-számok stb.), de újabban – elsősorban a webkatalógusokban – terjednek a természetes nyelvű osztályozási rendszerek (például a magyar AltaVizsla katalógusának osztályozási rendszere).

A második esetben nyelvi rendszer születik, melynek foglalata a szótár. A legegyszerűbb esetben (amikor semmiféle „vízió” nincs vagy nem szükséges a nyelvről), betűrendes rendezettséget alkalmaznak; ez a hagyományos két- és többnyelvű szótárak világa. Az értelmező és terminológiai szótárak a nyelv szavairól, kifejezéseiről tartalmaznak különféle magyarázatokat, melyekben rejtve (szövegesen) már ott vannak az összefüggések is. A strukturált szótárban pedig – mint amilyenek az információkereső tezaurusz, vagy annak egyszerűbb változata, a tárgyszójegyzék – a fogalmakat megnevező szavak, kifejezések között explicit módon is feltüntetik az adott használati területen vagy gyűjtőkörben legfontosabbnak tekintett értelmi és egyéb összefüggéseket. A tárgyszójegyzékek és információkereső tezauruszok kifejezései ugyan szintén osztálynevek, de szervezettségük eleve nem elsősorban hierarchikus (mint az osztályozási rendszereké), hanem a szemantikai és egyéb összefüggéseken alapul.

Az osztályozási rendszerekbe a dolgokat (dokumentumokat, élő szervezeteket, szolgáltatásokat, foglalkozásokat és szakmákat) inkább besorolják, beosztják, általában egy, néha két-három osztályba, de általában nem sokba. A tezauruszok, tárgyszójegyzékek segítségével ezzel szemben a dolgokat inkább leírják, s ehhez általában egynél jóval több deszkriptort (néha akár egy tucatot is) használnak föl (ezt nevezik koordinatív osztályozásnak vagy indexelésnek).1

A generikus rendezettség tulajdonsága: az ismertetőjegyek öröklődése

A fogalmi öröklődés szabálya

Tezauruszban a fogalmak rendezettsége a különféle szabványosított relációtípusok szerint valósul meg. Az 1. ábrán például címkézett irányított gráfokkal reprezentált részlet látható a legnagyobb magyar átfogó tezauruszból, a Köztauruszból.2 A részletet azért egy gyakorlatban használt tezauruszból választottuk, hogy példázzuk vele a tezauruszokban rögzített gazdag összefüggéshálót. 3

1. ábra Tezauruszrészlet megjelenítése címkézett irányított gráffal
Az ontológiákban legfontosabb szerepet játszó generikus relációt vastagabb gráfél jelöli.
A félkövér deszkriptorok szerepelnek az utolsó fejezet megvalósítási példájában és a 3. ábrán
–––→generikus (faj–nem) reláció;     – – –→ partitív (rész–egész) reláció;
–.–.–.→oksági (eszköze, tárgya stb.) reláció;      ↔egyéb (asszociatív) reláció; = szinonima

E relációtípusok között a generikus (faj–nem) relációnak kitüntetett szerepe van. A generikus reláció hierarchikus (az 1. táblázatban három ilyen hierarchia látható).

1. táblázat
Tezaurusz generikus hierarchialáncai az 1. ábra fogalmai alapján
(A relációlánc kisbetűs elemei („szavai” az 1. ábrán nem szerepelnek, és a tezauruszokban általában nincsenek is fölvéve, mivel a gyakorlati osztályozásban és keresésben nincs rájuk szükség.)

valami
   dolog
      elvont dolog
         probléma
            politikai kérdés
               kisebbségi kérdés
                  nemzetiségi kérdés
                      nemzeti kisebbségek helyzete
                      mint külpolitikai probléma
valami
   dolog
      összesség
         társulás
            népesség
               lakosság
                  nemzet
 
 
valami
   tulajdonság
      emberi tulajdonság
         lelki tulajdonság
            identitás
               nemzettudat
 
 
 

A fajfogalom generikus alárendeltje a nemfogalomnak. Ez a hierarchia logikai nézőpontból típusok és altípusok láncából áll, alapvető tulajdonsága, hogy a fogalmak ismertetőjegyei („tulajdonságai”) az általánostól a speciális felé öröklődnek: az általánosabb típus ismertetőjegyei mind érvényesek az altípusra. Ha igaz az, hogy a kisebbségi kérdés a politikai kérdés(ek) „része”, és összefügg az „autonómia” kérdésével, akkor ez érvényes alárendeltjére, a nemzetiségi kérdésre is. Fordítva viszont, alulról fölfelé nincs a generikus hierarchialánc mentén generikus vagy fogalmi „öröklődés”.

Generikus vagy fogalmi öröklődésen (a továbbiakban: öröklődés) azt értjük, hogy az általánosabb fogalom ismertetőjegyeit a neki alárendelt speciálisabb fogalmak is tartalmazzák. Ha igaz például, hogy a „kutya” ismertetőjegye az „ugatás”, akkor minden „agár”, „puli”, „uszkár” stb. esetében is ismertetőjegy az „ugatás”. Azaz az „ugatás” faji tulajdonság (amin nem változtat, ha van olyan kutya, amely valamilyen véletlenszerű ok miatt nem képes ugatni). Az 1. ábra esetében pedig, ha igaz, hogy például a „politikai kérdés” feszültséget okoz, akkor az is igaz, hogy fajtája, a „nemzetiségi kérdés” is feszültséget okoz. Ezzel szemben nem minden „nemzetiségi kérdés” következménye „külpolitikai feszültség”.

A dolgok közötti relációk a dolgokat reprezentáló fogalmak ismertetőjegyein alapulnak. A „kutya” fogalmának ismertetőjegye például, hogy „jellegzetes hangadása az ugatás”, „felhasználják házőrzésre”, „fertőző betegségük a veszettség”. Eme ismertetőjegyek alapján áll fenn reláció a „kutya” és az „ugatás”, a „kutya” és a „házőrzés”, a „kutya” és a „veszettség”, szükségképpen pedig a kutya összes fajtája és az „ugatás”, a „házőrzés” és a „veszettség” között. (Ha azonban a fenti példában említett „felhasználják házőrzésre” csak bizonyos fajtájú kutyák fogalmainak ismertetőjegye, akkor nem a „kutya” és a „házőrzés”, hanem csak eme kutyafajták és a „házőrzés” között áll fenn reláció, tehát ez a reláció csak eme kutyafajták alfajtáira stb. öröklődik tovább.)

Megfogalmazható az alábbi szabály:

A generikus relációban kapcsolódó fogalmak esetében az általánosabb fogalmak ismertetőjegyei (és vele relációi) érvényesek a speciálisabb fogalmakra is (de fordítva nem). Ez a tulajdonságok generikus öröklődése a fajfogalmak irányában.

A fogalmi öröklődés tulajdonságai

Generikus reláció – s vele ismertetőjegyek öröklődése – csak fogalmak között, és ezeken belül is csak azonos fogalmi kategórián belül lehetséges. Elvont dolognak csak elvont dolog, összességnek csak összesség, tulajdonságnak csak tulajdonság stb. lehet a fajtája. (Szerszámnak, például a késnek nem lehet fajtája tevékenység, például a vágás, hanem csak egy másik, még speciálisabb szerszám, teszem azt a konyhakés meg a zsebkés.) Más relációtípusok is hierarchikusak, de láncaik esetében nincs feltétlen öröklődés. A partitív – rész–egész – reláció például nem fogalmak, hanem a fogalmak terjedelmébe eső dolgok között áll fenn, s ezért nem lehetséges az ismertetőjegyek öröklődése az alárendeltek felé (a „hadsereg” ismertetőjegyei például nem feltétlenül érvényesek a „katona” ismertetőjegyeire). A relációk jelentős része pedig (mint például az oksági reláció, a „tulajdonsága” reláció) különböző fogalmi kategóriák között is fennállhat, ezért az öröklődés eleve lehetetlen.4 Például az „ebtenyésztés” és a „kutya” között oksági reláció áll fenn: az ebtenyésztés „tárgya” a kutya; de a tevékenységet jelentő „ebtenyésztés” ismertetőjegyei nem lehetnek feltétlenül érvényesek az élőlényt jelentő „kutya” esetében, azaz nincs öröklődés.

Ugyancsak nincs öröklődés konkrét dolgok és azok fogalmai között. Abból például, hogy valaki magyar, és elveti a magyar nyelv finnugor eredetét (vagy fordítva), nem következik, hogy a „magyar” fogalmának ismertetőjegye az „elveti a magyar nyelv finnugor eredetét” (vagy fordítva). Ha viszont igaz, hogy a „magyar nyelv” finnugor eredetű, akkor a palóc, a székely, a moldvai csángó nyelvjárás stb. (azaz minden magyar nyelvjárás) is finnugor eredetű, hiszen a magyar nyelvjárások a magyar nyelv fajtái. (Persze lehet olyan magyar nyelvjárás, melyben más nyelvi eredet is ötvöződik, de akkor ez az eredet a magyar nyelv egészére nem érvényes, csak erre a nyelvjárásra és e nyelvjárás fajtáira.)

Osztályozási rendszerben a fogalmakat alapvetően egyetlen, hierarchikus reláció szerint rendezik. Ez a hierarchia azonban sokszor elnagyolt, ún. „laza” hierarchia, azaz nem minden esetben generikus, hanem keverednek benne a különféle relációk. Ilyen laza – nem típus–altípus – hierarchia a 2. táblázatban látható.

2. táblázat
Az ETO „laza” hierarchiája

Osztály

3   társadalomtudomány
34        jog
343      büntetőjog
343.1         eljárási jog
343.10            büntetőeljárás
343.12            vád
343.121               gyanúsított, vádlott
343.121.4                  társadalmi védő
343.19            büntetőbíróság
fogalmi kategória

tudomány (főosztály)
tudomány (osztály)
tudomány (alosztály)
tudomány (al-alosztály)
folyamat
állítás
személy
személy
testület

Mindezek a hierarchikus relációszerkezetek egyben szemantikai hálók is. Az 1. ábrán látható irányított gráfot alkalmazzák formalizáltabb változatban az ismeretalapú rendszerekben.

A gyakorlatban a „laza” hierarchia is ismeretet (tudást) reprezentál, megszorításokkal az ETO is felhasználható az ismeret(tudás)alapú rendszerekben, noha a többféle relációtípusból más és más logikai implikációk következnek.

A hierarchiák tulajdonságaival, s ezen belül az ismertetőjegyek generikus öröklődésével azért szükséges részletesebben foglalkozni, mert az ismertetőjegyek öröklődésének az osztályozás és az információkeresés kezdeteitől fogva fontos gyakorlati szerepe volt és van az eredményes tartalmi feltárásban és keresésben. Ha például valaki túl sok információt talál a „kutya” keresőszó használatával, akkor – anélkül, hogy pontosan ismerné a kutyák egyes fajtáinak a tulajdonságait – valójában az ismertetőjegyek öröklődésére támaszkodva számíthat arra, hogy ha a „kutya” fajtáival keres, továbbra is őt érdeklő információkra akad és fordítva.

A fogalmi öröklődés szabálya tudományos természetű, és természetesen nem közismert. Ösztönösen, a nyelvérzék alapján azonban sokszor alkalmazzák, aminek jellegzetes példája az előbbi, kutyákra vonatkozó keresés esete. Világnézeti téren pedig fatális következménye lehet annak, ha valaki – ösztönösen – hibásan alkalmazza az öröklődés szabályát, és például azt hiszi, attól, hogy magyarként valamit igaznak tart, az minden magyarra igaz kell, hogy legyen.

A generikus relációnak ezt az ismertetőjegy-örökítő tulajdonságát általában csak emberi közreműködéssel (intellektuálisan) lehetett kihasználni.5 Az ismeret(tudás)alapú rendszerekben az ún. ontológiák rendeltetése, hogy automatizáltan is kihasználhatóvá váljék ez a tulajdonság. Az ontológia alapú ismeretbázisokban a tezauruszokban is alkalmazott generikus hierarchiának éppen a fentiekben tárgyalt átörökítő tulajdonságát használják ki „ha... akkor” következtetések (implikációk) formájában. Az ismeretet (tudást) ezzel a hierarchiával reprezentálják, és a logikai következtetéseket erre alapozva fogalmazzák meg. Ezért a generikus reláció nevezhető ontológiai (ontológiaképző) relációnak.

Az ontológiák

A fogalom magyarázata

Az ismeret- vagy tudásbázisokban6 használt, formális logikai leírásokkal ellátott (az 1. ábrán és az 1. és 2. táblázatban példaként bemutatott) generikus hierarchiaszerkezetekkel kapcsolatban kezdtek el az 1990-es évek elejétől – jelentésátvitellel – ontológiákról beszélni. A fogalom azonban már a hetvenes években megjelent a mesterségesintelligencia-kutatásban a szoftverekkel generált mesterséges világok megnevezésére.7 Az eredetileg tudományt (lételméletet) jelentő kifejezés azonban nem az előbbi fejezetben értelmezett hierarchikus fogalmi rendszert jelenti önmagában, hanem annak elsőfokú logikai kijelentésekkel bővített változatát.8 Az „ismerettechnológia” (tudástechnológia = knowledge engineering) nézőpontjából tehát az ontológia meghatározott ismeretterület afféle formális modellje. Az így értelmezett modell esetében korrekt az ontológia megnevezés.9

Az ontológia részét alkotó fogalmi hierarchia kifejezéseivel dokumentumok (források, elsősorban webforrások)10 tartalma osztályozható, írható le. E hierarchia kifejezései tehát a dokumentumok (források) tartalmára vonatkozó ún. másodlagos vagy metaadatokat képviselnek, maga a hierarchia pedig tekinthető osztályozási rendszernek, illetve információkereső nyelvnek. A különbség a hagyományos osztályozási rendszerekhez (ETO) és információkereső nyelvekhez (tezauruszok) képest az, hogy az ontológiákkal a logikai szerkezet jóvoltából automatizáltan kihasználható a generikus hierarchia eddig csak intellektuálisan hasznosított tulajdonsága, az előző fejezetben részletesebben tárgyalt generikus öröklődés. Az öröklődés az ontológiákban például azt jelenti, hogy ha a „kutya” fogalmának ismertetőjegye az „ugatás”, akkor a kutyák minden fajtájára érvényes, hogy ugatnak. Ez a következtetés minden nyelvhasználó, és vele minden kereső számára magától értetődő, mégpedig anélkül, hogy a kutyák minden egyes fajtájára nézve külön-külön rögzítenie kellene magának ezt az ismeretet. Mind a mai napig azonban a logika egyetlen változata sem teszi igazán lehetővé ennek a következtetésnek a formális végrehajtását (azaz ezt az ismeretet egy formális rendszerben az egyes kutyafajták esetében külön-külön rögzíteni kell). Az ontológiákat azért találták ki, hogy ezt a problémát a mesterséges intelligencián alapuló rendszerekben és az ismeretbázisokban, rajtuk keresztül pedig valamiképpen az információkeresésben is valahogy áthidalják.

A 2. ábrán egy weben elérhető, genetikai információkat tároló rendszer ontológiájának hierarchiája látható.

2. ábra A Gene Ontology Consortium ontológiájának részlete.
http://www.godatabase.org/

Filozófiai kitekintés

Az ontológiák számítástechnikai megjelenésének mélyreható és a filozófia alapkérdéseit érintő következményei is vannak, melyek részletes tárgyalására itt nem térhetünk ki.11 Csak utalunk arra, hogy az ontológiák a filozófia meghaladottnak tűnt problémáit elevenítik fel, és töltik meg új tartalommal. Egyrészt belőlük kiindulva egy arisztotelészi világ tételezhető fel a szubsztanciák által képviselt referenciákkal.12 (Például az „állat–emlős–ragadozó–kutya” hierarchialánc alapján feltételezhető a tényleges állat, emlős, ragadozó és kutya léte.)

Másrészt viszont értelmezhető az ontológia (s vele a példaként említett hierarchialánc) úgy is, mint terminológiai jellegű meghatározáshalmaz, más szóval egy üres formális rendszer szimbólumai (ahol az „állat”, „emlős”, „ragadozó” és „kutya” változónak nem kell megfelelnie egy állatnak stb., legfeljebb a programozó fejében). Ez utóbbi értelmezés alapja Quine ún. elkötelezettségi tézise, amely szerint minden elmélet maga után von egy ontológiát, azaz létezőnek tételezi fel azokat a dolgokat, amelyet az elmélet változói jelölnek. Ezek a dolgok azonban nem objektív referenciák.

E két – arisztotelészi, illetve a Quine nevével fémjelezhető analitikus filozófiai – értelmezés egymást kizárja. Hogy melyiknek van igaza, az minden bizonnyal a filozófia soha el nem dönthető kérdései közé tartozik. Az azonban figyelemre méltó, hogy maguk az itt tárgyalt – ha tetszik „számítógépes” – ontológiák hasznot hajtóan működnek.

Az információgazdaság legkorábbi, klasszikus eszközei, az osztályozási rendszerek (pl. az ETO) és tezauruszok mögött valójában színtisztán ugyanez a fenti filozófiai problémakör húzódik meg, de a legújabb korban alig váltott ki filozófiai érdeklődést. Az ontológiákon keresztül az informatikai-számítástechnikai világ (ha tetszik: közösség) tudta felhívni magára a filozófiai figyelmet. Nemcsak az ontológiák hatékonyságának növeléséhez, hanem a könyvtári világ felértékelődéséhez is vezet, ha sikerül megteremteni a kapcsolatot eme hagyományos osztályozási rendszerek és más információkereső nyelvek, illetve az ontológiák között.

Konkrét fejlemények

Az ontológiák kialakulása az elmúlt néhány év fejleménye. Azoknak a törekvéseknek az egyik eredménye, melyek célja, hogy a web forrásai a tartalmuk alapján jobban elérhetők legyenek. A webnek ezt a mai böngészőknél jobban kereshető, a következő évtizedekben valószínűleg kialakuló változatát nevezik szemantikus webnek. E téren viharos fejlődés tanúi lehetünk.

Az egyik legkorábbi fejlemény, hogy 2000-ben közreadtak egy „tématérképnek” (topic map) nevezett hierarchikus fogalmi struktúrát kezelő szabványt [27]. A weben jelenleg található vizualizált fogalmi struktúrák jelentős része ezen vagy ehhez hasonló fejlesztéseken alapszik.13

A közhasznú webes fejlesztéseket támogató World Wide Web konzorcium (W3C)14 égisze alatt egy másik irányban indult el a fejlesztés. Egyik első eredménye volt, hogy 2000-ben a web metaadatainak leírására szabvány született, az XML-en alapuló webforrás-(webdokumentum-)leíró nyelv (Resource Description Framework = RDF).15

A weben alkalmazható hierarchikus fogalmi struktúrák – s vele az előbb említett generikus öröklődés – formális leírására is ezt a nyelvet használták fel, amikor a W3C megbízásából 2002-ben hozzákezdtek az ontológiák szabványának tekinthető webontológia-nyelv (Ontology Web Language = OWL) kialakításához. Az ideiglenes szabványajánlást 2003 tavaszán adta közre a W3C [14].

Ma általában – amint ez Sowa és Gruber előzőkben idézett ontológiameghatározásaiból is kitűnik – meglehetősen korlátoltan fogják fel a fogalmi struktúrákat, mintha ezek kizárólag generikus összefüggésekből állnának. A tezauruszok e tanulmányban is szemléltetett példája bizonyítja, hogy a fogalmi struktúrák ennél sokkal több relációból állnak. Az OWL is azon alapszik, hogy csak a tisztán generikus hálók lehetnek ontológiák, s vele az ismeretreprezentáció alapjai, afféle „háttértudás” (típus–altípus hierarchián elvileg csak generikus reláció értendő). Ezzel szemben a tapasztalatok fényében az az igaz, hogy az ismeretet (tudást) nem egyedül a dolgok közötti tipológiai (generikus), hanem számtalan egyéb partitív, oksági, tulajdonsági, ellentét stb. összefüggés is reprezentálja még. Az OWL szerint osztályok között csak típus–altípus (tehát generikus) összefüggések lehetségesek, minden más reláció csak „tulajdonságként” definiálható. A tezauruszok 1. ábrán bemutatott relációszerkezetének fényében az ismeret reprezentációja ennél bizonyára komplexebb formalizációt igényelne (mint ahogy arra az utolsó fejezetben még rámutatunk, tezauruszokat ma elég körülményesen lehet ontológiaformátumban leírni).

Az ontológiafogalom inflálódása

Az ontológia fenti, korrekt értelmén kívül van egy sor más értelemben is elterjedt, nem valami szerencsés névhasználat is. Sommásan ugyanis „ontológiának” nevezik sokszor magát a minden logikai leírás nélküli generikus fogalmi rendszereket és a szemantikai hálókat is. Ilyen alapon ontológia lehetne a tezauruszon belül, annak részét alkotó generikus kapcsolatok hierarchialánca (1. táblázat), meg az ETO is (2. táblázat).16 Az efféle használat többek között a Yahoo! webkatalógus szerkesztői révén terjedt el az 1990-es évek közepétől, akik a webkatalógusukban használt osztályozási rendszert nevezték „ontológiának” – amely egyébként „laza” hierarchiája következtében az ETO-nak megfelelő rendszer, csak éppen természetes nyelven adják meg az osztályokat. Ezen az alapon „ontológia” a Yahoo!-nak megfelelő magyar (Alta)Vizsla internetkatalógus (osztályozási rendszere) is.

Az „ontológia” megnevezés alkalmazása és kiterjesztése a pusztán generikus fogalmi struktúrákra bizonyára azért következett be, mert az ismeretreprezentáció informatikai (értve ezen számítástechnikai) művelői és a webkatalógusok készítői nem az igazgatás, a statisztika, a különféle rendszertanok, dokumentációs, irattári és archiválási rendszer, és főleg nem a könyvtárak világából érkeztek. Ez utóbbiakban a sommásan „ontológiának” nevezett, de leíró logikai szerkezettel nem rendelkező rendszereket osztályozási rendszereknek, nómenklatúráknak, taxonómiáknak stb. nevezik, és hagyományosan az információk tartalmi feltárására és keresésére használják. Innen nézve az ontológia tekinthető generikus öröklődést biztosító logikai nyelvvel kiegészített hierarchikus osztályozási rendszernek. E kiterjesztett szóhasználat másik oka talán az, hogy az osztályozási rendszerek valóban a létről alkotott ilyen-olyan elképzelések tükrei, a lét tudománya pedig az ontológia.

Az „ontológia” kifejezés használatának inflálódására utal, hogy újabban a közös nyelv, szókincs használatának szabályrendszerét, terminológiai szabályait (például egy testületen, intézményen belül), sőt tantárgytematikák leírását is „ontológiának” nevezik.

Hasonló jelenség játszódott le az elmúlt években az eleve téves „fogalomtár” kifejezéssel. Mesterségesen tárolni csak hordozón rögzített szavakat, kifejezéseket lehet, fogalmakat nem (melyek egyedül a tudatban léteznek), de ez az egyszerű tény talán annyira szubtilis, hogy bizonyára fel sem fogható. „Fogalomtárnak” többnyire a strukturált terminológiai szótárakat nevezik, élvonalbeli újdonságot sejtetve egy fából vaskarika kifejezéssel („fogalomtárról” beszélni olyan, mintha a személyi adatok nyilvántartását „embertárnak” neveznék).

Fogalmi struktúra, ontológia és ismeretbázis

Az ontológia és a hierarchikus fogalmi szerkezet (például tezaurusz) közötti különbséget az alábbi, nagyon leegyszerűsített példával szemléltetjük Sowa nyomán.17

Strukturálatlanul: „A járművek tulajdonsága, hogy részekből állnak, részei például a kerekek. A tréler (nyerges félpótkocsi) olyan jármű, amelynek nyolc kereke van.”

Relációtípusokkal (tezaurusz-struktúrában):

Ez a fogalmi struktúra az ontológia alapja, kiindulása. (Valójában az ontológia információkereső nyelvének részlete, ahol a szavak a lexikai egységek, és a nyilak a relációk.)

Formalizálva, ha:

jármű (x)
tréler (x)
kerék (x)
része (x, y)
set (s)
számossága (s, n)
eleme (x, s)
x = jármű
x = tréler
x = kerék
x-nek része y
s = set [halmaz, összesség]
az elemek száma az s-ben n
x eleme s-nek

(∀x)((jármű(x) ∧ (∃y)(tréler(y) ∧ része(x,y)))) ⊃ (∃s)(set(s) ∧ számossága(s,8)∧ (∀w)(eleme(w,s) ⊃ (kerék(w) ∧ része (x,w))) )).

Azaz: „minden x-re érvényes, ha x jármű, és létezik olyan y, amely tréler, és x-nek része y, melyhez létezik s set [halmaz], és elemeinek s száma 8, és minden w esetében érvényes, hogy ha w az s eleme, akkor w kerék, és x-nek része w”.

Egy ilyen rendszerben konkrét márkájú járművek képviselik a tárgyi adatokat. Ha egy járművet besorolnak például a trélerekhez, akkor a fenti állítás érvényes a besorolt trélerre is, mely megtalálható olyan kérdések alapján, mint pl. „8 kerekes jármű”. Ugyanakkor vannak a fenti példa járművének olyan tulajdonságai, melyek nem öröklődnek. Ilyen például az ára. Az ontológiákban az ilyen tulajdonságokat a generikus hierarchiától függetlenül (nem öröklődően) kell kezelni tudni.

A bekeretezett fogalmi struktúra tekinthető az ontológián belül az osztályozási rendszernek vagy az információkereső nyelv szótárának (amely az ismeretreprezentáció nyelvén „a valóság doménjeinek – részterületeinek – modellje”). Magában ebben az osztályozási rendszerben/szótárban kevesebb a formálisan kifejezett információ, mint a logikai nyelven megfogalmazott állításokat is tartalmazó ontológiában, amit úgy fejeznek ki, hogy az ontológiáknak „nagyobb a szemantikai ereje”. Magyarul: az ontológia több információt tartalmaz, mint egy hagyományos osztályozási rendszer vagy információkereső nyelv. Ez azonban természetes, mivel az ontológia nemcsak a fogalmi rendszert, hanem leíró logikai állításokat, továbbá a tényadatokat is tartalmazza.

A könyvtári adatbázisrendszerek egyik összetevője a feltárt adatokat (a bibliográfiai és egyéb rekordokat) tartalmazó adatbázis, másik összetevője az osztályozási rendszer/információkereső nyelv állománya (mely utóbbi segítségével tárják fel tartalmilag az adatokat).

Az ontológia alapú ismeretbázisokban a feltárt adatok állományát az ismeretbázis tartalmazza, a másik összetevőt pedig az ontológia.

Ontológia és könyvtári rendszer

Egy könyvtári rendszerben a legfontosabb mindig a dokumentumok azonosítása marad. A találatok – keressék azokat tezauruszok generikus hierarchiába szervezett kifejezéseivel, szerzők vagy testületek neveivel, évszámokkal, nyelvkódok stb. alapján – így vagy úgy, de a dokumentumok leírásait fogják tartalmazni. A tartalmi feltáráshoz használt osztályozási rendszer/információkereső nyelv állománya – a metanyelvi állomány – a szoftverkészítők számára sokáig afféle mellékes összetevőnek tűnhetett, talán ezzel is magyarázható, hogy a tezauruszok és osztályozási rendszerek könyvtári rendszerbe integrált, rugalmas, sokoldalú és felhasználóbarát kezelésének a kérdése még ma sincs kielégítően megoldva.

Egy ismeretbázisból a távoli jövőben – a logikai szerkezet jóvoltából – szövegesen megfogalmazott kérdésekre talán szöveges válaszokat lehet majd kapni. Ezért a metanyelvi állomány jelentősége felértékelődik. Éppen ennek a felértékelődésnek a jele az ontológiák megjelenése. Noha az online katalógusok nem ismeretbázisok, ugyanakkor fejlődésükre az ontológiai alapú ismeretreprezentáció hasznos befolyást gyakorolhat. Ez talán változtathat majd a tezauruszok és az ETO jelenleg sanyarú kezelési komfortján is18, és jelentős mértékben javulhat az osztályozási rendszerek/információkereső nyelvek használatának eredményessége. Ezért fontos, hogy az informatikának ez az „ismerettechnológiai eszköze” ismertté váljék a könyvtári világban.

Mivel az ontológiai alapú ismeretbázisok potenciális felhasználói köre jelentős részben a pénzügyi és a gazdasági szféra, a fejlesztések mögött jelentős anyagi várakozások húzódnak meg. Ezzel magyarázható az újszerű, sokat ígérő vagy csupán más kifejezések használata („tudásintenzív”, „szemantikai erő”, „interoperabilitás” stb.), s vele az olykor promóciós célzatú, sulykoló megfogalmazások. Mindez a gyorsan fejlődő szakterületek velejárója. A könyvtártudomány, az osztályozás/indexelés és az információkeresés a maga lényegesen gyengébb önérvényesítő lehetőségei következtében egyelőre e fejlődés árnyékában marad. Fontos, hogy kapcsolatot teremtsünk a hagyományos és az új szóhasználat között, és megvilágítsuk, hogy a könyvtári világ az információgazdaság legkorábbi intézménye, melynek számos eredménye felhasználható az ismerettechnológiában, s egyúttal sikerrel integrálható a tartalomiparban (ahogy a webes információszolgáltatók saját működési környezetüket nevezik).

A tezaurusz (és az ETO) ontológiai formája a hagyományos tezauruszokhoz és ETO-hoz szokott szakember számára első pillantásra meglehetősen szokatlan, mivel ebben a formában nincs különbség a metanyelvi és a tárgynyelvi szint osztályai között. A tezaurusz metanyelvét a „lexikai egységek”, a „deszkriptor” és a „nemdeszkriptor” alkotják. Az ETO esetében a metanyelvi osztályból csak egy van, az „ETO-jelzet”. A tárgynyelvi kifejezéseket pedig a konkrét lexikai egységek és a konkrét ETO-jelzetek alkotják (mint amilyenek az 1. ábrán, illetve a 2. táblázatban láthatók). Azaz az ontológiákban a metanyelvi és a tárgyi kifejezések egyetlen – generikus – hierarchialáncban helyezkednek el (3. ábra). A többi – partitív, oksági, egyéb – reláció ugyanúgy csak tulajdonságadat az ontológiában, akárcsak a lexikai egységek vagy az ETO-jelzetek megnevezései, felvételi dátumai, magyarázatai, forrásadatai stb. (A konkrét megoldás egy példáját az utolsó fejezet tartalmazza.)

3. ábra Tezaurusz és ETO ontológiai csúcsfogalmai
A szaggatott vonal feletti szürke sávban a metanyelvi, alatta a tárgynyelvi kifejezések helyezkednek el. Az elágazásokat nagyfokú leegyszerűsítéssel ábrázoltuk.
A nemdeszkriptorok alatti záróvonal azt jelzi, hogy ezeknek a lexikai egységeknek nincsenek további alosztályai

Metaontológiák

Metaontológiák az ontológiák ontológiái: egyszerűbben fogalmazva az átfogó, elvileg minden speciális ontológiához felhasználható felső szintű ontológia.19 Nemzetközileg ismert példája a Cyc-ontológia, melyet Douglas Lenat és Ramathan Guha többek közreműködésével a 80-as évek végén kezdtek kialakítani.

Az „OpenCyc” kereskedelmi néven ismertté vált egyetemes célú, de elsősorban a teljes társadalomtudomány átfogó, „enciklopédikus” fogalmi rendszerük a generikus reláción alapul. Ennek legáltalánosabb csúcsfogalma a „thing” („valami”). A „cyc” elnevezés az „enciklopédia” angol nevére utal.

A rendszer mára közel 100 000 generikus hierarchiába szervezett fogalommegnevezést (osztályt) tartalmaz milliós nagyságrendű tulajdonságadat és meghatározás mellett. Egyszerűsített változata kereskedelmi forgalomban kapható. Rendeltetése, hogy afféle újrafelhasználható „metaontológiaként” az egyes speciális ontológiaalkalmazások közötti leképzéseket közvetítse. Más szóval háttér-információkat képvisel, melyek relevánsak a speciális alkalmazásokban, de nem specifikusak az adott feladatra nézve: a speciális ontológia átfogó részét alkothatják, ezért tetszés szerinti speciális ontológia kialakításához kiindulásként használhatják fel.20 A tezauruszok analógiájára nevezhetnénk „csúcsontológiának” vagy „makroontológiának”.

A Köztaurusz a jelenleg közel 70 000 lexikai egységével, és ezen belül a közel 35 000 nem–faj (generikus) relációban kapcsolódó, az ontológiában használt nyelven: osztály típus–altípus szerkezetébe rendezett hierarchiájával egy ilyen – ideális esetben szabadon hozzáférhető – kiinduló rendszert képvisel, ha OWL-formában is megvalósul. Mindennek már csak azért is jelentősége van, mert ezáltal a könyvtári, osztályozási/indexelési valamint információkeresési igények is jobban megvalósíthatók az ismerettechnológia keretei között. Mindez visszahathat a könyvtári rendszerek további, felhasználóbarát korszerűsítésére.

Az ontológiák egyik gyökere

A Cyc-ontológia megszületésében az indiai Guha részvétele több volt, mint szokott tudományos kooperáció. A mai tartalmi osztályozás klasszikus megalapozóinak egyike, Ramamrita Ranganathan sem véletlenül volt indiai. Az ind kultúrában hagyományosan többféle létfelfogás is megengedett volt. Természetesnek számított, hogy – vallási szemmel nézve – többféle úton is el lehet jutni az üdvözüléshez, vagy – tudományos szemmel nézve – a létnek többféle elmélete fér meg egymás mellett. Ranganathan személyében e hagyomány találkozott az európai műveltséggel, és meghatározó szerepet játszott a 20. század első felében kialakított analitikus–szintetikus osztályozáselméletének és többdimenzionális osztályozási rendszerének a kialakulásában.

Ranganathan eredményei a 20. század közepétől megtermékenyítően hatottak a modern osztályozásra. Megvetették a szemléleti alapját a nem szisztematikus (nem a tudományok mechanikus felosztásán alapuló), hanem a generikus fogalmi kapcsolatokra épülő polihierarchikus osztályozási rendszereknek (taxonómiáknak, fogalmi struktúráknak), és rajtuk keresztül a tezauruszoknak és újabban az ontológiáknak.

A Cyc-ontológiában – s valójában az OWL szabványban rögzített ontológiafelfogásban is – ennek a szemléletnek a hatása is megjelenik.21

A tezaurusz mint az ontológia alapja
(az OWL-tezaurusz)

Az ontológialeíró-nyelv (OWL)

Az ontológialeíró-nyelvvel (OWL = Web Ontology Language)22 a webes ismeretbázisok, szakértői rendszerek tartalmi feltárást és keresést biztosító ontológiájának géppel olvasható és interpretálható formája írható le. Olyan logikai leíró nyelv, melynek segítségével következtetésekre képes ismeretbázis alakítható ki. Az OWL segítségével (a) osztályok hierarchiája, továbbá (b) osztályok és egyedek jellemzői, meg (c) osztályok és osztályok, osztályok és egyedek, egyedek és egyedek között fennálló kapcsolatok (asszociációk), nem utolsósorban pedig az osztályok ismertetőjegyeinek az osztályok generikus hierarchiájából következő (d) öröklődése írhatók le. A logikai következtetések ezeken az ismertetőjegy-öröklődéseken alapulnak. Mindaz, ami az OWL segítségével leírt osztályokra jellemző, érvényes az osztályok terjedelmét alkotó egyedekre. A jellemzők és a kapcsolatok összefoglalóan az osztályok tulajdonságai.

Az OWL értelmében vett ontológia tehát a következőkből áll (a felsorolás nem teljes):

  • osztályok (Class);
  • egyedek (ID);
  • osztályok közötti generikus – taxonómiai, osztály–alosztály (típus–altípus) – és ekvivalenciarelációk (subClassOf; equivalentClassOf);
  • öröklődő és nem öröklődő osztály- és egyedtulajdonságok (type):
    • osztályok közötti, osztályok és egyedek közötti és egyedek közötti nem generikus relációk (ObjectProperty);
    • relációtulajdonságok (tranzitív, szimmetrikus, inverz stb.) (TransitiveProperty, SymmetricProperty, inverseOf stb.);
    • osztályok és egyedek magyarázatai, hozzájuk kapcsolódó megjegyzések, felvételi dátumuk, forrásuk stb. (DatatypProperty);
    • öröklődő osztály- és egyedtulajdonság-típus és -érték (FunctionalProperty);
    • nem öröklődő osztály- és egyedtulajdonság-típus és -érték (AnnotationProperty);
  • feltételek, megkötések (Restriction), pl. előfordulás (Cardinality), kizárás (disjointWith);
  • rendszertájékoztatások (comment).

Fontos tudnivaló, hogy az OWL három fokozatban létezik (könnyű, közepes és teljes), melyek közül a jelenlegi ismeretalapú és szakértői rendszerek általában csak a könnyű, ritkább esetben a közepes változatot képesek kezelni. A teljes változat kezelése még a jövő zenéje, de a szemantikus web irányába tartó gyorsuló fejlődést feltételezve ez nem fog sokáig váratni magára.

A programozásban járatlan olvasó számára a fenti angol kifejezések szokatlannak festenek, hiszen nem követik a természetes nyelvre vonatkozó írásmódot és értelmezést. Ezek a szavak ugyanis a programozás világának szabványosított kifejezései, és meghatározott jelentésük, illetve szerepük van.

Tezaurusz és ETO leírása az OWL segítségével

Tezauruszok és osztályozási rendszerek is leírhatók az OWL segítségével. Például tezaurusz esetében (1. ábra):

  • osztály egyrészt a „lexikai egység”, a „deszkriptor”, „nemdeszkriptor”, a „politikai kérdés”, „kisebbségi kérdés”, a „nemzetiségi kérdés”, „nemzettudat”, „identitás” megnevezésű deszkriptorok, az „etnikai kérdés” nemdeszkriptor stb.;
  • egyedek például a nemdeszkriptorok utalás szerinti értékei („etnikai kérdés”, „kisebbségtudomány”, „nyelvhasználat”); és adott esetben (ha valamilyen okból, például, hogy az öröklődést kikapcsoljuk) a deszkriptorok értékei;
  • osztályok közötti generikus kapcsolatok (például a „politikai kérdés” – „kisebbségi kérdés” – „nemzetiségi kérdés” között);
  • osztályok közötti nem generikus kapcsolat (például a „kisebbség” – „kisebbségi kérdés”, „nemzetiségi kérdés” – „nemzet” között);
  • az adattípus-tulajdonságok megadhatók funkcionális tulajdonságként öröklődően, vagy annotációs tulajdonságként, melyek nem öröklődnek. Annotációs adattípus-tulajdonságok például a „politikai kérdés”, „kisebbségi kérdés”, a „nemzetiségi kérdés”, „nemzettudat”, „identitás” deszkriptor- és az „etnikai kérdés” nemdeszkriptor-megnevezések, a deszkriptorokhoz és nemdeszkriptorokhoz tartozó magyarázatok, forrásadatok stb.

Ami reláció érvényes a „kisebbségi kérdésre”, az érvényes az összes alárendeltjére is, így a „nemzetségi kérdésre” (ismertetőjegy-öröklődés). Ezt az OWL alkalmazására felkészített programok képesek érvényesíteni. Például ETO esetében (2. táblázat):

  • az osztályokat a 34, a 343 és a 343.1 jelzetek azonosítják;
  • eme osztályok annotációs adattípus-tulajdonságai a „jog”, a „büntetőjog” és az „eljárásjog” jelzetmagyarázatok.

Ami érvényes a 34 osztályra, az nemcsak a „jogra”, hanem a „jog” összes alárendeltjére is érvényes.

A tezauruszokban általában nincs olyan legfelső szinteken is kidolgozott, egyetlen fogalomba vezető csúcshierarchia (lásd az 1. táblázatban a kisebb betűkkel írt szavakat), mivel a gyakorlati osztályozási/indexelési és keresési igények ezt eddig nem tették szükségessé (de adott esetben, az OWL alkalmazása érdekében minden további nélkül pótolhatók). Az ontológiákban sem mindig dolgoznak ki ilyen teljes hierarchiát (a matematika nyelvén „fát”). Az OWL-szabványtól eltérő „Topic Map” (tématérkép) szabvány szerinti leírás esetében is elmondható ugyanez.

Az ideális OWL-tezauruszra a következők a jellemzőek:

  • elvileg minden deszkriptornak van generikus kapcsolata;
  • elvileg minden egyéb (nem generikus) deszkriptorok közötti kapcsolatnak öröklődnie kell;
  • következésképp minden deszkriptort osztályként kell meghatározni (mert csak így valósulhat meg a kapcsolatok öröklődése) (a kapcsolatok pedig szükségszerűen osztályok közötti kapcsolatok);
  • minden deszkriptor–nemdeszkriptor kapcsolatot nem öröklődően kell megadni (mert csak így biztosítható, hogy egy deszkriptor szinonimája [például a „kutya” esetében az „eb”] ne legyen szinonimája a deszkriptor generikus alárendeltjének, például az „eb” ne legyen szinonimája a „puli” alárendeltnek);
  • minden nemdeszkriptor a „nemdeszkriptor” osztály alárendeltjeként, tehát osztályként adandó meg (mert csak így biztosítható a nemdeszkriptorok közös tulajdonságainak öröklődése).

Noha a tezauruszok és osztályozási rendszerek leírhatók az OWL segítségével, úgy tűnik, e nyelv kidolgozásakor nem fordítottak figyelmet ezekre a rendező rendszerekre. Ezért bizonyos megszorítások csak rendkívül körülményesen vagy egyáltalán nem fogalmazhatók meg. Például a „lásd ÉS” kapcsolatok ama tulajdonsága, hogy e relációban egy nemdeszkriptorhoz legalább két, és – ha úgy döntünk – legfeljebb három deszkriptor kapcsolódhat, ismereteink szerint csak körülményesen írható le. Ezt a tulajdonságot ugyanis a nemdeszkriptor osztály tulajdonságaként kellene megadni. De ha megadjuk, akkor az OWL szerint minden nemdeszkriptor osztályra érvényes, arra is, amelyhez nem kapcsolódnak „lásd ÉS” relációban nemdeszkriptorok. Hiányzik olyan lehetőség, amely azt mondja, hogy „ha van 'lásd ÉS', csak akkor...”. Körülményesen ugyan megoldható a probléma, ha háromfajta nemdeszkriptor-osztályt határozunk meg: „nemdeszkriptor lásd kapcsolatban”, „nemdeszkriptor lásd ÉS kapcsolatban” és „nemdeszkriptor lásd VAGY kapcsolatban”.

Tezaurusz besorolási adatcsere-formátuma és az OWL összehasonlítása

A besorolási adatcsere-formátumok a könyvtári számítógépesítés nagyon speciális, ugyanakkor elengedhetetlen eszközei. Ez utóbbi miatt fontos tájékoztatni a kérdésben érintett, viszonylag szűk szakmai kört arról, hogy milyen a kapcsolat e formátum és az OWL között. Már csak azért is, hogy közismert legyen: a két leírás között lehetséges konverzió.

Az OWL és a könyvtári besorolási adatok adatcsere-formátumai ugyanis a látszat ellenére nagyon jól összehasonlíthatók egymással. Úgy is mondhatjuk, hogy a HUNMARC-nak (s vele a USMARC-nak) is van „ontológiája”, ha eltekintünk attól, hogy e formátumok nem tartalmaznak öröklődést kifejező logikai nyelvet.23

  • A besorolási adatcsere-formátumokban az ontológiai (osztály–alosztály) hierarchiát alkotó osztályokat azok a HUNMARC 150-es adatmezőbe (tárgyi kifejezés) tartozó értékek képviselik, melyek között az 550-es adatmező g és h almezői alapján generikus kapcsolatok állnak fenn.
  • Az 550-es adatmező többi, relációkat képviselő almezőjének értékei (a tárgyi kifejezés többi kapcsolata) egyéb osztályok és osztályok, osztályok és egyedek, illetve egyedek és egyedek közötti kapcsolatokat képviselnek. Tehát a nem generikus (faj–nem) kapcsolatok értékei (része, egésze, oka, tulajdonsága stb.) a 150-es adatmező további almezőibe kerülnek. Az OWL-ben az ilyen kapcsolódó kifejezések afféle „asszociációk”, és elvileg öröklődőként is meghatározhatók.
  • A tárgyi kifejezésekhez tartozó szöveges megjegyzések (nyilvános általános megjegyzés, megjegyzés a tárgyi kifejezés használatáról, forrásáról stb.) ugyancsak külön-külön adatmezőkbe (pl. 680, 687, 670) kerülnek. Az OWL-ben ezek adattípus-tulajdonságok, és nem öröklődően is meghatározhatók.

Az áttérés a könyvtári adatcsere-formátumból meghatározott OWL szerinti leírásba adatveszteség nélkül megvalósítható, mert az adatmezők és almezők egyértelműen leírhatók az OWL segítségével. Fordítva ez nem lehetséges, az OWL logikai szerkezetének túlnyomó része elvész a könyvtári adatcsere-formátumra való konvertáláskor, és csak a taxonómiai struktúra, a kapcsolatok (asszociációk) és bizonyos tulajdonságok maradnak meg – a következtetéseket tartalmazó logikai szerkezet elvész. Mindez érvényes az osztályozási rendszerek Magyarországon még nem honosított adatcsere-formátuma (a USMARC format for classification data) és az OWL közötti viszonyra is.

Az OWL-tezaurusz előnyei

A tezauruszokat és az ETO-t a következő okokból célszerű az OWL segítségével leírni:

  • hogy a tezauruszok és az ETO polgárjogot szerezzenek az ontológia alapú ismeretbázisokban való felhasználásra (az ismerettechnológiában – „knowledge engineering” – jórészt ismeretlenek az információgazdaság hagyományos szakterületének eredményei);
  • hogy a tezauruszok és az ETO webes egyéb irányú felhasználását és megjelenítését elősegítsük; ezáltal az interneten publikálható, afféle „hordozható” internetes tezaurusz alakítható ki, konzisztens szerkesztési, továbbfejlesztési lehetőségekkel;24
  • harmadrészt azért, mert előbb-utóbb Magyarországon magyar nyelven is szükség lesz olyan „hordozható” generikus fogalmi struktúrára, mint amilyen az „OpenCyc”, melyet a speciális ontológiák kialakítására lehet felhasználni.

Megvalósítási példa: a Köztaurusz OWL-leírása

Áttekintés

Az alábbiakban röviden ismertetjük a Köztaurusz készülő OWL-leírását. A legnagyobb magyar nyelvű, átfogó tezaurusz a maga közel 70 000 kifejezésével (melynek jelentős százaléka már ma generikus hierarchialáncokba szervezett osztály) ezáltal közvetlenül felhasználható lesz ontológia alapú ismeretbázisokhoz és egyéb webes alkalmazásokhoz.

A tezauruszok OWL szerinti leírása többféle módon is elképzelhető. A most készülő OWL-tezauruszt a következők jellemzik:

  • az OWL szerinti „gyökérosztály” (a „Thing” [valami]) alatti metanyelvi kifejezések („lexikai egység”, „deszkriptor”, „nemdeszkriptor”, „ETO-jelzet”) osztályait unióként (egymással VAGY-kapcsolatban álló egységekként) vettük föl;
  • minden lexikai egységet osztályként határoztunk meg;
  • a generikus hierarchialáncot alkotó lexikai egységek alkotják az osztály–alosztály hierarchiát;
  • a metanyelvi kifejezések osztályait (pl. „deszkriptor”, „nemdeszkriptor”) a saját megnevezésükkel, a tárgynyelvi kifejezéseket (pl. „politikai kérdés”, „nemzettudat”) és egyedeket a c-, illetve az i- előzékkel kiegészített megnevezésükkel azonosítottuk, ahol „c” az osztályt („class”), „i” az egyedet („individum”) jelöli (pl. „c-politikai kérdés”).

Az alábbi példában még nincs kihasználva a tezauruszok és az ETO OWL-leírásának minden lehetősége, csupán a legfontosabbak. Az OWL-Köztaurusz és ETO leírásának szintaktikai ellenőrzésére érvényesség-ellenőrző (validáló) programot használtunk.25 Az itt ismertetett OWL-tezaurusz tekinthető az MSZ 3418 szabvány [10] szerinti tezaurusz általánosított OWL-leírására vonatkozó javaslatnak is.

Ontológiafej

A fejben az ontológia címe, elérhetősége, a verzió-ellenőrzéssel, más ontológiák átvételével összefüggő adatok, egyéb megjegyzések találhatók. Fontos tudnivaló, hogy a helyesen leírt ontológiák egymással csereszabatosak, adott – például átfogó – ontológia más – speciális – ontológiákkal kiegészíthető. Mindezt a helyesen megfogalmazott ontológiafej vezérli (jelenlegi változata még hiányos).

<rdf:RDF
   xmlns:owl="http://www.w3.org/2002/07/owl#"
   xmlns="file:///C:/Relex/rlx040107_a.txt#"
   xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#">
<owl:Ontology rdf:about="">
   <owl:versionInfo></owl:versionInfo>
   <rdfs:comment> Az MSZ 3418 szabvány szerinti tezaurusz OWL-leírása. 0.0 változat
   </rdfs:comment>
   <owl:imports rdf:resource="http://www.w3.org/2002/0owl"/>
</owl:Ontology>

Meghatározások

Minden osztály mint valamely osztály alosztálya határozandó meg (class, subClassof). Ennek alapján minden osztály az owl:Thing (a „valami”) alapján származtatható, mint annak valamelyik alosztálya. Osztálynak azonban nemcsak a tezaurusz generikus relációban kapcsolódó lexikai egységei és az ETO-jelzetek (pl. „nemzetiségi kérdés”, „identitás”, „341.121.4”) számítanak, hanem a rájuk vonatkozó metanyelvi kifejezések is („lexikai egység”, „deszkriptor”, „nemdeszkriptor”, „ETO-jelzet”). Azaz a metanyelvi és a generikus relációban kapcsolódó tárgynyelvi kifejezések az OWL szerint leírva egyetlen hierarchialáncban helyezkednek el, a metanyelv és a tárgynyelv deklarációja azonos elvek szerint, egyetlen leíráson belül történik. A Köztauruszon belül csak a lexikai egységek és az ETO-jelzetek közötti kapcsolatok állnak fenn, nem pedig a lexikai egységek generikus hierarchiája, és az ETO-jelzetek hierarchiája közötti kapcsolat (a két hierarchia ugyanis teljesen eltér egymástól).

Minden más, egymáshoz vagy az osztályokhoz nem generikusan kapcsolódó lexikai egység tárgynyelvi elem (pl. „nemzetiségi kérdés”, „identitás”, „341.121.4”); a deklarációk alapján valamelyik tárgynyelvi osztály (s rajta keresztül valamelyik metanyelvi osztály) terjedelmi eleme.

Például a „nemzetiségi kérdés” tárgynyelvi osztály fölérendeltje a „kisebbségi kérdés” tárgynyelvi osztály, ennek fölérendeltje a „politikai kérdés”, ennek a „politikai kérdés”, ennek a „társadalmi kérdés” tárgynyelvi osztály, az utóbbi fölérendelje a „deszkriptor” metanyelvi osztály, ennek fölérendeltje pedig a „lexikai egység” metanyelvi osztály (a hierarchialánc egyben tranzitív).

A funkcionális és az adattípus-tulajdonságok (pl. az, hogy megjegyzések, forrásadatok) öröklődnek, de az értékeik nem (minden alárendelt osztály rendelkezik azokkal a funkcionális és adattípus-tulajdonságokkal, melyeket fölérendeltjükhöz meghatároztak, de e tulajdonságok értékei eltérőek lehetnek).

Ha például adott osztálynak meghatározzuk azt a funkcionális tulajdonságát, hogy tartozik hozzá „megnevezés”, és ehhez azt a megszorítást, hogy a „megnevezés” nem lehet egynél több, akkor minden alárendelt osztályának kell lennie egynél nem több megnevezésének.

Az objektum-, tranzitív és szimmetrikus tulajdonságok és értékeik is öröklődnek.

Ha például a „kisebbségi kérdés” osztályhoz tranzitív tulajdonságként partitív relációban kapcsolódik a „kisebbség” osztály, akkor a „kisebbségi kérdés” összes alárendelt osztályához is ugyanígy kapcsolódik a „kisebbség”.

Az annotáció esetében megengedett, de nem öröklődő tulajdonságról van szó.

Ha például a „nemzetiségi kérdés” osztályhoz nemdeszkriptorként (szinonimaként) H (helyett) relációban kapcsolódik az „etnikai kérdés”, akkor ez a kapcsolat a „nemzetiségi kérdés” alárendeltjei esetén nem áll fenn.

A hierarchia csúcsa a „lexikai egység” (a gráfelméletben „gyökérosztály”). A lexikai egységhez hasonló módon határozható meg a többi metanyelvi osztály („deszkriptor”, „nemdeszkriptor”, „ETO-jelzet” stb.).

Az alábbi példában egy nem öröklődő tulajdonság („belső megjegyzés”) meghatározása látható:

<owl:DatatypeProperty rdf:ID="belso_megjegyzes">
   <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#AnnotationProperty"/>
   <rdfs:range rdf:resource="http://www.w3.org/2001/XMLSchema#string"/>
   <rdfs:comment>belső megjegyzés</rdfs:comment>
</owl:DatatypeProperty>

A tárgynyelvi osztályok közötti nem generikus relációkat ugyancsak tulajdonságként kell meghatározni. Az alábbi példában a partitív (rész [P]–egész [T]) kapcsolat meghatározása látható.

<owl:ObjectProperty rdf:ID="P">
   <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#TransitiveProperty"/>
   <rdfs:domain rdf:resource="#DESZKRIPTOR"/>
   <rdfs:range rdf:resource="#DESZKRIPTOR"/>
   <rdfs:comment>partitív része</rdfs:comment>
</owl:ObjectProperty>
<owl:ObjectProperty rdf:ID="T">
   <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#TransitiveProperty"/>
   <rdfs:domain rdf:resource="#DESZKRIPTOR"/>
   <rdfs:range rdf:resource="#DESZKRIPTOR"/>
   <owl:inverseOf rdf:resource="#p"/>
   <rdfs:comment>partitív egésze</rdfs:comment>
</owl:ObjectProperty>

Magának a tezaurusznak a tárgynyelvi osztályait és egyedeit is meg kell határozni a közöttük fennálló, nem generikus relációk konkrét értékeivel együtt. A példában a „kisebbségi kérdés” tárgynyelvi osztály és a „kisebbség” tárgynyelvi osztályhoz fűződő partitív (T/P) kapcsolatának meghatározása látható (a tezauruszszerkezet az 1. ábrán látható).

Megjelenítés

A tezaurusz OWL-leírása semmiféle utasítást nem tartalmaz a megjelenítésére vonatkozóan. Ráadásul számos tulajdonság az öröklődésre tekintettel csak egyetlen egyszer jelenik meg a leírásban, tehát a konvertáló programot eme öröklődés kezelésére is fel kell készíteni. Ezért az OWL-leírás alapján lényegesen nagyobb programozói munka árán készíthető csak el konvertáló program, melynek segítségével szabványos, illetve felhasználóbarát formában jelenhet meg a tezaurusz. Ez a probléma minden más, a szabványostól eltérő formátumból való kiindulás esetében is fennáll. Például az OWL-hez hasonlóan nagy programozói munka a tezaurusz megjelenítése a könyvtári besorolási adatcsere-formátumból kiindulva is, noha itt megkönnyíti a helyzetet, hogy az öröklődés figyelembevételére nincsen szükség, mert az adatcsere-formátumok minden egyes adatot explicit formában kifejezve tartalmaznak.

Az OWL-tezaurusz leírásának szintaktikai ellenőrzése

Az OWL szerinti leírás szintaktikai ellenőrzésére használt érvényesség-ellenőrző program jelentős segítség a hibák kiszűrésében. A fenti példában vázlatosan ismertetett, a Köztauruszból választott tezauruszminta gráfszerű formában a 4. ábrán látható a program [13] segítségével megjelenítve.

4. ábra Az OWL-tezauruszminta gráfja a Protégé érvényesség-ellenőrző (validáló) programmal
Az áttekinthetőség érdekében a „lexikai egység” csúcsfogalmat kiiktattuk a gráfból

Beérkezett: 2004. I. 23-án.


Jegyzetek

  1. Az osztályozási rendszerek és információkereső nyelvek megkülönböztetéséről és az információkereső nyelvek szavainak sokféleségéről részletesebben lásd Ungváry és Vajda áttekintését [24]. Az információkeresés összefüggésében lásd [23], még tágabb összefüggésben lásd [22].
  2. A Köztaurusz a földrajzi kifejezésekkel együtt közel 70 000 lexikai egységet tartalmaz [8]. A meglévő magyar tezauruszok szókincsét is felhasználva 1999-ben fejeződött be az 1.0 változatának szerkesztése [19, 20, 21].
  3. A tezaurusz szabványos megjelenítésére vonatkozóan lásd [5], [6] és [12].
  4. E relációk esetén is van azonban szabályszerűség. Például az eszköz–rendeltetés reláció csak anyag/ tárgy és tevékenység között állhat fenn. A relációk kategoriális függőségére vonatkozóan lásd [18, p. 174., 178. és 185.].
  5. E kihasználhatóság a ma kereskedelmi forgalomban található jelentősebb könyvtári rendszerekben (szoftverekben) meglehetősen gyatra (még ha találni is példát keresés céljából az ún. automatikus hierarchiaszint emelésre, illetve csökkentésre („upposting” stb.), mivel a kezelőrendszereket nem készítették még föl a tezauruszok felhasználóbarát kezelésére [20]. Idővel ez a helyzet – talán éppen az ontológiák megjelenésének hatására – változni fog.
  6. „Tudásbázis”, „tudástechnológia”, „tudásalapú rendszer” helyett helyesebb az „ismeretbázis”, „ismerettechnológia”, „ismeretalapú rendszer” kifejezés, mivel az ismeret inkább jelenti a közvetíthető, adatok formájában reprezentált tudást, a tudás pedig az ismeret tudati „mélyszerkezetét”. A tudás felfogható értelmezett ismeretnek, az ismeret pedig kommunikálható tudásnak.
  7. Történeti áttekintését lásd Staab és Steffer kézikönyvében [3].
  8. John Frederick Sowa 2000-ben megjelent, az ismeretreprezentációról szóló könyvében az ontológiát így határozza meg: „Ontológia valamilyen tárgykörben létező vagy feltételezett dolgok kategóriáinak elmélete. Egy ilyen elmélet konkrét eredményét (is) ontológiának nevezik. Egy (konkrét) ontológia a tárgyak ama típusainak katalógusa, melyekről felteszik, hogy az adott T érdeklődési körben olyasvalakinek a nézőpontjából léteznek, aki L nyelvet használ a T tárgykörre vonatkozó gondolatainak megfogalmazására. Az ontológia típusait annak az L nyelvnek a predikátumai, szavainak jelentései vagy fogalmak és relációtípusok képviselik, melyet az adott T körben a kérdések megvitatására használnak. ... A logika és az ontológia összekapcsolása révén nyelv keletkezik, mellyel adott érdeklődési terület dolgai, összefüggései megfogalmazhatók.
    A formális ontológiát fogalmak és relációtípusok összessége alkotja, melyeket a típus–altípus kapcsolódások szerint részlegesen rendeznek. A formális ontológiák tovább finomíthatók azáltal, hogy milyen módon különböztetik meg az alárendelt típusokat a fölérendeltjeiktől: az axiomatikus ontológiákban a megkülönböztetést formalizált nyelven megfogalmazott axiómák és meghatározások segítségével végzik el, mint amilyen a logikai nyelv vagy valamilyen logikai nyelvre lefordítható számítógép alapú jelzet; a prototípus alapú ontológiákban a megkülönböztetés alapjai az altípust reprezentáló prototípus tipikus ismertetőjegyei. A nagyobb ontológiákat többnyire kevert módszerek jellemzik: formális meghatározásokat, axiómákat használnak a matematika, fizika és műszaki tudományok kifejezéseihez; prototípusokat használnak a növények, állatok és az elemi, közkeletű dolgok terén.” http://www.jfsowa.com/ontology/ és [16, p. 20. és 51.]”.
    1993-ban Tom Gruber még egyszerűbben fogalmazott: „Ontológia megegyezésen alapuló fogalmi rendszer formális, egyértelmű leírása” („An ontology is a formal, explicit specification of a shared conceptualization”) [2]. A „megegyezésen alapuló” kitétel fontos: azt a felfogást tükrözi, hogy az ontológiák – akárcsak az osztályozási rendszerek – nem feltétlenül a valóságban fizikai referenciákkal rendelkező struktúrák, hanem afféle szemantikai szabályrendszerek, melyek a dolgok rendezésére használhatók.
  9. Az ontológiákról részletesen lásd [2, 3] és [16]. Az utóbbi egyben példákat is tartalmazó egyetemi szintű tankönyv.
  10. A web körülményei között a dokumentumokat forrásnak nevezik. A weblap például könyvtári szempontból webdokumentum, a weblap része pedig részdokumentum; más nézőpontból viszont mindkettő webforrás (ahogy a részdokumentum és az azt tartalmazó [gazda]dokumentum is egyaránt dokumentum).
  11. Részletesebben lásd Kampis György tanulmányát [7].
  12. Szubsztancia a létező dolgok legáltalánosabb és legbensőbb lényege, esetünkben érthetjük rajta a dolgokról alkotott fogalmakat. Filozófiai és informatikai értelemben referencián jelnek vagy jelsorozatnak (szükségképpen szavaknak is) a jelrendszeren (szükségképpen a nyelven) kívüli valóságra való vonatkoztatást értik: azt, hogy például adott szónak mi felel meg a fizikai valóságban.
  13. Az AltaVizsla tezaurusz nagyon szép vizualiziációja látható a budapesti Frutta honlapjáról kiindulva [17]. Az egyszerűnek látszó, de meglehetősen talányos honlapon először a „Belépés az oldalra”, majd a „Referenciák” parancsra kell kattintani. A kellő kézügyességű érdeklődő a bal oldali gördítő nyilat működtetve a szalagszerűen futó referenciák között el tudja kapni a „Tezaurusz vizualizáció II” feliratot, és a letöltést megvárva célhoz ér. Másfajta küszködés a New York-i Plumb Design tezauruszának vizuális megjelenítése [26]. Itt meg kell várni, míg a nyitó oldal letöltődik, a folyamatot azonban a böngésző nem jelzi, a kereső csak többszöri kilépési kudarc után jön rá arra, hogy türelmesen várnia kell, amíg a bal felső sarokban a „<look it up” felirattal ellátott keresőmező megjelenik, ahová az angol keresőszót beírhatja. A szenvedésnek azonban jutalma a láncreakciószerűen feltárulkozó fogalmi struktúrák csillagködöket és galaxisokat idéző szemantikai szépsége.
  14. A World Wide Web Consortiumot (rövidített nevén W3C) 1994 októberében alapították azzal a céllal, hogy elősegítsék az olyan közös számítógépes protokollok kidolgozását, amelyek előremozdítják a Web fejlődését. Ma már a W3C-nek több mint 450 tagja, és közel 70 teljes munkaidős munkatársa van szerte a világon (és magyar irodája is).
  15. Az RDF kidolgozása a W3C égisze alatt 1997-ben kezdődött el. A munka során többek között figyelembe vették a dublini metaadatszabványt, és az OCLC weben elérhető WorldCat katalógusához való könyvtári csatlakozás „Connexion” nevű szolgáltatását is.
  16. Ha a hierarchialáncok legfelső szintjeiről van szó, az angol nyelvű szakirodalomban a „top level hierarchy” kifejezést használják [16, p. 67.]. Magyarul „csúcshierarchia” a megfelelő kifejezés.
  17. Lásd [16, p. 14.]
  18. E sanyarúságról részletesen lásd [20].
  19. Tezauruszok esetén „csúcstezaurusz”, „makrotezaurusz” elnevezéseket használnak.
  20. Lásd a rendszerről és annak vitájáról szóló publikációkat [9, 10, 11]. Az analitikus filozófia képviselőinek egy része az „Electronic Journal of Analitical Philosophy” 1997. évi 5. számában – melyet az ontológia filozófiai kérdéseinek szenteltek – igyekezett megsemmisítő bírálatban részesíteni a rendszert [1]. A Cyc-ontológia mögött ugyanis arisztotelészi alapokat orrontottak, azaz olyan rendszert, mely mögött készítőik szerint tényleges – szubsztanciális – dolgok vannak, holott az analitikus felfogás szerint – leegyszerűsítve – csak összefüggések létezhetnek. Ez nem akadályozta meg, hogy a Cyc-ontológiára eredményes kereskedelmi vállalkozás épüljön [13].
  21. Ranganathan osztályozáselméletét és ontológiai szemléletét részletesen tartalmazza az osztályozás és információkeresés kommentált szöveggyűjteménye [22, p. 76–125.].
  22. Teljes áttekintése megtalálható a W3C honlapjáról kiindulva a weben [14].
  23. A HUNMARC besorolási adatok adatcsere-formátumát az OSZK adta közre, és teljesen kompatibilis a USMARC vonatkozó részével [4]. Az ETO-jelzetekre vonatkozóan még nem készült magyar nemzeti adatcsere-formátum, alapul a USMARC format for classification vehető [25]. E formátum és az OWL közötti – itt nem tárgyalt – megfelelésre vonatkozóan csak annyit jegyzünk meg, hogy arra értelemszerűen ugyanaz érvényes, mint ami a HUNMARC és OWL megfeleltetésére, csak más (például a 153-as) adatmezők vonatkozásában.
  24. Ennek köszönhetően felgyorsulhat a könyvtári rendszerek felhasználóbarát tezauruszkezelő képességeinek kialakulása is [20].
  25. A validáló program a Stanford Egyetemen készült, és szabadszoftverként letölthető [15].

Irodalom

  1. COPELAND, B. J.: CYC: a case study in ontological engineering. = Electronic Journal of Analytical Philosophy, 5. köt. 1997. p. 42–61.
    http://ejap. louisiana.edu/EJAP/1997.spring/contents.html
  2. GRUBER, Tom: A translation approach to portable ontology specifications. = Knowledge Acquisition, 5. köt. 2. sz. 1993. p. 199–220.
  3. Handbook on ontologies. Ed. by Staab, Steffen; Studer, Rudi. Hamburg, Springer, 2003. 243 p. (International handbooks on information systems). ISBN 354 040 834 7
  4. HUNMARC, a bibliográfiai rekordok adatcsere formátuma. Összeáll. Sipos Márta; kész. az Országos Széchényi Könyvtár Fejlesztési Osztályán. Budapest: OSZK, 1993. 129 p. ISBN 963 200 344 6
    HUNMARC, a besorolási rekordok adatcsere formátuma. Összeáll. Sipos Márta. 1998. március. 61 p. Tervezet
  5. ISO/DP 5954–1985 Guidelines for the establishment and development of multilingual scientific and technical thesauri for information retrieval.
  6. ISO/IS 2788–1986 Guidelines for the establishment and development of monolingual scientific and technical thesauri for information retrieval.
  7. KAMPIS György: A filozófia felfedezése a gépek világában. = Megismeréstudomány és mesterséges intelligencia (szerk.: Pléh Csaba), Budapest, Akadémiai Kiadó, 1998. p. 230–256.
    http://hps.elte.hu/ ~kampis/Mirror/makog98.html
  8. Köztaurusz. 2003. január 1. http://www.oszk.hu – Útmutató/Tezaurusz és
    http://mek.oszk.hu/adatbazis/thes.htm
  9. LENAT, D. B.: Cyc: a large-scale investment in knowledge infrastructure. = Communication of the ACM, 38. köt. 11. sz. 1995. p. 33–38.
  10. LENAT, Douglas B.–GUHA, Ramathan V.: Building large knowledge-based systems. Representation and inference int he Cyc project. Reading, Addison–Wesley, 1990. 254 p.
  11. LENAT, Douglas B.–MILLER, George A.–YOKOI, Toshio: Cyc, WordNet and EDR. Critiques and responses. = Communications of the ACM, 38. köt. 11. sz. 1995. p. 45–48.
  12. MSZ 3418–87 Magyar nyelvű információkereső tezauruszok. Szerkezete, részei és formái.
  13. OpenCyc. Formalized common knowledge.
    http://www.opencyc.org
  14. OWL Web Ontology Language Overview. W3C Candidate Recommendation 18. Aug. 2003. Ed. by Deborah L. McGuinness and Frank van Harmelen. OWL Web Ontology Language Overview
  15. Protégé. Version 20. Stanford University, 1998–2000.
    http://protege.stanford.edu
  16. SOWA, John F.: Knowledge representations. Logical, philosophical, and computational. Pacific Grove, Brooks/Cole, 2000. 594 p.
  17. Tezaurusz vizualizáció II. Budapest, Frutta Electronica, 2003. Version 3.0.
    http://www.frutta.hu
  18. UNGVÁRY Rudolf: Tezaurusz-technológia. Az információkereső tezauruszok készítésének folyamata. Közr. az Országos Széchényi Könyvtár Könyvtártudományi és Módszertani Központ. Budapest, NPI, 1979. 277 p.
  19. UNGVÁRY Rudolf: Az OSZK tezaurusza és a KÖZTAURUSZ. = Könyvtári Figyelő, Új folyam 11. (47.) köt. 1. sz. 2001. p. 11–40.
    http://www.oszk.hu/kiadvany/kf/2001/1/ungvary.html
  20. UNGVÁRY Rudolf: Tezaurusz a felhasználói felületen. = Tudományos és Műszaki Tájékoztatás, 48. köt. 3. sz. 2001. p. 99–108.
    http://tmt.omikk.bme.hu/archiv.html
  21. UNGVÁRY Rudolf: A magyarországi tezauruszok. Budapest, 2002.
    http://www.nexus.hu/ungvary
  22. UNGVÁRY Rudolf–ORBÁN Éva: Osztályozás és információkeresés. Kommentált szöveggyűjtemény. 1. kötet. Az osztályozás és elmélete. Budapest, Országos Széchényi Könyvtár, 200l. 543 p. ISBN 963 200 425 6
  23. UNGVÁRY Rudolf–VAJDA E.: Könyvtári információkeresés. 2. jav. kiad. Budapest, Typotex, 2002. 170 p.
  24. UNGVÁRY Rudolf–VAJDA Erik: Az információkeresés szavai. = Tudományos és Műszaki Tájékoztatás, 50. köt. 12. sz. 2003. p. 1–27.
    http://tmt.omikk.bme.hu/archiv.html
  25. USMARC format for classification data, including guidelines for content designation. 1991 Edition. Prep. by the Network Development and MARC Standards Office; Cataloging Distribution Service, Library of Congress, Washington, Update No. 1. July 1995.
    http://www.tlcdelivers.com/tlc/crs/clas0001.htm
  26. Visual Thesaurus. A dictionary of the english language. New York, Plumb Design, 1998–2004.
    http://visualthesaurus.com/
  27. XTM Topic-Map Standard, ISO/IEC 13250:2000. XTM TopicMaps Org.
    http://www.topicmaps.org/xtm

Nyomtatható verzió