46. évfolyam (1999) 4. szám

Eredeti cim:BERNHARD, U.–MISTRIK, I.: Rechnergestützte Übersetzung. Einführung und Technik.

Gépi fordítás

Az utóbbi két-három évben a számítógépes fordítás szoftverjei hallatlan fejlődésen mentek át mind a számítógépes nyelvészeti algoritmusok, mind pedig az árak csökkenése és a teljesítmények növekedése tekintetében. Új termékek tömege jelent meg a piacon; ez a közlemény néhány szemponttal kívánja segíteni köztük a választást.

1. A számítógépes fordítás néhány alapfogalma

A számítógépes fordítás (computer-aided translation = CAT) a számítástechnika alkalmazását jelenti az egyik természetes nyelvről a másikra történő fordítás automatizálására vagy támogatására. Végfelhasználók és hivatásos fordítók egyaránt hasznát veszik ennek a technikának, amely háromfajta eszközt kínál.

1.1 Terminológiát kezelő rendszerek

Minden fordításnál kiemelt fontosságú a szakmára jellemző terminus technicusok helyes lefordítása. Ezt a fáradságos feladatot a szoftverek több funkcióval is segítik:

  • a terminológia tárolása,
  • a szakkifejezések gyors előhívása,
  • a szakkifejezések automatikus beillesztése,
  • terminológiai kivonatok készítése.

Néhány, ebbe a csoportba tartozó fontosabb termék:

  • MTX, Termex,
  • Trados MultiTerm,
  • TermStar.

1.2 Gépi fordítás

A gépi fordítás (GF) eszközei fejlett számítógépes lingvisztikai elemzésen alapulnak. Történetük több mint 30 évre nyúlik vissza; az USA-ban a hidegháborús és a titkosszolgálati, Japánban a piaci és ipari információs igények adtak ösztönzést a fejlesztésnek. Néhány éve még kizárólag nagy és drága számítógépek végezték ezt a munkát, ma már azonban felveszik velük a versenyt minőségben és korrektségben a PC-kre és a unixos hálózatra alapozott rendszerek.

A gépi fordítás eszközeinek eredményessége több tényezőtől függ: gépelési és nyelvtani hibák, zsargonszavak, a szótárban nem rögzített szakkifejezések, bonyolult szerkezetű mondatok nagymértékben befolyásolják a fordítás minőségét.

A gépi fordítás rendszerei általában csak korlátozott számú nyelvpárra terjednek ki. Néhány fontosabb termék:

  • Globalink GTS Power Translator,
  • Intergraph Transcend,
  • Langenscheidts T1,
  • LOGOS,
  • SYSTRAN PROfessional for Windows.

1.3 Géppel segített emberi fordítás

Az ember fordítói munkáját segítő (machine-aided human translation = MAHT) eszközök a fordítási memória (Translation Memory = TM) koncepcióján, és a már lefordított szakkifejezések és mondatok ismételt használatán alapulnak. A legtöbb szoftver eredetileg egy-egy fordító saját fejlesztése volt. Az utóbbi években igen népszerűvé váltak a hivatásos fordítók között. A fordító párbeszédes formában használja a MAHT-szoftvert, hogy segítségével a lefordított mondatoknak végleges formát adjon.

A TM jelenti az alaptechnikát a MAHT számára. A TM tárolja a már lefordított mondatokat, s lehetővé teszi a mondatok vagy részmondatok ismételt felhasználását.

A MAHT-rendszerek több mellékfunkciót (pl. szószámlálás, formátumok) is tartalmaznak, s kizárólag a hivatásos fordítók számára hasznosak. Jelentősen hozzájárulhatnak a fordítások minőségéhez és mennyiségéhez. A TM-eszközök különösen hasznosak az ismétlődő kifejezéseket, standardizált mondatokat tartalmazó szövegek esetében (pl. terjedelmes műszaki kézikönyvek, már lefordított szövegek új verziói).

A legtöbb TM-termék lehetővé teszi tetszőleges nyelvpárok alkalmazását. Néhány fontosabb termék:

  • Trados Translator's Workbench,
  • IBM Translation Manager,
  • Transit von STAR.

Az utóbbi évben a gépi fordítási és TM-programok előállítói kombinálták termékeiket a még jobb megoldások érdekében.

2. A megfelelő CAT-eszköz kiválasztása

A kiválasztáskor mindenekelőtt azt kell eldönteni, hogy a fordítás belső vagy külső célokat szolgál.

2.1 A használó típusa

Végfelhasználó – Ebben az összefüggésben végfelhasználónak az tekintendő, aki nemzetközi tevékenységet folytat, egy vagy több nyelven megérteti magát, de maga nem hivatásos fordító. A végfelhasználók fordítási igénye belső és külső célra egyaránt kiterjed.

Hivatásos fordító – Ebbe a csoportba tartoznak, akik foglalkozásszerűen végeznek fordítási munkát. A CAT-eszközökre azért van szükségük, hogy fordításaikat érthetőbbé és könnyebben olvashatóvá tegyék, növeljék produktivitásukat és teljesítményük minőségét. A fordításokat külső célokra készítik.

Egynyelvű felhasználó – Az egy nyelvet beszélő felhasználó jó eredményt érhet el egy GF-eszköz segítségével számára idegen nyelvű dokumentumok alapvető mondanivalójának megértésében. Problematikus azonban az eszköz alkalmazása, ha anyanyelvéről egy másik nyelvre kívánna fordítást készíteni.

2.2 A dokumentumok jellemzői

Hosszú és rövid dokumentumok – Hosszú dokumentumnak számítanak a legalább 30–50 lapos anyagok, de jobb eredményeket lehet elérni, ha terjedelmük 100–300 lap. Ez különösen a TM-termékek esetében érvényes, ugyanis ők a lefordított mondatokat „tanulják meg”.

Műszaki dokumentumok – Ezek az anyagok (kézikönyvek, katalógusok, kutatási jelentések stb.) viszonylag egyszerű és semleges stílusban készülnek, s kevés képes kifejezést tartalmaznak. Ezért a GF-programok számára megkönnyítik a nyelvi elemzést, a TM-programok dolgát pedig az ismétlődő, konzekvensen alkalmazott szakkifejezések és fogalmak könnyítik meg.

Átdolgozott dokumentumok – Korábban már lefordított és közzétett anyagok, amelyek különösen TM-programok alkalmazására kínálkoznak, hiszen csak a ténylegesen megváltoztatott szavak felismerésére és módosítására van szükség.

Komplex nyelvezetű dokumentumok – Az élénk, sok metaforát tartalmazó, költői stílusban írt anyagok kevésbé kínálkoznak a CAT-eszközök alkalmazására. Mivel a gépi fordítás többnyire szó szerint történik, sokszor komikus eredményhez jutunk. A bonyolult mondatszerkezet ugyan nem jelent problémát a TM-programok számára, de az ilyen dokumentumokban kevés az ismétlődés. (Kivételt képezhet egy terjedelmes dokumentum átdolgozása, amely esetben egy TM-eszköz hasznosnak bizonyulhat.)

Szakmai jellemzők – A szakterület is közvetlenül befolyásolja egy eszköz hasznosságát. Ha a dokumentum az általánosság szintjén mozog, nagyon valószínű, hogy szinte minden szava szerepel az alapszótárban. Ha azonban egy szűk szakterületről van szó, terjedelmes szakterminológiával, akkor bizony a szótárat erre fel kell készíteni.

2.3 Minőség és korrektség

A végfelhasználó, aki egy dokumentum alapvető mondanivalójával akar megismerkedni, megelégszik a korrektség minimumával. Ez a követelmény messze nem elegendő egy kézikönyv vagy egy műleírás esetében.

A GF-rendszerek korrektségét két tényező határozza meg: a szójegyzék teljessége és a program lingvisztikai kompetenciája (képessége egy nyelv szintaxisának és nyelvtanának elemzésére).

2.4 A gépi fordítás gyakorlati alkalmazása

A gépi fordítás több lépésben zajlik le, a háttérben vagy interaktív módon. A részfolyamatok a következők:

  • előkészítés;
  • keresés a szótárban, az ismeretlen szavak azonosítása;
  • szótárfejlesztés (módosítás, bővítés);
  • fordítás;
  • utómunkálatok (a célnyelvű szöveg megszerkesztése).

* * *

A cikk függelékként közli az alábbi eszközök főbb paramétereit:

  • SYSTRAN PROfessional,
  • Transcend Natural Language Translator,
  • Globalink Web Translator,
  • LOGOS,
  • Langenscheidts T1.

/nfd Information – Wissenschaft und Praxis, 49. köt. 1. sz. 1998. p. 5–10./

(Papp István)

Nyomtatható verzió