Vertimo studijos eISSN 2029-7033

2019, vol. 12, pp. 177–187 DOI: https://doi.org/10.15388/VertStud.2019.12

Feisbuką versti paprasta, bet klaidų išvengti neįmanoma

Gintautas Grigas
Vilniaus universitetas
Matematikos ir informatikos fakultetas
Duomenų mokslo ir skaitmeninių technologijų institutas
Gintautas.Grigas@mif.vu.lt

2005 m. sausio 11 d. Markas Cukerbergas nuėjo
į internetinių adresų registravimo tarnybą
Register.com
ir sumokėjęs trisdešimt penkis dolerius
metams užregistravo pavadinimą
Thefacebook.com.
David Kirkpatrick. The Facebook effect, 2010.

Copyright © 2019 Gintautas Grigas. Published by Vilnius University Press
This is an Open Access article distributed under the terms of the Creative Commons Attribution Licence, which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited.

Feisbukas – populiariausias socialinis tinklas. Šiuo metu juo naudojasi apie 2,4 milijardo žmonių. Pradžioje jo sąsaja buvo pateikiama tik anglų kalba, o 2008 m. pradėta versti į kitas kalbas. Dabar (2019 m. spalio mėn.) feisbukas verčiamas į 163 kalbas. Į portalą „Facebook“1 integruota originali vertimo programa. Ji pati teksto neverčia, tiktai teikia įvairiapusę pagalbą vertėjui. Ši programa turi potencialių galimybių, išskiriančių ją iš kitų vertimo programų: konteksto pateikimas, daiktavardžių linksniavimas, būdvardžių ir dalyvių giminės kaita. Tačiau ne visos šios galimybės racionaliai panaudojamos, tad naršydami po feisbuką matome nemažai kalbos klaidų. Taigi situacija prieštaringa: gera vertimo įranga ir prastas jos naudojimo rezultatas. Straipsnyje aptariamos išskirtinės vertimo programos savybės, dažniau pasitaikančios klaidos ir galimos jų išvengimo priemonės.

1. Vertimo procesas

1.1. Dialogas su vertimo programa

Vertimo programa pateikia verstinų eilučių sąrašą. Kiekvienai eilutei skiriamas atskiras langelis (1 pav.). Jo viršuje stambesniu šriftu būna užrašyta verčiama eilutė, o po ja smulkesniu šriftu – komentaras, suteikiantis papildomos informacijos apie verstiną eilutę. Vertėjui reikia įrašyti vertimą ir paspausti mygtuką „Išversti“. Tada vertimas tampa matomas visiems ir bet kas gali tą vertimą vertinti ir (arba) siūlyti naujus vertimus.

79478.png 

1 pav. Verstinų eilučių sąrašo fragmento pavyzdys su dviem
verstinomis eilutėmis

Paveiksle parodytame apatiniame langelyje matome du skirtingus kitos eilutės vertimus. Galima balsuoti už vieną pasirinktą vertimą paspaudžiant šalia jo esančią varnelę. Kiekvieną vertimo variantą galima kritikuoti. Paspaudus vėliavėlę atveriamas galimų klaidų tipų sąrašas, iš kurio galima pasirinkti reikiamą. Galima pateikti ir naują vertimą.

Verčiama sutelktiniu metodu. Versti gali kiekvienas feisbuko narys be papildomos registracijos, tad vertimuose būna daug klaidų. Vis dėlto vertimai į feisbuko langus patenka ne iš karto, o tik po tam tikro patvirtinimo: kai surenka tam tikrą skaičių balsų ir juos teigiamai įvertina portalo tarnyba.

1.2. Kontekstinis vertimas

Viena didžiausių programinės įrangos vertėjų problemų yra tai, kad jie gauna verčiamų teksto eilučių (vertimo segmentų) sąrašą, bet nemato tų eilučių konteksto, t. y. kur jos pasirodys kompiuterio ekrane, kokios kitos eilutės bus greta ir koks yra jų ryšys su verčiama eilute.

Kai verčiamos eilutės pateiktos sąrašu, matomas ne pats kontekstas, o tik jį paaiškinantis komentaras. Panašūs komentarai naudojami ir kitose vertimo programose. Tai tik dalinis problemos sprendimas.

Feisbuko vertimo programoje yra galimybė versti eilutes tiesiogiai, feisbuko lange, ten, kur verstina eilutė pasirodo, t. y. kur matomas visas eilutę gaubiantis kontekstas. Pasirinkus atitinkamą nuostatą, tokios eilutės būna pabrauktos raudonai. Nuvedus žymeklį ant tokios eilutės, prie žymeklio „prilimpa“ klaustukas. Spustelėjus dešiniuoju pelės klavišu pasirodo tos eilutės vertimo langelis – toks, koks būna verstinų eilučių sąraše (žr. 1 pav.). Čia su eilute galima atlikti visus aukščiau aprašytus veiksmus. Tai originalus ir radikalus konteksto problemos sprendimo būdas.

1.3. Pasinaudojimas vertimais į kitas kalbas

Gera vertimo praktika laikytinas patikrinimas, kaip eilutė verčiama į kitas kalbas. Vertimo programoje yra nuostata, kurioje vertėjas gali pasirinkti vieną pagalbinę kalbą, kuria bus rodomas tos eilutės vertimas (2 pav.), jeigu ji išversta.

79495.png 

2 pav. Eilutė su vertimu į pagalbinę kalbą (rusų)

Į galimų pagalbinių kalbų sąrašą šiuo metu įtraukta 31 kalba – tos, į kurias daugiausia išversta.

1.4. Žodynai

Vertimo programoje yra įvairių kalbų dvikalbių žodynų, tarp jų ir anglų–lietuvių, nors dar labai mažas – 2019 m. rugsėjo mėnesį jame buvo tik 114 žodžių. Iš jų 50 žodžių (pvz., hyperlapse, Live, Marketplace, Gameroom) ir 12 santrumpų (pvz., DMA, eCPA, TRP) lietuviškoje dalyje pateikti neišversti. Taigi, išverstų tėra 52. Analogiški lenkų, rusų ir vokiečių žodynai yra maždaug 15 kartų didesni.

Dauguma neišverstų žodžių yra veiksmus atliekančių komponentų (programėlių, tvarkyklių, įrankių) pavadinimai. Kai kurie jų, norint išskirti iš kitų tos pačios rūšies komponentų, laikomi tikriniais daiktavardžiais. Programuotojams jie svarbūs ir dėl to pateko į sąsajos tekstus. Tinklo nariams reikšmingi tų komponentų atliekami veiksmai, o ne patys komponentai. Todėl vertime lietuviškas atitikmuo galėtų būti bendrinis daiktavardis arba ir kitos kalbos dalies žodis. Pavyzdžiui, žodis Live žodyne apibrėžtas kaip pavadinimas priemonės, užtikrinančios tiesioginę transliaciją. Trumpiau ir aiškiau būtų pasakyti Tiesiogiai.

Žodynai kuriami tam, kad palengvintų vertėjų darbą. Todėl jie paprastai parengiami dar prieš pradedant versti kitus tekstus. Feisbuko žodynus kuria (tiksliau, vertimo programos pateiktus angliškus žodžius į savas kalbas verčia) savanoriai sutelktiniu būdu. Tačiau pasigendama jų darbo koordinavimo.

2. Parametrai ir tarptautinimo klaidos

Nemaža dalis eilučių yra parametrizuotos. Parametrai – tai skaičiai, vietovardžiai, tinklo dalyvių vardai, pavardės, lytis, įvairių objektų pavadinimai. Nuo parametrų priklauso jų pačių ir gretimų žodžių gramatinės formos. Čia atsiranda vietos vertimo klaidoms. Yra ir tokių klaidų, kurių vertėjas negali išvengti. Tai tarptautinimo (internacionalizavimo) klaidos. Šias klaidas galima identifikuoti analizuojant pateiktas versti eilutes, nors jos dar neišverstos.

Tuo metu, kai buvo rašomas šis straipsnis, verčiamų į lietuvių kalbą eilučių sąrašą sudarė 1040 eilučių. Paėmę 1000 pirmųjų (kad būtų paprasčiau skaičiuoti procentus) suskaičiavome, kiek yra eilučių, kurių negalima išversti tinkamai.

2.1. Daugiskaitos formos

Linksniuojamų žodžių derinimo prie skaičių daugiskaitos formos pateikiamos vaizdžiai (3 pav.), kad galėtų lengvai suprasti ir tie, kurie prieš tai apie jas nieko nežinojo. Tai svarbu esant sutelktiniam vertimui, kai gali versti kiekvienas feisbuko narys.

79516.png 

3 pav. Daugiskaitos formų pavyzdys

Lietuvių kalba turi 3 formas. Kitose kalbose jų yra nuo 1 iki 6. Be to, vienai ar kitai formai priskiriamos skirtingos skaičių grupės.

Nesant galimybės automatiškai parinkti tinkamą, tekdavo visur išvardyti visų trijų formų galūnes, pavyzdžiui, asmuo (-enys, -enų).

Galimybė derinti lietuviškų žodžių formas feisbuke atsirado 2015 m., tačiau dar ir dabar jo languose galima pastebėti nesuderintų formų. Ne visos versti teikiamos eilutės pateikiamos formų šablone.

Buvo įdomu palyginti formų pateikimą kitose kalbose. Pasirinkę pagalbinę rusų kalbą, analizuojamame eilučių tūkstantuke radome 17 (t. y. 1,7 proc.) eilučių, kurias verčiant į rusų kalbą yra galimybė derinti daugiskaitos formas, o verčiant į lietuvių – ne.

Verčiamų eilučių tūkstantuke yra 40 × 3 = 120 šios rūšies eilučių. Jame yra 242 vertimai, t. y. vidutiniškai po du vertimus vienai eilutei. Iš jų 205 eilučių (apie 85 proc.) parinkti tinkami linksniai, o 37 (t. y. apie 15 proc.) – netinkami. Pasiskirstymas tarp trijų daugiskaitos formų parodytas 1 lentelėje.

1 lentelė. Daugiskaitos formų vertimai

Daugiskaitos
forma

Tinkamas vertimas

Netinkamas vertimas

Iš viso
(skaičiai)

Skaičiai

Procentai

Skaičiai

Procentai

1, 21, 31...

67

87,2

25

12,8

92

2–9, 22–29...

71

93,4

5

6,6

76

10–20, 30, 40...

67

90,6

7

9,4

74

Iš viso

205

 

37

 

242

Daugiausia klaidų daroma su pirmąja (vienetų) forma. Matyt, dalis vertėjų daugiskaitos formų esmę supranta tik pamatę antrąją formą, o taisyti jau išverstą pirmąją pritingi arba nežino kaip.

2.2. Giminė

Būdvardžiai ir dalyviai turi giminę, kuri sakinyje derinama su daiktavardžio, dažniausiai asmenvardžio, gimine, pavyzdžiui, Jonas prisijungęs, Jonienė prisijungusi. Kai daiktavardis yra parametras, t. y. jis dar nežinomas, vertime reikia pateikti visas tris giminės formas (vyriškąją, moteriškąją ir nežinomą), kad programa galėtų iš jų parinkti tinkamą (4 pav.).

79556.png 

4 pav. Giminė

2.3. Linksniai

Socialiniuose tinkluose gausu tekstų, kuriuose vartojami įvairūs asmenvardžių, vietovardžių ir kitų žodžių linksniai. Pavyzdžiui, reikia pasakyti, kad Jonas gyvena Vilniuje, o ne Jonas gyvena Vilnius, Jonas persiunčia Petro pranešimą Jūratei, o ne Jonas persiunčia Petras pranešimą Jūratė.

Vertimo programa turi linksniavimo mechanizmą. Tinkamus linksnius nurodo vertėjas. Kol kas linksniavimo mechanizmas su lietuvių kalba dar neveikia. Parodysime tik kaip informacija apie linksnius užrašoma kitomis kalbomis (5 pav.).

 

79572.png 

5 pav. Du linksniavimo pavyzdžiai vertime į rusų kalbą
(informacija apie linksnius pabraukta)

Ilgų tekstų apie linksnius vertėjui rinkti nereikia. Prie linksniuojamo žodžio atsiranda visų linksnių sąrašas ir iš jo tereikia parinkti tinkamą linksnį.

Linksniavimas yra išskirtinė feisbuko vertimo savybė, kurios dar nėra kituose socialiniuose tinkluose ir pokalbių programose.

Linksniuotini žodžiai (asmenvardžiai, vietovių, renginių ir kitų objektų pavadinimai) į feisbuką atkeliauja vardininko linksniu. Jei reikia kito linksnio, tada jie linksniuojami. Patikrinus versti teikiamų eilučių tūkstantuką buvo rasta 114 eilučių, kuriose reikalingas vardininkas arba galima lengvai pakeisti vardininku (pvz., anglišką in {group} versti grupėje „{group}“), ir 119 eilučių, kuriose reikalingas kitas linksnis. Vadinasi, 119 eilučių (arba 11,9 proc.) tinkamai išversti į lietuvių kalbą nebus galima.

Kai kuriose eilutėse yra du ar daugiau linksniuotinų žodžių. Vardininko linksnio reikėjo 162 žodžiams, kitų linksnių – 167 žodžiams.

2.4. Angliškas kilmininkas

Tai atskiras anglų kalbai būdingas linksniavimo atvejis, kai kilmininkas gaunamas prie vardininko pridėjus galūnę ‚s. Eilučių su anglišku kilmininku buvo rasta 24. Dvi iš jų vertėjams pavyko išversti pakeičiant sakinių struktūrą:

{friend_name}‘s Birthday {friend_name} švenčia gimtadienį,
{user first name}‘s Birthday
{user first name} švenčia gimtadienį.

Likusių 22 (arba 2,2 proc.) tinkamai išversti nebus galima.

2.5. Atskirai verčiami eilučių fragmentai

Į eilutes gali būti įterpiami fragmentai – atskirai išversti žodžiai arba frazės. Jų vieta eilutėje žymima panašiai kaip parametrų, tik su lygybės ženklu, pavyzdžiui {=post}. Tada greta pateikiama ir kita eilutė tam fragmentui versti (6 pav.). Joje (2 iš 2) vertėjas nurodo tinkamą linksnį arba kitokią gramatinę formą, derančią su pirmąja eilute (1 iš 2). Suskaičiavome 28 tokių eilučių poras. Tačiau radome ir 26 pavienes eilutes, analogiškas pirmosioms porų eilutėms. Vadinasi, parametro vertimas yra kažkur kitur ir jame gali būti pavienei eilutei netinkamas linksnis. Taip atsiranda potenciali dar vienos rūšies klaidų galimybė.

79585.png 

6 pav. Fragmentas {=post} ir jo vertimas

Ne viskas sklandu ir su porinėmis eilutėmis. Skirtingų vertėjų pateiktuose vertimuose gali būti naudojami skirtingi parametro linksniai. Pavyzdžiui, ...įkėlė naują {=photo} į albumą ir ...albumą papildė nauja {photo}. Natūralu, kad tie vertėjai antrosiose porų eilutėse pateiks du skirtingus parametro {=photo} vertimus: nuotrauką ir nuotrauka (įnagininkas). Nėra garantijos, kad po balsavimo galutiniame variante bus suformuota taisyklinga pora.

2.6. Verčiamų eilučių analizės rezultatai

Eilučių negalima taisyklingai išversti dėl šių priežasčių:

1) linksnio derinimas prie skaičiaus – 1,7 proc.;

2) linksniavimas – 11,9 proc.;

3) angliškas kilmininkas – 2,2 proc.

Šios priežastys sudaro nemažą dalį – 15,8 proc. Tai tarptautinimo klaidos, kurias gali pašalinti feisbuko vertimo programos autoriai. Lengviausia sutvarkyti linksnio derinimą prie skaičiaus. Vertimo programoje toks mechanizmas yra, tereikia jį panaudoti pateikiant verstinas eilutes.

Vertimo programoje yra ir linksniavimo mechanizmas, bet jam reikia kiekvienos kalbos linksniavimo komponento. Daugeliui kalbų (pvz., čekų, lenkų, rumunų, rusų) toks komponentas yra pritaikytas ir sėkmingai veikia. Lietuvių kalbai jį reikia padaryti. Situacija panaši į rašybos tikrinimo komponentą tekstų rengyklėse. Pradžioje jo taip pat nebuvo. Bet tai – atskira teksto rengyklės funkcija, kurios gali ir nebūti. Socialiniuose tinkluose vyksta bendravimas tarp žmonių, todėl čia būtinas asmenvardžių, vietovardžių ir kai kurių kitų daiktavardžių linksniavimas.

Angliškas kilmininkas yra atskiras linksniavimo atvejis. Jo funkcijas galėtų perimti universalesnis linksniavimo mechanizmas.

Dar vienas klaidų šaltinis yra atskirai verčiami eilučių fragmentai. Tačiau ne kiekvienas atvejis klaidingas ir klaidų procentas bus mažesnis negu tokių eilučių procentas. Galima pasakyti tik tiek, kad porinėse eilutėse (jų yra 2,8 proc.) klaidų tikimybė bus maža, o pavienėse (jų yra 2,6 proc.) – didesnė. Tiksliau apie tai bus galima pasakyti analizuojant išverstas eilutes (apie tai kalbėsime kitame skyrelyje).

Šios nedidelės problemos sprendimas – fragmentų atsisakyti.

3. Vertimo klaidų analizės pavyzdys

Klaidoms iliustruoti pasirinkome puslapį „Jūsų pranešimai“. Iš tikrųjų tai – ne jūsų parašytų, o gautų pranešimų sąrašas. Jį pasirinkome dėl to, kad vienoje vietoje yra daug eilučių ir kad tas eilutes, t. y. pranešimus, tinklo narys bent kartą perskaito. Tai tarpinis skaitomumo variantas tarp eilučių, nuolat matomų pagrindiniuose tinklalapiuose, ir tų, į kurias užklystama retai. Paėmėme šimtą iš eilės einančių pranešimų iš dviejų feisbuko paskyrų. Iš jų atrinkome tuos, kuriuose radome bent vieną iš pirmiau aprašytų klaidų. Tokių buvo 57. Dalis pranešimų buvo pakartoti paraidžiui arba skyrėsi tik parametrų reikšmėmis, pavyzdžiui, Jonas rašė... arba Petras rašė... Skirtingų radome 26 (2 lentelė).

2 lentelė.

83565.png 

Antrame lentelės stulpelyje rašėme pranešimų kartojimų skaičius. Jų suma yra 57. Tiek, arba 57 proc., eilučių vertėjas negalėjo išversti tinkamai.

Daugelyje pranešimų minimi asmenvardžiai. Siekdami neatskleisti asmens duomenų, palikome tik jų galūnes, pavyzdžiui, vardą Jonas keitėme į -as, o pavardę Jonienė – į -ienė.

Tarptautinimo klaidas pabraukėme, o neišverstus tekstus rašėme pilkame fone. Vertimo klaidų, t. y. tų klaidų, kurių vertėjas galėjo nedaryti, nežymėjome.

Suskaičiuojame klaidas (skliaustuose – egzempliorių skaičių suma):

• asmenvardžių ir vietovardžių linksniavimas (L) – 9 (16),

• angliškas kilmininkas (K) – 2 (3),

• fragmentuotos eilutės (F) – 12 (22),

• neišverstos eilutės arba jų fragmentai (N) – 13 (33).

Iš viso (L + K + N): 24 (52).

Iš viso (L + K + N + F): 36 (74).

Dvi sumas skaičiavome dėl to, kad dalis fragmentuotų eilučių (F) vertėjui pateikiamos langelių pora (žr. 6 pav.). Tada vertėjas turi galimybę parinkti tinkamą linksnį ir klaidos nelieka. Todėl neištaisomų (tarptautinimo) klaidų skaičių tiksliau būtų nurodyti intervalu „nuo... iki...“: iš viso 24–36 (52–74).

4. Apibendrinimas

Feisbuko vertimo programa turi puikias sutelktinio vertimo galimybes: konteksto panaudojimo, daiktavardžių linksniavimo, būdvardžių ir dalyvių giminės kaitos, vaizdžiai pateikiamų daugiskaitos formų. Tačiau ne visos šios galimybės racionaliai panaudojamos. Lietuvių kalbos daugiskaitos formos programoje įdiegtos prieš ketverius metus, bet vis dar naudojamos vangiai. Lietuviškų asmenvardžių ir vietovardžių linksniavimas neveikia iki šiol. Yra ir daugiakalbystei netinkamų komponentų: angliškas kilmininkas ir fragmentuotos eilutės. Viso to rezultatas – klaidų gausa tinklo lokalizacijoje. Šių klaidų negali ištaisyti sutelktinio vertimo savanoriai, nes tai – tarptautinimo klaidos. Jas gali ištaisyti tik vertimo programos autoriai, jei daugiau dėmesio skirtų sutelktinio vertimo dalyvių darbo koordinavimui.

1 Socialinių tinklų pavadinimai yra tapę bendriniais daiktavardžiais ir juos lietuviname, o tinklo portalų pavadinimus paliekame angliškus (žr., pvz., D. Kirpatrick. Facebook efektas // „Obuolys“, 2011).