Tag Archives: facebook

Wie vertaalt beter?

CNN.com vroeg zich eerder deze week af wie beter kunnen vertalen: de computers van Google of de vrijwilligers van Facebook. Hoewel ik, zoals ik al eerder schreef, zo mijn bedenkingen heb bij het fenomeen crowdsourcing, in ieder geval als het wordt gebruikt voor vertalingen, werkt het in mijn ervaring voorlopig beter dan MT (Machine Translation).

Hoe werkt het? Het MT-systeem van Google leert, volgens het CNN-artikel, van tekst die al op internet staat en professionele vertalingen die online staan. Hoe het systeem onderscheid maakt tussen professionele en andere online vertalingen, vermeldt het verhaal niet. En ook niet of er een manier is waarop de kwaliteit wordt bepaald van de teksten waarvan het systeem leert. GIGO (Garbage In, Garbage Out) is een bekend fenomeen bij MT- en TM-systemen. Toch gebruik ik Google Translate wel eens, ironisch genoeg voor Facebook. De meeste van mijn Facebook-vrienden schrijven in het Engels, Nederlands, Frans of Noors en dat begrijp ik allemaal wel. Maar er is er ook één die standaard in het Fins schrijft en daarin herken ik niet meer dan hier en daar een woord. Dus als ik nieuwsgierig ben, plak ik haar bericht in Google Translate en laat het naar het Nederlands vertalen. Meestal heb ik dan een goed idee waar het over gaat, maar de kwaliteit van de vertaling laat vaak ernstig te wensen over. En haar laatste berichtje is in de vertaling van Google wel erg mysterieus: “Lapsoset kreeg om te slapen gewoon bij 22 uur, vraagt mij hoe lang de oude man nog Duunissa hyörii.”

Mijn conclusie is dat de techniek voorlopig alleen maar goed genoeg is voor dit soort toepassingen, om snel een idee te krijgen van wat ergens staat, maar zeker niet voor vertalingen die echt in de praktijk moeten worden gebruikt. MT wordt tegenwoordig ook gebruikt om een eerste vertaling van een tekst te produceren, die vervolgens door een menselijke vertaler moet worden bijgeschaafd. Ik heb een paar keer een dergelijke opdracht gekregen en ik ben niet onverdeeld enthousiast. Als het gaat om standaardteksten uit een vastomlijnd vakgebied, zijn de MT-vertalingen soms best redelijk en hoeft er niet veel te worden bijgeschaafd. Maar in andere gevallen is de vertaling zo slecht dat je sneller klaar bent als je de tekst gewoon zelf opnieuw vertaalt.

Naar de vertaaltoepassing van Facebook heb ik toevallig gisteren voor het eerst gekeken. Facebook laat alle interfacetekst van zijn website vertalen door vrijwillige vertalers, die op de vertaalsite losse woorden of zinnen aangeboden krijgen die vertaald moeten worden. Soms staat daar context bij, soms ook niet. Deze maand hebben er al 311 vertalers aan de Nederlandse vertaling gewerkt en in totaal zijn er ruim 75.000 vertalingen aangeboden. Omdat je niet zomaar elke vertaling kunt vertrouwen, kan iedereen die dat wil via dezelfde vertaalsite setjes van 10 al vertaalde woorden of zinnen opvragen en de vertalingen omhoog of omlaag stemmen. Ook dat werkt natuurlijk niet altijd even goed. Ik heb gisteren op proef een paar zinnetjes vertaald. Op de meeste daarvan is nog helemaal niet gestemd, maar een van mijn vertalingen is ten onrechte omlaag gestemd. Bij ‘From Home’, dat volgens de begeleidende beschrijving duidelijk in de context van een routebeschrijving moet worden gezien, had de oudere vertaling ‘Vanaf de startpagina’ gisteren nog 0 punten en vandaag -2, terwijl mijn vertaling ‘Vanaf huis’ op -1 stond en staat. Vandaag is daar door iemand anders ‘Van thuis uit’ bij gezet, dat vooralsnog 0 punten heeft. Aan de andere kant wordt mijn suggestie ‘Taalbeheerders’ voor ‘Language Managers’ beter gewaardeerd (1 punt) dan het ‘Taalmanagers’ dat er al stond (-2 punten).

Een groot voordeel van deze methode is wel dat er echte mensen aan het vertalen zijn, die in ieder geval begrijpen wat er staat. Als er in het Engels een typfout staat waardoor er een niet-bestaand woord ontstaat, begrijpt een menselijke vertaler meestal wel wat er wordt bedoeld. Het MT-systeem van Google struikelt, zoals het bovenstaande voorbeeld laat zien, op woorden die het niet kent. Het grote nadeel blijft natuurlijk dat er veel te veel mensen aan de vertaling werken, waardoor het erg lastig is om de vertalingen consistent te maken op het gebied van stijl en terminologie. Volgens het CNN-artikel is Facebook wel van plan om ook wat professionele (en ik neem aan betaalde) vertalers in te zetten. Als die worden ingehuurd om de gecrowdsourcete vertalingen na te lezen en consistent te maken, dan kan ik dat alleen maar toejuichen.

Het is in ieder geval duidelijk dat er flink gewerkt wordt aan het automatiseren van mijn vak en de ontwikkelingen lijken erg snel te gaan nu internet niet meer is weg te denken uit het dagelijks leven. Ik ben erg benieuwd hoe mijn vak er in de toekomst uit zal zien!

Advertisements

Vrije iPhone?

vrije iPhone?
vrije iPhone?

Voor zover ik weet wordt Facebook vertaald via crowdsourcing, niet altijd een garantie voor de beste vertalingen. Of de advertenties op dezelfde manier vertaald worden, weet ik niet. Maar helemaal goed gaat het niet altijd, zoals hier te zien is in een advertentie waarin een ‘vrije iPhone’ wordt aangeboden. Geen idee wat ik me daar bij moet voorstellen. Of zou het toch om een gratis iPhone gaan?