Evropská unie pověřila českou překladatelskou agenturu CEET finálním vyhodnocením výsledků „překladatelského maratonu“, který by měl dát odpověď na otázku, na jaký strojový překladač se lze nejvíce spolehnout. Mezinárodní týmy překladatelů již přeložily do pěti jazyků 12,5 tisíce vybraných vět z článků nejznámějších zpravodajských serverů a deníků: BBC (angličtina), Le Monde (francouzština), Der Spiegel (němčina), El Mundo (španělština) a iDnes a Lidové noviny (čeština). Stejné texty nechají přihlášení účastníci, instituce, ale i nadšenci během tohoto týdne přeložit svými softwary. Z Česka se do maratonu zapojil Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy (MFF UK) s překladači CU-BOJAR a CU-TECTOMT. Evropské jazyky totiž dělají strojům mnohem větší problémy než například překlady mezi angličtinou a čínštinou. „Znaky jsou sice zcela jiné, ale tvaroslovně a slovosledně jsou si tyto jazyky podobnější. Překlady z a do češtiny výrazně komplikuje zejména skloňování a časování,“ upozorňuje Ondřej Bojar z MFF UK. Proto je čeština jedním z jazyků, na nichž se překladače prověřují. Ústav se podílí i na vývoji nového překladače EU Euromatrixu (EURO 47/2009), jenž bude soupeřit rovněž s překladačem od Googlu či Systranem a Mosesem. Strojové překlady zpracuje univerzita v Edinburghu, lidské hodnocení proběhne na americké Univerzitě Johna Hopkinse. V červenci kompletní výsledky testování zpracuje a vyhodnotí agentura CEET a vyhlásí na Konferenci Asociace pro počítačovou lingvistiku ve švédské Uppsale.