Prace nad pierwszą wersją Deepl Translatora Jarosław Kutyłowski rozpoczął jeszcze w firmie Linguee, w której pracował od 2012 r. System wykorzystuje istniejący zbiór danych wyszukiwarki tłumaczeń Linguee, ale innowacyjne rozszerzenie podstawowych możliwości sieci neuronowych poskutkowało bezprecedensowym poprawieniem jakości tłumaczenia. Bezpłatna wersja jest oferowana od sierpnia 2017 r., komercyjna (DeepL Pro) od marca 2018 r. Ta płatna pozwala subskrybentom na odblokowanie pełnych możliwości technologii tłumaczenia AI DeepL. Pozwalają one na korzystanie ze zoptymalizowanego tłumacza internetowego, integrowanie algorytmów DeepL z oprogramowaniem do tłumaczenia oraz tworzenie nowych aplikacji i usług za pomocą środowiska DeepL API. DeepL wchodził na rynek, kiedy technologiczny krajobraz tłumaczeń maszynowych znajdował się w punkcie zwrotnym. Stare rozwiązania, jak np. statystyczne tłumaczenie maszynowe, właśnie zaczęły ustępować miejsca rozwiązaniom opartym na sieciach neuronowych, dzięki czemu szanse się wyrównały.
Tłumaczenie tłumaczeniu nierówne
Główna trudność w tworzeniu programów tłumaczeniowych polega nie na różnych znaczeniach poszczególnych słów, ale na zapanowaniu nad całym procesem tłumaczenia. Tłumacząc samemu, a nie chcąc, aby tłumaczenie było dosłowne i „słowo po słowie”, trzeba najpierw uchwycić ogólny sens zdania i zastanowić się, jak przetłumaczyć to znaczenie na inny język, co może wymagać zupełnie innej gramatyki, dzielenia zdania lub użycia wielu innych metod lingwistycznych. Dopiero potem należy skupić się na poszczególnych słowach i spróbować dokończyć tłumaczenie, od czasu do czasu wracając do oryginalnego zdania, aby sprawdzić poszczególne pojęcia. I to tutaj właśnie metody oparte na AI z wykorzystaniem sieci neuronowych ujawniają swoją przewagę. Modele, których obecnie używa DeepL, potrafią uczyć się i abstrahować do tego stopnia, że pozwala im to podążać za naturalnym modelem, a nie tylko tłumaczyć sekwencyjnie. W rezultacie znacznie poprawia się zdolność do formułowania tłumaczeń, które są nie tylko poprawne, ale także dobrze i naturalnie brzmią w języku docelowym. Można nawet pójść dalej w tym myśleniu, co robi DeepL, i brać pod uwagę nie tylko jedno zdanie, ale całe akapity naraz. Pozwala to na poprawę jakości tłumaczenia, ponieważ rozwiązuje niejednoznaczności, których nie można rozwiązać na poziomie zdań – ale stanowi też wyzwanie pod względem złożoności obliczeniowej.
Potrzebna moc obliczeniowa
Pytanie, ile różnych możliwości musi „rozważyć” program tłumaczeniowy, zanim zdecyduje się na wyświetlenie ostatecznego tłumaczenia, jest jednak źle postawione, bo sieci neuronowe nie działają w ten sposób. Tłumaczenie jest jednak bardzo wymagającym obliczeniowo zadaniem: mimo że baza użytkowników DeepL jest duża i w każdej sekundzie wykonuje ogromną liczbę tłumaczeń, zapotrzebowanie firmy na energię do zasilania serwerów jest rzędu megawatów, a są to liczby typowe raczej dla zakładów przemysłowych, a nie dla startupów z branży IT. Pokazuje to, jak wiele obliczeń, a więc i mocy potrzeba do wykorzystania rozwiązań opartych na AI. Co ważne, do zasilania silników tłumaczeniowych DeepL używa 100% energii odnawialnej.
Tłumaczenie na żywo czy online
Oczywiście nie wszystkie rodzaje dokumentów mogą być tłumaczone przez programy, a i tak zależy to od wymagań użytkownika. W zależności od dalszego przeznaczenia, dokument przetłumaczony maszynowo może być od razu wykorzystany lub wymagać korekty przez specjalistę z danej dziedziny, a nawet odpowiedniego poświadczenia. Dotyczy to zarówno dokumentów prawnych, jak i medycznych. W praktyce jednak wielu użytkowników firmy, którzy mieszkają za granicą, tłumaczy teksty prawne i medyczne na swój język ojczysty, aby móc lepiej zrozumieć te dokumenty.
Perspektywy działania
Serwis DeepL po 4 latach działania jest obecnie dochodowy i nie musi już szukać zewnętrznego finansowania, co w skali globalnej jest jednak ewenementem. Zdaniem założyciela firmy udało się to osiągnąć tylko dzięki bardzo ścisłej dyscyplinie budżetowej i… szczęściu, że ma się produkt, który rozwija się wiralnie bez zbyt dużych nakładów na marketing i sprzedaż.
Firma jest obecna w UE, USA, Kanadzie i Japonii, zbierając świetne recenzje, m.in. takie od TechCrunch: „Giganci technologiczni tacy jak Google, Microsoft czy Facebook wykorzystują proces uczenia maszynowego do tłumaczenia, ale niewielka firma DeepL przebiła ich wszystkich i wysoko podniosła poprzeczkę w tej dziedzinie. Jej narzędzie do tłumaczenia jest równie szybkie jak u konkurencji, ale o wiele dokładniejsze i bardziej szczegółowe od tych, które próbowaliśmy”.
Wsparcie dla uchodźców z Ukrainy
Kwestia barier językowych zawsze była jednym z największych wyzwań dla ludzkości – nie tylko w ekstremalnych sytuacjach, takich jak wojna na Ukrainie. Pokonywanie tych barier jest tym, co motywuje DeepL – dlatego też firma udostępnia darmowy serwis, chociaż nie obsługuje jeszcze języka ukraińskiego. Prace trwają, ale zapewnienie takiej jakości, jaką firma chce zaoferować użytkownikom, nie jest łatwe i może zająć jeszcze trochę czasu.