DeepL uruchomił tłumacza słów mówionych w czasie rzeczywistym – przy wsparciu języka rosyjskiego

Redaktor NetMaster
Redaktor NetMaster
3 min. czytania

Niemiecka firma DeepL wprowadziła nową funkcję w swoim tłumaczu internetowym DeepL Voice, przeznaczoną do stosowania w rozmowach na żywo i wideokonferencjach. Teraz użytkownicy mogą tłumaczyć język mówiony z jednego języka na drugi i konwertować go na tekst w czasie rzeczywistym – raportuje TechCrunch. Ten krok był kolejną odpowiedzią na rosnące zainteresowanie usługami opartymi na sztucznej inteligencji.

System tłumaczenia maszynowego DeepL Voice, który według firmy zapewnia tłumaczenia o „niespotykanej wysokiej jakości”, obsługuje 13 języków – angielski, niemiecki, japoński, koreański, szwedzki, holenderski, francuski, turecki, polski, portugalski, rosyjski, hiszpański i Włoski. Co więcej, dostępne są napisy tekstowe dla 33 języków obsługiwanych przez platformę.

Nowy produkt DeepL może pracować zarówno w formacie „mirror”, gdzie tłumaczenia wyświetlane są na ekranie telefonu, tak aby uczestnicy spotkania mogli zobaczyć przetłumaczony tekst, jak i w formie napisów do wideokonferencji. Na razie DeepL Voice obsługuje jedynie integrację z Microsoft Teams, co według założyciela firmy Jarka Kutylowskiego faktycznie obejmuje większość ich bazy klientów. Nie ma jeszcze informacji o wsparciu dla innych usług, takich jak Zoom czy Google Meet.

Kutylovsky zauważył, że DeepL Voice to pierwszy krok firmy w dziedzinie technologii głosowej i planowany jest dalszy rozwój produktu. Podkreślił, że tłumaczenie głosowe stało się jednym z kluczowych obszarów, który będzie aktywnie rozwijać się w nadchodzących latach, zaś DeepL będzie w dalszym ciągu podnosić jakość swoich tłumaczeń rozwijając własne modele AI, dzięki którym możliwe będzie osiągnięcie większej dokładności, zwłaszcza w czasie rzeczywistym.

Szef firmy mówił także o możliwych scenariuszach wykorzystania nowej funkcji. Na przykład w sektorze usług, gdzie pracownicy restauracji, kawiarni i hoteli będą mogli porozumieć się z klientami posługującymi się różnymi językami. Jeśli chodzi o poufność danych, jako że przetwarzanie głosów użytkowników odbywa się na serwerach firmy, Kutylovsky zapewnił, że DeepL nie zapisuje ani nie wykorzystuje nagrań audio do szkolenia swoich modeli, a także przestrzega wszystkich wymogów RODO i innych przepisów.

Warto zaznaczyć, że DeepL nie jest jedyną firmą pracującą nad podobnymi rozwiązaniami. Google i inne start-upy, takie jak Eleven Labs i Panjaya, również opracowują usługi tłumaczenia głosowego, które konwertują dźwięk na tekst.

Udostępnij ten artykuł
Dodaj komentarz