텍스트 번역으로 유명한 DeepL이 이제 당신의 음성을 번역하고 싶어합니다

텍스트 도구로 가장 잘 알려진 번역 회사인 DeepL은 오늘 맞춤형 애플리케이션을 통해 일선 직원을 위한 회의, 모바일 및 웹 대화, 그룹 대화와 같은 사용 사례를 다루는 음성-음성 번역 제품군을 출시했습니다. 또한 회사는 제3자 개발자와 회사가 콜센터와 같은 맞춤형 사용 사례에 DeepL의 기술을 활용할 수 있도록 하는 API를 출시할 예정입니다.

DeepL CEO Jarek Kutylowski는 인터뷰에서 TechCrunch와의 인터뷰에서 “수년 동안 텍스트를 번역한 후 음성은 우리에게 자연스러운 단계였습니다.”라고 말했습니다. “우리는 텍스트 및 문서 번역 분야에서 많은 발전을 이루었습니다. 하지만 실시간 음성 번역을 위한 훌륭한 제품은 없다고 생각했습니다.”

Kutylowski는 대기 시간(말하는 사람과 번역된 오디오가 재생되는 사이의 지연)을 줄이는 것과 정확한 결과를 유지하는 것 사이의 균형을 맞추는 것이 실시간 번역 제품 센터를 만드는 데 어려움을 겪고 있다고 말했습니다.

DeepL은 Zoom 및 Microsoft Teams와 같은 플랫폼을 위한 플러그인을 출시하고 있습니다. 청취자는 실시간으로 번역을 듣고 다른 사람들은 모국어로 말하거나 화면에서 번역된 텍스트를 실시간으로 따라갈 수 있습니다. 이 프로그램은 현재 얼리 액세스 단계에 있으며 회사에서 초대 중입니다. 대기자 명단에 등록할 조직. 이 회사는 또한 직접 또는 원격으로 진행할 수 있는 모바일 및 웹 기반 대화용 제품도 보유하고 있습니다.

또한 DeepL을 사용하면 사용자는 교육 세션이나 워크숍과 같은 설정에서 그룹 대화에 참여할 수 있으며 참가자는 QR 코드를 통해 참여할 수 있습니다.

DeepL은 자사의 음성 대 음성 기술이 산업별 용어, 개인 및 회사 이름과 같은 맞춤형 어휘를 학습하고 이에 적응할 수도 있다고 말했습니다.

Kutylowski는 AI가 향후 몇 년 동안 고객 서비스가 어떤 모습일지 재창조하고 있다고 말했습니다. 그는 번역 계층이 회사가 자격을 갖춘 직원이 부족하고 고용 비용이 많이 드는 언어로 지원을 제공하는 데 도움이 된다고 언급했습니다.

기술 이벤트

샌프란시스코, 캘리포니아 주, 미국
|
2026년 10월 13~15일

회사는 음성 대 음성 방식으로 전체 스택을 제어한다고 밝혔습니다. 그러나 현재 시스템에서는 음성을 텍스트로 변환하고 번역을 적용한 다음 다시 음성으로 변환합니다. DeepL은 수년 간 텍스트 번역 작업을 진행해왔기 때문에 번역 품질 면에서 우위를 점하고 있다고 믿습니다. 앞으로 회사는 텍스트 전달을 완전히 건너뛰는 엔드투엔드 음성 번역 모델을 개발하려고 합니다.

DeepL은 공간의 인접한 구석에서 일하는 여러 자금 지원 스타트업과의 경쟁에 직면해 있습니다. 작년에 키운 사나스 6,500만 달러 Quadrille Capital 및 Teleperformance의 인공 지능을 사용하여 주로 콜센터 상담원을 대상으로 하는 도구인 화자의 억양을 실시간으로 수정합니다.

두바이에 본사를 둔 Camb.AI는 미디어 및 엔터테인먼트 회사인 Amazon Web Services의 음성 합성 및 번역에 중점을 두고 있습니다. 비디오 콘텐츠 더빙 및 현지화 규모를 조정합니다.

Reddit 공동 창립자 Alexis Ohanian의 Seven Seven Six 회사가 지원하는 Word는 의미와 의미를 모두 보존하도록 설계된 실시간 음성 번역 엔진을 구축하고 있습니다. 화자의 원래 목소리이는 DeepL이 현재 구축하고 있는 것과 더욱 직접적인 경쟁을 벌이게 됩니다.