본문 바로가기 주메뉴 바로가기 푸터 바로가기

사이트맵


Book Mark
인간을 뛰어넘은 자동번역, 일본 사회 속으로 들어가다
  • 현장·인터뷰
  • 일본
  • 도쿄무역관 장보은
  • 2019-11-04
  • 출처 : KOTRA

- 번역기술 발전으로, 일본에서는 인바운드 수요를 노린 자동번역/통역 서비스가 활발 -

- 국가연구기관의 번역엔진 개발로 기업을 지원 -




AI기술 발전으로 한단계 도약한 자동번역 서비스


  ㅇ AI를 사용한 기술의 비약적 발달로 품질이 향상된 온라인 자동번역 서비스
    - 오랫동안 사용되어 온 번역기술인 SMT(통계기계번역)는 번역 정확도가 낮아, 그 내용을 그대로 사용하기에는 어려웠음.
    - NMT*(심층학습기반 신경기계번역)기술은 2013년에 등장한 뒤 정확도를 높여, 2016년에는 번역정확도의 지표가 되는 ‘BLEU스코어’가 SMT의 20을 뛰어넘었으며, 2018년에는 35까지 향상됨.
    - 일본 총무성 산하 연구기관인 정보통신연구기구(NICT)의 스미타 에이치로 연구원은 “2020년에는 번역정확도가 60(평균적인 인간을 뛰어넘는 수준)에 도달할 것이다.”라고 보고 있음.
      *NMT: Neural Machine Translation (원문 번역의 전 과정을 인공 신경망으로 처리하는 기계번역)

 

  ㅇ 일본어를 영어로 하는 번역은 프로 번역가에 육박하는 수준
    - 번역 서비스 제공사인 미라이번역의 영작문 정보전달력은 TOEIC 960점 수준에 도달하였음.
    - 유창함 면에서도 프로 번역가에 거의 필적하지만, 영어에서 일본어로의 번역은 유창함에서 프로 번역가에 약간 못 미침.


  ㅇ 고도로 전문화된 분야에서도 높은 수준에 도달한 일본의 온라인번역
     - 일영/영일 번역 엔진을 탑재한 서비스 T-4OO는  AI번역 서비스사인 rozetta가 독자적으로 개발함. 이것은 의학과 법무 등에서의 특수한 전문용어를 대부분 실수 없이 번역하며, 각 분야의 어조에 맞는 어투를 구사함.
    - 미라이번역의 사장이자 오사카대학교수이기도 한 에토 미노루 씨는 “지금까지 프로 번역 서비스에서는 인간, 혹은 기계가 번역한 문장을 인간이 교정하는 2단계의 절차를 밟아왔지만, NMT의 발전으로 인간의 교정이 불필요해질 것이다. 번역 비용은 지금의 1/10 이하수준이 될 것이다.”라고 견해를 밝힘.


기존의 SMT와 새로운 NMT의 평가점수(BLEU) 추이

external_image

자료: 정보통신연구기구(NICT)


자동번역 서비스는 일상 생활에 침투


  ㅇ NMT 등장으로 자동번역 서비스는 자동통역기 등 일반 번역/통역 용도로 확대
    - 자동통역기에는 기계번역기술뿐 아니라 음성인식기술, 음성합성기술도 탑재됨.
     - 음성인식기술은 2016년에 일정 조건 하에서 인간 이상의 수준을 실현하였으며, 음성합성기술도 2018년 전후부터 인간과 거의 비슷한 목소리를 만들어내는 수준까지 도달함.
    - NMT의 발전으로 기술적인 조건을 모두 갖추게 됨.


  ㅇ 일본의 SW회사 소스넥스트의 자동통역기 ‘포켓토크W’는 기대를 넘는 판매량을 기록
    - 2018년 9월에 발매한 포켓토크W는 독자개발 후 발매하자마자 예상을 웃도는 판매량을 보여, 회사 목표인 ‘2020년 말 누계 100만대’라는 목표를 뛰어넘을 기세임.
    - 제품의 최대 판매처는 개인이며 그 중 30%를 외국인 관광객이 차지함. 법인판매에서도 호텔 등의 관광업계, 철도 등 운수업계, 백화점 등 외국인 관광객을 대상으로 하는 인바운드 시장에서의 수요가 높음.


포켓토크 시리즈의 실적과 목표치

external_image

자료: 닛케이일렉트로닉


  ㅇ 포켓토크의 성공으로 독자적인 특징을 가진 후발 제품들도 증가
    - TAKUMI JAPAN은 접속의 용이성과 다기능성을 어필한 ‘KAZUNA eTalk 5’를 2018년 12월에 발매함. 총무성과의 실증실험 ‘재해 시 다국어 음성번역 시스템의 고도화’에도 NTT동일본, 미라이번역 등과 공동으로 참가함.
    - 사쿠라넷의 ‘Mayumi3’는 전화기처럼 사용해 다수의 외국인과 서로의 모국어로 이야기할 수 있는 ‘그룹 번역’ 기능이 특징임.


일본에서 판매 중인 주요 자동통역기

제품명

포켓토크W

KAZUNA eTalk5

Mayumi3

Langogo Genesis

사진

  external_image

  external_image

  external_image

external_image 

판매사/개발사

소스넥스트

TAKUMI JAPAN

사쿠라넷/비공개

HAIL이노베이션 등/중국 NetEasyYoudao

가격

29,880

29,880

29,800엔 등

31,700엔 등

발매시기

20189

201812

201812

20194

SIM대응(국가,지역)

(128)

(143)

(87,추가비용필요)

(73)

대응언어 수

74언어

73언어

86언어

104언어

주된 번역엔진

NICT

비공개

비공개

Tencent, Google 24종류

그 외 특징

음성으로 언어설정 가능/이용자 수가 많아 피드백 개선이 빠름/음성합성 목소리가 자연스러움

동시통역 가능/사진으로 찍은 문자 번역 가능/다국어간 채팅 가능(최대 500)

사진으로 찍은 문자 번역 가능/그룹번역 가능/녹음한 목소리의 통역 가능

번역언어를 자동인식/세계각국에 30대의 서버가 있어, 음성입력에서 출력까지 1초 이내

자료: 닛케이일렉트로닉


  ㅇ 전용단말 이외에서의 도입사례도 증가
     - 게이오전철은 2019년 7월, 노선의 시모키타자와역에 일본어를 포함한 4개국어(영어,중국어,일본어)를 구사하는 로봇 역무원을 도입하였음.
    - 게이힌급행전철은 2018년 7월에 관할인 72개역의 태블릿PC에 번역용SW ‘역 concier’를 도입함. 정형문을 많이 사용하며, 표시를 메신저처럼 디자인하여 외국인과의 대화를 수월하게 할 수 있도록 함.
    - 게이힌급행전철그룹 전략실 IT전략담당 구라시게 료타는 “인바운드와 2020년 도쿄올림픽을 앞두고 방일외국인이 급증하면서 안내건수는 연간 수십만 건에 달해, 그 부담을 경감시키기 위해 채용했다. 역무원은 영어 공부를 솔선해서 하고 있으나, 필요한 언어는 영어뿐만이 아니다.”라고 도입 이유를 밝힘.


  ㅇ 의료분야에서도 자동번역시스템을 도입하려는 움직임
     - 일본 전국 주요지역의 소방본부는 2017년 4월부터 NICT가 개발한 구급현장 대상 다국어번역 시스템 ‘구급 VoiceTra’을 도입하였음. 올해 4월 본부 전체의 54%에 해당하는 392개 본부에서 도입함.
    - KONICA MINOLTA는 의료기관 커뮤니케이션 지원 서비스 ‘MELON’에 NICT의 번역 엔진 등을 사용한 자동번역 시스템을 추가함. 이는 대학병원과 구급병원의 접수 등에서 도입되고 있음.


구급 VoiceTra의 사용 모습

external_image

자료: NICT


□ 일본산 번역엔진의 존재감


  ㅇ 자동번역단말과 서비스를 지탱하는 것이 바로 번역엔진
    - 각 제품과 서비스의 대다수는 제품의 주요기능인 번역의 정확도를 높이기 위해 여러 번역 엔진을 조합시켜 사용함.
    - 이 중에서 일본의 번역엔진도 존재감을 발휘하고 있으며, 정보통신연구기구(NICT)의 VoiceTra는 특히 채용예가 많은 것으로 알려짐.
    - NICT의 기술은 일본어를 허브로 두고, 아시아 6개 언어와 1대1 번역을 하고 있기 때문에 일본어에 대한 번역정확도가 높음.


  ㅇ 구글, 아마존 등 GAFAM의 넓고 얕은 대량의 데이터 수집에 대응하는, NICT의  ‘좁고 깊게’ 전략
     - 구체적으로는 1)직접 번역하는 언어로 일본어를 포함한 주요 10개 언어에 초점, 2)개인용은 관광분야를 축으로, 3)법인용은 정확도 향상과 비용 절감을 위해 각 분야의 기업에서 데이터를 모으는 ‘번역뱅크’를 추진함. 이를 통해 해외 번역 엔진에 대한 경쟁력을 제고하고자 함.
    - 번역뱅크는 각 전문분야의 고품질 번역데이터를 얻을 수 있기 때문에 이용가치가 높다고 할 수 있음. 이미 도요타자동차와 제약회사인 AstraZeneca 등에서 대량의 사내문서를 제공하는 등 성과가 나타나고 있다고 함.



□ 일본에서 활약하고 있는 Flitto 사 인터뷰


  ㅇ Flitto 관한 간단한 소개

    - Flitto 세계 1,030 명이 이용하는 번역 플랫폼(Web, iOS, Android)임. AI번역과 사람을 통한 번역 콤비네이션으로 300 명의 번역가가 실시간으로 번역을 해줌. 전 세계 IT대기업과 파트너십을 맺고 있으며, 문장, 이미지, 음성 등의 데이터를 제공하고 있음.


  Flitto 일본진출 계기와 비즈니스 상황

    - 일본의 경우 다양한 외국인들이 거주하고 방문하고 있지만 일본어를 모국어로 사용하고 있기 때문에 언어의 장벽을 느끼는 사람들이 많음. 2020 도쿄올림픽이나 2025년 오사카 엑스포가 다가오기 때문에 많은 외국인들이 방문을 것으로 예상되며 이로 인하여 언어 문제를 해결하는 것은 필수적인 상황이 되었음. 이를 계기로 정부와 기업에서 다양한 번역 엔진이나 서비스 음성 인식 엔진 등을 출시하고 있으며 플리토에서 이들 기업과 함께 하여 데이터를 공급하여 서비스의 정확도를 올려줄 것이라 생각함.

    - 현재 언어관련 인공지능 사업을 하고 있는 통신사에서 자동차 제조사까지 다양한 분야의 일본 기업들과 파트너십을 맺고 데이터를 납품하고 있음.


  일본과 한국에서의 번역 엔진 사업의 차이점

    - 일본과 한국의 상황은 크게 다르지 않음. 정부에서 주도적으로 선행 연구/개발을 하고 기업들이 해당 엔진을 활용하고 있음. 다만 한국은 정부가 주도로 데이터를 상당히 많이 구매하고 있으며 이렇게 구매한 데이터를 공공데이터로 오픈하여 다양한 기업들이 사용할 있도록 하였음. 이를 계기로 2016년부터 많은 기업들이 적극적으로 참여, 언어분야의 인공지능의 자국 기술이 빠르게 발전할 있었음. 한국은 대부분의 음성/번역 서비스에 해외 엔진이 아닌 자국 엔진을 활용 중임.


  향후 계획

    - 앞으로는 아시아를 중심으로 독자적인 언어를 가진 마켓을 중심으로한 글로벌 사업을 진행하려. 또한 세계적으로 비약적인 성장을 보이고 있는 AI개발 시장에서 데이터 부족이 과제가 되고 있기 때문에높은 어학 데이터를 손쉽게 제공할 있는 체제를 만들어나가고 싶음. 앞으로도 언어의 장벽으로 인한 불편함을 없애기 위해 많은 파트너 기업을 모집해나갈 예정임.

 
 □ 시사점


  ㅇ 자동번역기술과 통역기가 더 보급되기 위해서는 1)번역 데이터의 보안 확보, 2)유저인터페이스의 향상, 3)번역정확도 향상과 동시통역 대응이라는 과제가 존재함.
     - 데이터의 보안 확보는 개인용 및 법인용 모든 분야에서 피할 수 없는 과제로, 이에 대한 대책 없이는 기업은 안심하고 번역 엔진을 이용할 수 없음.
    - 유저인터페이스는 현재의 자동번역단말의 이용이 일상화될수록 과제가 될 것으로 보임.


  ㅇ 일본은 정부  산하 연구기관인 NICT에서 주도적으로 번역엔진을 개발해 시장을 활성화
    - 2020년부터는 총무성과 함께 AI를 사용한 15개 언어에 대응하는 동시통역SW의 개발을 시작해, 오사카 국제박람회가 열릴 2025년 실용화를 목표로 하고 있음.

  

  ㅇ 내년도 도쿄올림픽을 계기로 외국인 관광객을 대상으로 하는 서비스/상품은 크게 성장할 것으로 보임. 그 중 외국어 대응은 가장 직접적인 과제 중의 하나인 만큼 수요가 무궁무진함. 관련 기업은 이러한 시장 기회를 잘 활용해 가능성을 계속 키워나가는 것이 중요함.  



자료 : 니혼게이자이신문, 닛케이일렉트로닉, NICT 및 각 일간지, Flitto사 및 KOTRA 도쿄 무역관 종합

<저작권자 : ⓒ KOTRA & KOTRA 해외시장뉴스>

공공누리 제 4유형(출처표시, 상업적 이용금지, 변경금지) - 공공저작물 자유이용허락

KOTRA의 저작물인 (인간을 뛰어넘은 자동번역, 일본 사회 속으로 들어가다)의 경우 ‘공공누리 제4 유형: 출처표시+상업적 이용금지+변경금지’ 조건에 따라 이용할 수 있습니다. 다만, 사진, 이미지의 경우 제3자에게 저작권이 있으므로 사용할 수 없습니다.

국가별 주요산업

댓글

0
로그인 후 의견을 남겨주세요.
댓글 입력
0 / 1000