온라인 인구 99%가 쓰는 언어 지원하는 구글 번역, 텐서플로우 공개 의미는
OSS
게시글 작성 시각 2016-12-09 07:06:04
2016년 12월 2일 (금)
ⓒ 미디어잇(IT조선), 장원준 마이크로소프트웨어 편집장
새로운 콘텐츠가 실시간으로 소식이나 지식의 형태로 인터넷에 올라간다. 개인의 사적인 정보에서부터 공동지성에 의한 협업의 결과물등 다양한 형태로 쌓여간다. 그리고 우리는 직장에서 또는 일상에서 검색과 브라우징을 통해서 필요한 정보를 얻는다. 별다른 비용없이 현장의 풍경을 보고 목소리를 들을 수 있다.
이러한 높아진 접근성을 상쇄하는 부분이 언어의 장벽이다. 언어의 장벽은 신화에도 나오듯이 오래된 기원을 갖고 있다. 거의 모든 시기 이 분야에 대한 전문가를 필요로 한다. 정보기술(IT)이 발전하고, 인지와 해석에 대한 학문적 수준이 높아짐에 따라 기계를 통한 번역은 인공지능의 주요한 과제 중 하나가 되었다.
대표적인 기계 번역 서비스 중 하나인, 구글의 번역 서비스는 매월 5억명 이상이 사용하며, 103개의 언어를 지원하는 데, 이는 온라인 인구 99%가 사용하는 언어를 지원한다.
지난달 29일 구글 코리아에서 구글번역 서비스에 대한 발표가 있었다.
하나의 언어를 다른 언어로 번역하는 작업은 쉬운 작업이 아니다. 게다가 다양한 언어를 대상으로 하는 번역은 더더욱 복잡하다. 100개의 언어를 대상으로 하면 이론적으로 가능한 조합의 경우의 수는 100²이 된다. 복잡하며 수많은 모델과 시스템이 예상된다. 당연히 높은 비용이 요구된다. 단일한 모델에 대한 요구와 시도가 생길만하다.
규칙 기반으로 중간 언어를 사용해서 번역하는 방식은 단일한 모델을 사용하는 고전적인 방식이긴 하지만 이러한 시스템은 너무 많은 규칙과 예외 사항을 반영해야 하며 또한 변화에 대응해야 했기 때문에 실용적이지 못했다. 기계 번역은 소스 언어와 대상 언어를 쌍으로 해서 개별적으로 처리하는 방식이 일반적이었다.
이에 반해 구글의 신경망 기계 번역(Google Neural Machine Translation, GNMT)은 엔드 투 엔드(end-to-end) 방식으로 다양한 언어로의 확장을 용이하게 만들어 주었다. 엔드투엔드 방식은 문장을 기존처럼 단어나 어구로 나누지 않고, 오히려 문장을 대상으로 한다. 분석과 규칙과 예외를 대상으로 하는 직접적이고 인위적인 개입이 최소화된다. 구글의 단일 신경망 번역 모델은 풍부한 데이터를 가지고 있는 언어 조합과 상대적으로 빈약한 데이터를 갖고 있는 언어 조합을 학습시킬 때, 빈약한 데이터 조합의 쌍으로 이루어진 번역이 질적으로 개선되는 결과가 있기도 했다.
또한 신경망에 의해서 직접적인 데이터로 학습되지 않은 언어 간의 번역도 언어간의 암묵적인 연결에 의해서 번역이 가능한데, 이를 제로샷(Zero-Shot) 번역이라고 한다. 즉, 언어간 번역용 학습 데이터가 없어도 번역이 가능하다는 의미이다. 결과물 또한 자연스럽다. 제로샷 번역은 기존 신경망 아키텍처에 큰 변화 없이 문장앞에 선행하는 토큰(지시어) 추가하는 확장 방식을 사용했다.
구글은 신경망에 존재하는 중간어(Interlingua)에 대한 강력한 증거 사례를 제시하기도 했다. 영어와 일본어, 영어와 한국어 쌍을 다자간 모델로 학습시켰다. 동일한 의미를 가진 문장이 다차원 공간 중 영어와 일본어와 한국어의 백터 값이 근접해 있음을 툴을 이용해서 시각적으로 보여주었다.
구글의 번역 시스템은 텐서플로우에 의해서 학습되고, 검증된다. 텐서플로우는 알파고에서 사용되었던 소프트웨어로 기계학습과 딥러닝(심층신경망) 연구를 위해서 구글에서 공개한 오픈소스 프로젝트이다.
동일한 29일 구글이 윈도우를 지원하는 텐서플로우의 새로운 버전(0.12)을 배포했다. 구글이 텐서 플로우를 처음 오픈소스화 한 이후부터 윈도우에 대한 네이티브 지원에 대한 요구가 있었다. 이제 CUDA8을 이용한 온전한 GPU 지원이 가능하게 되었고, 인공 지능에 대한 접근이 보다 수월한 환경이 되었다.
구글의 이 두가지 발표는 인터넷 유저의 입장에서, 인공지능에 관심있는 연구나 개발자의 관점에서 중요한 전환점과 기회가 될 것이다.
이러한 높아진 접근성을 상쇄하는 부분이 언어의 장벽이다. 언어의 장벽은 신화에도 나오듯이 오래된 기원을 갖고 있다. 거의 모든 시기 이 분야에 대한 전문가를 필요로 한다. 정보기술(IT)이 발전하고, 인지와 해석에 대한 학문적 수준이 높아짐에 따라 기계를 통한 번역은 인공지능의 주요한 과제 중 하나가 되었다.
대표적인 기계 번역 서비스 중 하나인, 구글의 번역 서비스는 매월 5억명 이상이 사용하며, 103개의 언어를 지원하는 데, 이는 온라인 인구 99%가 사용하는 언어를 지원한다.
지난달 29일 구글 코리아에서 구글번역 서비스에 대한 발표가 있었다.
하나의 언어를 다른 언어로 번역하는 작업은 쉬운 작업이 아니다. 게다가 다양한 언어를 대상으로 하는 번역은 더더욱 복잡하다. 100개의 언어를 대상으로 하면 이론적으로 가능한 조합의 경우의 수는 100²이 된다. 복잡하며 수많은 모델과 시스템이 예상된다. 당연히 높은 비용이 요구된다. 단일한 모델에 대한 요구와 시도가 생길만하다.
규칙 기반으로 중간 언어를 사용해서 번역하는 방식은 단일한 모델을 사용하는 고전적인 방식이긴 하지만 이러한 시스템은 너무 많은 규칙과 예외 사항을 반영해야 하며 또한 변화에 대응해야 했기 때문에 실용적이지 못했다. 기계 번역은 소스 언어와 대상 언어를 쌍으로 해서 개별적으로 처리하는 방식이 일반적이었다.
이에 반해 구글의 신경망 기계 번역(Google Neural Machine Translation, GNMT)은 엔드 투 엔드(end-to-end) 방식으로 다양한 언어로의 확장을 용이하게 만들어 주었다. 엔드투엔드 방식은 문장을 기존처럼 단어나 어구로 나누지 않고, 오히려 문장을 대상으로 한다. 분석과 규칙과 예외를 대상으로 하는 직접적이고 인위적인 개입이 최소화된다. 구글의 단일 신경망 번역 모델은 풍부한 데이터를 가지고 있는 언어 조합과 상대적으로 빈약한 데이터를 갖고 있는 언어 조합을 학습시킬 때, 빈약한 데이터 조합의 쌍으로 이루어진 번역이 질적으로 개선되는 결과가 있기도 했다.
또한 신경망에 의해서 직접적인 데이터로 학습되지 않은 언어 간의 번역도 언어간의 암묵적인 연결에 의해서 번역이 가능한데, 이를 제로샷(Zero-Shot) 번역이라고 한다. 즉, 언어간 번역용 학습 데이터가 없어도 번역이 가능하다는 의미이다. 결과물 또한 자연스럽다. 제로샷 번역은 기존 신경망 아키텍처에 큰 변화 없이 문장앞에 선행하는 토큰(지시어) 추가하는 확장 방식을 사용했다.
구글은 신경망에 존재하는 중간어(Interlingua)에 대한 강력한 증거 사례를 제시하기도 했다. 영어와 일본어, 영어와 한국어 쌍을 다자간 모델로 학습시켰다. 동일한 의미를 가진 문장이 다차원 공간 중 영어와 일본어와 한국어의 백터 값이 근접해 있음을 툴을 이용해서 시각적으로 보여주었다.
구글의 번역 시스템은 텐서플로우에 의해서 학습되고, 검증된다. 텐서플로우는 알파고에서 사용되었던 소프트웨어로 기계학습과 딥러닝(심층신경망) 연구를 위해서 구글에서 공개한 오픈소스 프로젝트이다.
동일한 29일 구글이 윈도우를 지원하는 텐서플로우의 새로운 버전(0.12)을 배포했다. 구글이 텐서 플로우를 처음 오픈소스화 한 이후부터 윈도우에 대한 네이티브 지원에 대한 요구가 있었다. 이제 CUDA8을 이용한 온전한 GPU 지원이 가능하게 되었고, 인공 지능에 대한 접근이 보다 수월한 환경이 되었다.
구글의 이 두가지 발표는 인터넷 유저의 입장에서, 인공지능에 관심있는 연구나 개발자의 관점에서 중요한 전환점과 기회가 될 것이다.
※ 본 내용은 (주)미디어잇(http://www.it.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 미디어잇. 무단전재 및 재배포 금지
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 407637 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 397450 | 2020-10-27 |
5991 | 모질라, 개인정보 보호 강화한 모바일 웹브라우저 출시 | 3806 | 2016-12-09 |
5990 | 온라인 인구 99%가 쓰는 언어 지원하는 구글 번역, 텐서플로우 공개 의미는 | 4449 | 2016-12-09 |
5989 | 블록체인 생태계를 구축하는 IBM | 3807 | 2016-12-09 |
5988 | [주간 클라우드 동향] 엔터프라이즈 파고드는 AWS…어떤 서비스 내놨나 | 3651 | 2016-12-09 |
5987 | 오픈소스로…인공지능 학습 플랫폼 | 3906 | 2016-12-09 |
5986 | 국내 통신사, 리눅스 운영체제 백업 솔루션으로 ’Arcserve UDP’ 운영 | 3877 | 2016-12-09 |
5985 | “클라우드·IoT·인공지능 시대, 보안도 2017년이 전환점” | 3783 | 2016-12-09 |
5984 | 오픈소스컨설팅, 르노삼성에 AWS 클라우드 이관 구축 | 4005 | 2016-12-09 |
5983 | 네이버가 던진 4차산업혁명시대 웹 역할론 | 4191 | 2016-12-09 |
5982 | 2017년을 넘어 이어질 9가지 엔터프라이즈 기술 동향 | 4325 | 2016-12-09 |
0개 댓글