[주간 OSS 동향 리포트] 카카오, AI 기술을 적용한 형태소 분석기 '카이' 오픈소스로 공개
2018년 12월 04일(화)
공개SW역량프라자에서는 지난 한 주의 국내외 공개SW 관련 동향을 모아 정리합니다.
자세한 기사 내용은 아래 기사 내용 중 굵게 표시된 제목을 클릭하시면 보실 수 있습니다.
카카오가 국내에선 처음으로 딥러닝(기계학습) 기술 기반 형태소 분석기 '카이'('khaiii,Kakao Hangul Analyzer III)'를 오픈소스로 제공합니다. 형태소 분석기술은 2개 이상의 글자로 이루어진 단어 혹은 문장을 입력 시, 의미를 가진 언어 단위 중 가장 작은 단위인 형태소 단위로 자동으로 분리하는 기술로 정보 검색, 기계 번역, 스마트 스피커나 챗봇 등 여러 서비스에서 사용할 수 있습니다. 카카오는 국립국어원에서 배포한 데이터인 세종 코퍼스를 기반으로 데이터의 오류를 수정하고 카카오에서 자체 구축한 데이터를 추가해 85만 문장, 1천3만 어절의 데이터를 학습하여 정확도를 높였으며, 카이 오픈소스를 통해 한국어 연구, 챗봇/자연어 처리 응용기술 개발 등 한국어를 활용하는 다양한 분야에서 비용과 시간을 줄일 수 있게 될 것이라고 기대하고 있습니다. 카이는 깃허브에서 확인할 수 있으며, 누구나 무료로 이용 가능합니다.
미국에서 가장 인기 있는 스포츠 리그가 AWS의 머신러닝 도구를 사용해 스포츠 팬과의 교류를 확대하고 있습니다. 리그는 2015년부터 지브라 테크놀로지의 RFID 칩을 축구공과 선수에 부착시켰다. 이를 통해 시즌 당 1TB의 GPS 데이터를 수집해왔으며, 팬들은 이를 통해 선수의 패스 성공률, 패스를 잡을 확률 등에 대한 예측값을 확인할 수 있습니다. NFL 넥스트 젠 스탯(NFL Next Gen Stats)의 마이클 치 디렉터는 지난주 열린 아마존 리인벤트 컨퍼런스에서서 "이를 통해 NFL 팬들이 게임을 좀더 즐길 수 있게 했다"라고 했으며 오픈소스 XG부스트 그라디언트 부스팅 알고리즘을 사용해 70-20-10 트레인 / 검증 / 테스트 방법론을 사용함으로써 최고의 성능 모델을 검증 할 수 있었다고 설명했습니다.
미국 경제전문매체 CNBC는 “MS와 애플, 아마존이 시가총액 1위 자리를 놓고 치열한 경쟁을 펼치고 있다”면서 “MS가 어떤 순위를 기록하던 상관없이 다시 중요한 의미를 갖게 됐다는 건 분명하다”고 평가했습니다. 이 매체는 MS의 부활은 2014년 초 사티아 나델라가 최고경영자(CEO)로 취임하면서 시작됐다고 지적하며 MS의 부활비결을 크게 네가지로 꼽았습니다. 가장 중요한 요인은 역시 ‘윈도 퍼스트 전략’을 과감하게 벗어던지고 핵심 인력들을 오픈소스 소프트웨어 프로젝트에 대거 투입하고 또 자사 소프트웨어도 오픈소스 라이선스로 제공하기 시작했습니다. 두번째로는 MS의 부활에 빼놓을 수 없는 클라우드입니다. 나델라는 클라우드 쪽에 전략적 우선 순위를 두었으며 CNBC에 따르면 2019 회계연도 MS 전체 매출에서 애저 클라우드 사업 비중이 10%를 웃돌 전망입니다. 다음으로는 폐쇄적인 생태계에서 드롭박스, 레드햇, 세일즈포스 뿐 아니라 아마존에도 문호를 개방하면서 입니다. 마이크로소프트는 소스코드 공유사이트 깃허브(Github)도 인수했습니다. MS 부활의 네 번째 요인으로 ‘개인정보에 덜 의존한 점’을 꼽았습니다. 이에 거대 기업들의 개인정보 남용에 대한 규제 필요가 제기될 때도 비판의 칼날을 피해갈 수 있었습니다.
● 카카오, 딥러닝 형태소 분석기 '카이' 오픈소스 공개(지디넷코리아) 카카오가 인공지능(AI) 기술을 적용한 형태소 분석기술을 깃허브에 오픈소스로 공개한다고 30일 밝혔다.
● NFL 리그가 AWS 세이지메이커를 이용하는 방법(CIO Korea)미국에서 가장 있는 스포츠 리그가 AWS의 머신러닝 도구를 사용해 스포츠 팬과의 교류를 확대하고 있다.
● 부활한 MS, '개인정보 정책'도 한몫했다(지디넷코리아) 이 매체는 MS의 부활은 2014년 초 사티아 나델라가 최고경영자(CEO)로 취임하면서 시작됐다고 지적했다. 나델라가 취임하던 2014년 당시 MS 주가는 36달러 남짓한 수준이었다. 하지만 불과 4년 만에 주가가 113달러까지 상승하면서 시가총액 1위를 다투게 됐다.
-공개SW역량프라자-
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 406095 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 395904 | 2020-10-27 |
8211 | MS, 윈도머신러닝 AI추론엔진 오픈소스로 공개 | 5487 | 2018-12-05 |
8210 | 블록체인 플랫폼 비즈니스 고삐 당기는 SK㈜ C&C·삼성SDS | 5163 | 2018-12-05 |
8209 | ㈜다성테크, “AI를 기반으로 하는 스마트팜 시스템 개발해” | 5527 | 2018-12-05 |
8208 | [주간 OSS 동향 리포트] 카카오, AI 기술을 적용한 형태소 분석기 '카이' 오픈소스로 공개 | 15744 | 2018-12-04 |
8207 | 부활한 MS, '개인정보 정책'도 한몫했다 | 5389 | 2018-12-04 |
8206 | NFL 리그가 AWS 세이지메이커를 이용하는 방법 | 5313 | 2018-12-04 |
8205 | [포럼] SW정책, 오픈소스 생태계에 올라타자 | 5673 | 2018-12-03 |
8204 | 카카오, 딥러닝 형태소 분석기 '카이' 오픈소스 공개 | 5272 | 2018-12-03 |
8203 | AWS, 리인벤트 2018서 블록체인 솔루션 2종 발표 | 5785 | 2018-12-03 |
8202 | 기고 | 강화 학습, AI의 주류로 부상하다 | 6223 | 2018-12-03 |
0개 댓글