[AI 이슈] 서울대 김현우 박사팀, AI 학회 EMNLP서 국내 최초 우수논문상 수상 및 세계 최대 규모 일상 대화 데이터셋 ‘SODA’ 오픈소스로 공개
support
게시글 작성 시각 2024-01-03 14:36:23
2024.01.02
ⓒ인공지능신문 / 최광민 기자
기존 대화형 인공지능(Conversational AI) 분야는 고질적으로 데이터 부족 문제에 시달려왔다. 일상에서 이뤄지는 대화들은 데이터로 기록되지 않는 경우가 대부분이기 때문이다. 문자 메세지나 이메일 같은 형태로 대화가 기록되더라도 여러 법적 제약들이 존재하기 때문에 이를 연구에 활용하기에는 어려웠다.
이에 대안으로 그동안 크라우드 소싱을 통해 대화 데이터셋을 제작해왔지만 비용도 많이 들고, 만들 수 있는 데이터셋 크기도 작은 문제점이 있다. 그 결과, 기존 대화 관련 연구들은 모두 소수의 작은 데이터셋 위에서 이루어져 범용성에 큰 제약이 있었다.
서울대학교 공과대학(학장 홍유석)은 컴퓨터공학부 김현우 박사와 김건희 교수가 미국 시애틀 앨런 인공지능 연구소(Allen Institute for AI; AI2) 및 워싱턴대학교(University of Washington)의 최예진 교수 등과 함께 진행한 연구가 국제 최우수 자연어처리 학술대회 'EMNLP 2023'에서 최우수논문상(Outstanding Paper Award)를 수상하고 세계 최초로 150만 규모의 세계 최대 고품질 일상 대화 데이터셋 '소다(SODA)'를 오픈소스로 공개했다.
(후략)
[원본기사 : https://www.aitimes.kr/news/articleView.html?idxno=29894]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 405543 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 395344 | 2020-10-27 |
10831 | [AI 이슈] 서울대 김현우 박사팀, AI 학회 EMNLP서 국내 최초 우수논문상 수상 및 세계 최대 규모 일상 대화 데이터셋 ‘SODA’ 오픈소스로 공개 | 1445 | 2024-01-03 |
10830 | [주간 OSS 동향리포트] 애플, 오픈소스 대형멀티모달모델(LMM) '페렛(Ferret)'출시 | 2061 | 2024-01-02 |
10829 | 아파치 오픈소스 ERP 시스템, 인증 우회 취약점 발견 | 1313 | 2024-01-02 |
10828 | 얀 르쿤 "AI 발전 위해선 오픈소스 생태계 키워야" | 1080 | 2023-12-28 |
10827 | 애플, 오픈 소스 LMM 출시 뒤늦게 알려져..."크리스마스 선물 같은 소식" | 1193 | 2023-12-26 |
10826 | 블로그 | 너도나도 과대포장··· 생성형AI에 오픈소스가 필요하다 | 1209 | 2023-12-21 |
10825 | [주간 OSS 동향리포트] EU, 'AI 법' 잠정 합의에 도달...오픈소스 모델, 생체인식 예외 인정 | 1601 | 2023-12-21 |
10824 | "생성AI가 사이버 범죄 도울 수도…악용 범죄 크게 늘듯" | 1391 | 2023-12-19 |
10823 | 마이크로소프트, 소형 언어모델 '파이 2' 출시 | 1319 | 2023-12-19 |
10822 | NIA, 전자정부 표준프레임워크 신규버전 발표 | 1335 | 2023-12-19 |
0개 댓글