2025.09.09
자세한 기사 내용은 아래 기사 내용 중 굵게 표시된 제목을 클릭하시면 보실 수 있습니다.
카카오는 글로벌 학회 SIGdial 2025에서 언어모델 핵심 기능인 툴 호출(Tool Calling) 학습 기법을 공개하고 이를 오픈소스로 공유했습니다.
툴 호출 기능은 사용자 요청에 단순히 답변을 생성하는 수준을 넘어 대화 맥락을 이해한 뒤 적절한 외부 도구를 유기적으로 연결해 다양한 작업을 수행하는 에이전틱(Agentic) AI 발전로 발전하면서 중요성이 크게 떠오고있습니다. 기존의 단순한 툴 호출 기능의 문제를 효과적으로 방어하고, AI가 보다 높은 정확도와 신뢰도를 갖춰 사용자 요청을 처리하도록 연구 개발을 진행했습니다.
카카오는 단일 질문-답변이 아닌 여러 차례 대화를 주고 받는 방식의 멀티턴(Multi-turn) 대화에서 기존 `직접 선호 최적화(DPO)` 방식을 응용한 `멀티턴 DPO` 기법으로 이 문제를 해결했습니다. 올바른/잘못된 대화 패턴을 학습하도록 강화학습 기법을 적용하여 이를 통해 모델이 추가 질문을 하거나 요청을 거절해야 하는 상황을 스스로 판단 가능하게 하여 잘못된 툴 호출, 정보 부족, 환각 문제를 크게 줄여 정확성과 신뢰도를 강화하였습니다.
[참고기사]
□
야놀자, 번역 특화 LLM `이브 로제타` 오픈소스 공개
(AI타임스)
트래블 테크 전문 야놀자(총괄대표 이수진)는 번역 특화 대형언어모델(LLM) ‘이브 로제타(EEVE ROSETTA)’를 상업적 이용 가능한 오픈 소스로 공개했다고 1일 밝혔다.
매개변수 40억개(4B)로, 구글의 `젬마 3`를 미세조정한 번역 특화 모델이다. `딥시크-R1`의 추론 데이터를 활용해 합성 추론 데이터셋을 생성해 학습한 것이 특징이다.
영어·일본어·중국어·스페인어·프랑스어 등 10개 언어를 지원, 제품 카탈로그 번역이나 호텔 리뷰 번역 등에 활용할 수 있다고 전했다.
- Open UP -
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.