이 누리집은 대한민국 공식 전자정부 누리집입니다.

[2월 2주] 카카오가 만든 AI 평가 지표, 세계 3대 AI 학회서 인정 및 오픈소스로 공개 외

2026.02.12

2월 2주 국내외 오픈소스SW 관련 동향을 모아 정리하였습니다.
자세한 내용은 기사 제목을 클릭하시면 보실 수 있습니다.

 

□ 카카오가 만든 AI 평가 지표, 세계 3대 AI 학회서 인정 및 오픈소스로 공개
카카오가자체 개발한 오케스트레이션 벤치마크(인공지능(AI) 평가 지표)가 세계 3대 AI 학회인 ICLR 2026 논문으로 채택되었습니다.  ICLR은 글로벌 빅테크 기업들이 주목하는 최고 권위 학술대회입니다. 
최근에 대규모언어모델(LLM)이 단순 질의응답을 넘어 이용자가 요구하는 다양한 종류의 작업을 계획하고 조율하는 에이전틱AI로 고도화되고 있는 기술 트렌드에 주목해 벤치마크를 개발하였습니다. 
실제 서비스 시나리오를 기반으로 작업 계획과 도구 실행을 분리해 정밀하게 평가하는 새로운 프레임워크를 제시하였는데 여행·쇼핑·금융·일정 등 17개 서비스 도메인과 100여개의 가상 도구를 포함해 구성했으며 사용자 요청 변경이나 추가 질문 등과 같은 실제 서비스 상의 대화 흐름을 토대로 시나리오를 구축해 실용성을 높였습니다. 한국어와 영어 2개 언어를 지원하며, 특히 한국어의 경우 문화적 특성과 맥락을 반영해 평가의 정확도와 신뢰도를 높인 것이 특징입니다.

연구 성과의 자유로운 활용을 위해 카카오는 이 논문을 오픈소스 플랫폼 깃허브에 공개했습니다.

(참고뉴스)
1. 카카오, 자체 개발 ‘LLM 오케스트레이션’ 벤치마크 오픈소스로 공개(IT비즈뉴스) 
2. 카카오, 자체 개발 AI 평가 지표 'ICLR 2026' 논문 채택(디지털투데이)
3. 깃허브 OrchestrationBench 저장소 : https://github.com/kakao/OrchestrationBench


□ 가트너 "오픈클로, 보안리스크로 차단 권고", 네·카·당 '사용 금지령'
오픈소스 자율형 AI 에이전트 OpenClaw에 대한 활용이 확산되고 있습니다. 단순히 대화에 응답하는 수준을 넘어, AI가 컴퓨터 속 정보를 확인하고 스스로 판단하고 실행하며 실질적으로 사람의 일을 대신하는 AI 비서역할을 할 수 있기 때문입니다.
하지만 이러한 과정에서 많은 권한을 갖게 된다는 점 등에서 활용에 대한 보안 경고들이 나오고 있습니다. 가트너가 "수용할 수 없는 사이버보안 리스크"를 동반한다며 기업들에 즉각 차단을 권고했으며, 마이크로소프트 AI 안전팀은 "오픈클로는 아직 기업용으로 쓰기에 보안이 취약하다"는 우려를 공식 제기하기도 했습니다. 연합뉴스에 따르면, 네이버와 카카오, 당근도 최근 오픈클로를 쓰지 말라는 공지를 내렸다고 보도했습니다. 중국 공업정보화부(MIIT) 또한 지난 5일 오픈클로가 부적절하게 설정될 경우 사이버 공격과 데이터 유출의 통로가 될 수 있다고 공식 경고하면서 강력한 신원 인증과 접근 제어 시스템을 요구했습니다. 보안 업체 위즈는 오픈클로를 쓴 AI 에이전트들의 커뮤니티 몰트북의 설계 결함으로 인해 수천 명의 개인 데이터가 노출됐다고 분석했습니다.
이러한 보안 우려에도 X(엑스)에 개설된 '한국 오픈클로 에이전트 커뮤니티'에 1천700명 이상 회원이 모여 사용 후기나 취약점 개선 방안을 공유하는 등 여러 활용 방법 등이 시도되고 있으며, 텐센트 클라우드, 디지털오션, 알리바바 클라우드 등 주요 클라우드 업체들은 오픈클로를 서비스형으로 제공하는 원클릭 설치 도구를 출시하기도 했습니다.

(참고뉴스) 
1. 가트너 "오픈클로, 보안리스크로 차단 권고"...텐센트클라우드 등 '서비스형' 출시(더에이아이) 
2. PC를 대신 조작하는 AI…네·카·당 '사용 금지령' (연합뉴스) 
3. OpenClaw, 24시간 자율 AI 비서 꿈인가, 보안 악몽인가?(MIT 테크놀로지 리뷰)


□ 미스트랄, 로컬 기기서 실행되는 오픈소스 음성 모델 출시
미스트랄 AI가 스마트폰과 노트북에서 완전히 로컬로 실행되는 차세대 음성 인식 모델 ‘복스트럴 트랜스크라이브 2(Voxtral Transcribe 2)’ 모델 2종을 공개하였습니다. 
음성 AI 모델은 자동 고객 상담, 실시간 자막, 동시통역 등 다양한 영역에서 기업들이 활용하고 있으나 의료, 금융, 국방 등 규제가 엄격한 사용은 음성데이터가 클라우드로 전송되는 경우 도입 자체가 불가능했습니다. 그러나 복스트럴 모델은 40억개 매개변수에 불과해 거의 어디에나 탑재할 수 있을 만큼 작으며, 모든 처리가 기기 내부에서 이뤄져 오디오 데이터를 외부 서버로 전송하지 않는다는 점을 차별화 요소로 내세웠습니다. 
모델은 허깅페이스에 아파치 2.0 오픈소스 라이선스로 공개되었습니다.

(참고뉴스) 
1. 미스트랄, 로컬 기기서 실행되는 오픈소스 음성 모델 출시(AI타임즈) 
2. 허깅페이스 Voxtral Mini 4B Realtime 2602 저장소 : https://huggingface.co/mistralai/Voxtral-Mini-4B-Realtime-2602

 

□ 항공우주 도메인 검색 모델 '픽시1.0' 오픈소스 공개 및 AI 성능 평가 세계 2위 달성
우주 AI 전문 기업 텔레픽스가 항공우주 전문 기술 문서를 정확하게 검색하는 자체 개발 AI 모델 ‘픽시1.0(PIXIE-v1.0)’을 오픈소스로 공개, 글로벌 검색 벤치마크 상위권에 올랐습니다.
픽시1.0은 항공우주·위성·국방 등 고도의 전문 기술 문서를 대상으로 의미 기반 검색이 가능하도록 설계된 항공우주 도메인 특화 정보 검색 모델로. 위성 설계 문서, 기술 규격서, 운용 매뉴얼 등 방대한 항공우주 기술 문서를 자연어 질의로 수월하게 검색할 수 있도록 설계되었습니다.  텔레픽스는 성능 입증을 위해, 검색 벤치마크 ‘RTEB(검색 임베딩 성능 평가 지표)’ 테스트를 진행했으며 평가 결과, 매개변수 10억(1B)개 이하 모델 부문에서 리더보드 세계 2위를 기록하였습니다.
픽시1.0은 오픈소스로 공개되어 허깅페이스에서 확인할 수 있습니다.

(참고뉴스) 
1. 텔레픽스, 항공우주 검색 모델 ‘픽시1.0’ 오픈소스 공개(AI타임즈) 
2. 허깅페이스 PIXIE-v1.0 저장소 : https://huggingface.co/collections/telepix/pixie-v10

 

 

- Open UP -

댓글 0

첫 댓글을 작성해보세요!

댓글 작성

댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.

* 표시는 필수 입력 사항입니다.