2025.09.03
자세한 기사 내용은 아래 기사 내용 중 굵게 표시된 제목을 클릭하시면 보실 수 있습니다.
홍콩대학교 연구진은 컴퓨터를 직접 조작할 수 있는 AI 에이전트 개발을 위한 오픈소스 프레임워크 ‘오픈CUA(OpenCUA)’에 관한 논문을 아카이브에 게재하였습니다. 웹 탐색부터 복잡한 소프트웨어 실행까지 사람 대신 컴퓨터 작업을 수행하는 ‘컴퓨터 유즈 에이전트(CUA)’ 개발을 위한 오픈소스 프레임워크입니다.
오픈CUA는 코드, 모델 가중치, 데이터셋 등을 모두 공개해 연구자와 기업이 자체 워크플로우에 맞는 맞춤형 CUA를 훈련할 수 있도록 했습니다.
CUA는 기업 환경에서 반복적이거나 다단계의 업무 흐름을 자동화하는 데 활용될 수 있다. 그러나 현재 가장 성능이 뛰어난 시스템은 대부분 비공개로 운영되며, 데이터와 학습 과정 등이 공개되지 않아 연구와 안전성 검증에 제약이 있었습니다. 그래서 누구나 정교하고 일반화 가능한 CUA를 개발할 수 있도록 지원하기 위해 데이터 수집·모델 학습·평가 체계가 통합된 오픈 소스 플랫폼인 오픈CUA를 제안한 것입니다.
이 플랫폼은 사용자가 컴퓨터에서 수행하는 작업을 자동으로 기록하는 ▲주석(Annotation) 인프라, 다양한 OS와 애플리케이션 및 웹사이트에서 수행된 작업 기록을 포함하는▲에이전트넷(AgentNet) 데이터셋, 화면 상태(state)와 사용자의 행동(action)을 묶은 ‘상태-행동 쌍’에 사고 사슬(CoT) 기법을 적용하여 고차원적 사고 과정을 반영한 ▲확장형 학습 파이프라인 등의 세가지 구성 요소로 이루어져있습니다.
[참고기사]
□
마이크로소프트, WinUI 전면 `오픈 소스` 전환… 윈도우 11 개발자 시대 열린다
(디지털포커스)
마이크로소프트가 윈도우 11의 핵심 사용자 인터페이스(UI) 기술인 WinUI를 전면 오픈 소스로 전환한다고 발표하였다. 이는 개발자 커뮤니티의 오랜 요구를 반영한 결과이다. 이 결정은 소프트웨어 개발의 패러다임을 바꾸고, 윈도우 앱 개발 환경에 획기적인 변화를 가져올 것으로 기대된다. 단순히 코드를 공개하는 것을 넘어, 개발자들이 깃허브(GitHub)를 통해 직접 참여하고 기여할 수 있는 협력적 생태계를 구축하는 것을 목표로 한다.
□
머스크, `그록-2.5` 오픈 소스 공개..."그록-3는 6개월 뒤에"
(AI타임스 )
일론 머스크 CEO의 예고대로 `그록-2`가 오픈 소스로 출시됐다. 그는 이를 `그록-2.5`라고 불렀는데, 자세한 사항은 알려지지 않았다. 머스크 CEO는 24일 X(트위터)를 통해 "지난해 우리의 최고 모델이었던 그록-2.5가 이제 오픈 소스로 공개됐다"라고 밝혔다. 이 모델은 허깅페이스를 통해 다운로드 받을 수 있다.
이어 "그록-3는 약 6개월 후에 오픈 소스로 공개될 예정"이라고 덧붙였다.
- Open UP -
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.