이 누리집은 대한민국 공식 전자정부 누리집입니다.

코드로 이미지 데이터 오픈 소스 AI 학습 도구 ‘코신’..."저작권·편향 문제 해결"

2025.07.30

2025.07.29

ⓒAI타임스 / 박찬 기자

방대한 데이터를 수집하지 않고도 고성능 시각-언어 모델을 학습할 수 있는 코드 기반 합성 데이터 생성 도구가 나왔다.

미국 펜실베니아대학교와 앨런 인공지능연구소(AI2) 연구진은 25일(현지시간) 시각 이해 능력에서 `GPT-4V`와 `제미나이 1.5 플래시` 등 폐쇄형 모델을 능가하는 오픈 소스 AI 학습 도구 ‘코신(CoSyn)’에 관한 논문을 아카이브에 게재했다.

코신은 복잡한 과학 차트, 의료 도식, 금융 문서 등 고난도 시각 정보를 이해할 수 있도록 AI를 훈련하는 데 필요한 고품질 데이터를 코드를 통해 합성(synthetic) 생성한다. 이를 통해 기존 인터넷 이미지 수집 방식이 가진 저작권 문제와 편향 문제 등을 효과적으로 피할 수 있다.

(후략)

[원본기사 :

https://www.aitimes.com/news/articleView.html?idxno=201021

]

댓글 0

첫 댓글을 작성해보세요!

댓글 작성

댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.