본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.07.21

ⓒAI타임스/박찬 기자

 

애플이 최강 성능의 새로운 오픈 소스 소형언어모델(sLM)을 출시했다. 데이터 큐레이션을 통한 고품질 데이터셋으로 모델을 훈련한 결과라고 주장했다.

벤처비트는 19일(현지시간) 애플이 2000토큰의 컨텍스트 창을 제공하는 70억(7B)과 14억(1.4B) 매개변수의 오픈 소스 sLM ‘DCLM(DataComp for Language Models)’’을 오픈 소스로 출시했다고 보도했다.  

이에 따르면 DCLM은 ‘DCLM-베이스라인(DCLM-Baseline)’을 학습한 모델이다. 이 데이터셋은 머신러닝(ML) 모델로 대량의 데이터에서 고품질 데이터를 자동으로 필터링하고 선택하는 '데이터 큐레이션'을 통해 구축했다.
(후략)

 

[원본기사 : https://www.aitimes.com/news/articleView.html?idxno=161781]

 

맨 위로
맨 위로