이 누리집은 대한민국 공식 전자정부 누리집입니다.

Ai2, '딥시크-V3' 능가하는 오픈 소스 405B LLM 공개..."사후 훈련에 중점"

2025.02.10

2025.01.31

ⓒAI타임스 박찬기자

앨런 AI연구소(Ai2)가 강화 학습과 추론 강화를 포함한 사후 훈련(post-training)에 중점을 둔 새로운 오픈 소스 모델을 공개했다. 이 모델은 역대 최대 규모의 오픈 소스 대형언어모델(LLM) `딥시크-V3`를 능가한다고 강조했다.

Ai2는 30일(현지시간) 4050억 매개변수의 오픈 소스 LLM `튈루 3 405B(Tülu 3 405B)`를 출시했다고 발표했다. 이 모델은 데이터셋 구축부터 미세조정, 평가 프레임워크까지 AI 사후 훈련의 모든 단계를 포함하는 기술을 결합해 개발됐다.

(후략)

[원본기사 출처 :

https://www.aitimes.com/news/articleView.html?idxno=167571

]

댓글 0

첫 댓글을 작성해보세요!

댓글 작성

댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.