2025.01.22
ⓒCIO Korea
이지현
기자
AI 기업 딥시크가 자사의 첫 번째 추론 특화 AI 모델인 `딥시크-R1`과 `딥시크-R1-제로`를 20일 공개했다. 벤치마크 분석 자료에 따르면, 이번 R1 시리즈는 수학, 코딩, 복잡한 추론 능력에서 오픈AI의 모델과 거의 유사한 성능을 보이는 것으로 나타났다.
R1-제로는 지도학습 없이 강화학습만으로 개발된 모델로, 자체 검증, 성찰, 연쇄적 사고 등 뛰어난 추론 능력을 보여준다. 이 모델에서 발견된 무한 반복, 가독성 저하, 여러 언어 혼재 등의 문제점을 보완하기 위해 R1은 강화학습 전 기초 데이터를 선학습하는 방식으로 개발됐다. 6,710억 개 파라미터 규모의 R1은 128K 컨텍스트 길이를 지원한다.
MIT 라이선스로
허깅페이스를 통해 공개된
R1과 R1-제로는 학계 및 연구 단체의 활용을 위해 상업적 제한 없이 제공된다.
(후략)
[원본기사 :
https://www.cio.com/article/3806228/%EA%B0%80%EA%B2%A9%EC%9D%80-%EC%98%A4%ED%94%88ai-%EB%8C%80%EB%B9%84-95-%EC%A0%80%EB%A0%B4-%EC%84%B1%EB%8A%A5%EC%9D%80-%EB%B9%84%EC%8A%B7-%C2%B7%C2%B7%C2%B7-ai-%EC%97%85%EA%B3%84.html
]
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.