[주간 OSS 동향리포트] 애플 오픈소스 sLM ‘DCLM’ 출시, 데이터 큐레이션으로 성능 극대화
Open UP에서는 지난 한 주의 국내외 공개SW 관련 동향을 모아 정리합니다.
자세한 기사 내용은 아래 기사 내용 중 굵게 표시된 제목을 클릭하시면 보실 수 있습니다.
애플이 2000토큰의 컨텍스트 창을 제공하는 70억(7B)과 14억(1.4B) 매개변수의 오픈소스 sLM ‘DCLM(DataComp for Language Models)’을 오픈소스로 출시했습니다.
DCLM은 ‘DCLM-베이스라인(DCLM-Baseline)’을 학습한 모델입니다. DCLM-베이스라인은 애플, 워싱턴대학교, 텔아비브대학교, 토요타 연구소 등이 협력, 멀티모달용 고품질 데이터셋을 설계하는 프로젝트 ‘데이터컴프(DataComp)’의 일환으로 이 데이터셋은 머신러닝(ML) 모델로 대량의 데이터에서 고품질 데이터를 자동으로 필터링하고 선택하는 '데이터 큐레이션'을 통해 구축했습니다.
이 모델들을 허깅페이스에서 다운로드 할 수 있으며 DLCM-7B는 애플의 샘플 코드 라이선스에 따르며 DLCM-1.4B는 아파치 2.0 라이선스입니다.
□ 넷플릭스, 관리 시스템 '마에스트로' 오픈소스화(디지털투데이)
넷플릭스가 자체 개발한 워크플로우 오케스트레이터 '마에스트로'(Matstro)를 오픈소스로 공개했다.
23일(현지시간) 온라인 매체 기가진은 넷플릭스가 마에스트로를 오픈소스로 공개하며 데이터 관리에 혁명적인 변화를 가져올 것이라고 전했다.
□ 엔비디아 “GPU 커널 모듈 모두 오픈소스로…”(테크레시피 )
엔비디아가 GPU 관련 커널 모듈을 모두 오픈소스로 전환한다고 발표했다. 이에 따라 그레이스호퍼(Grace Hopper)나 블랙웰(Blackwell) 같은 최첨단 모듈은 앞으로 오픈소스 커널 모듈만 지원될 예정이다.
과거 엔비디아는 GPU 관련 소프트웨어 오픈소스화에 소극적이었지만 2022년에는 리눅스용 GPU 커널 모듈 전체를 GPL과 MIT 이중 라이선스로 오픈소스로 출시했다.
- OpenUP -
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 407530 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 397356 | 2020-10-27 |
11021 | 젠슨 황·저커버그 대담으로 들여다본 '생성형 AI의 향방' | 1708 | 2024-07-31 |
11020 | 세일즈포스, 기존 10배 규모 오픈 소스 멀티모달 데이터셋 출시 | 1821 | 2024-07-29 |
11019 | 글로벌 AI 레이스 변화 바람 부나...中 기업들 오픈소스 AI 두각 | 1793 | 2024-07-29 |
11018 | [주간 OSS 동향리포트] 애플 오픈소스 sLM ‘DCLM’ 출시, 데이터 큐레이션으로 성능 극대화 | 2306 | 2024-07-29 |
11017 | 스위스, 정부 기관서 오픈소스 소프트웨어 사용 의무화 | 1741 | 2024-07-26 |
11016 | 메타, 오픈소스 LLM 라마3.1 시리즈 공개..."클라우드·보안 등 파트너 생태계 확대" | 1744 | 2024-07-24 |
11015 | 넷플릭스, 관리 시스템 '마에스트로' 오픈소스화 | 1882 | 2024-07-24 |
11014 | 구글 자회사 직소, 테러 콘텐츠 식별하는 도구 ‘알티튜드’ 오픈소스로 공개 | 1621 | 2024-07-24 |
11013 | 애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화" | 1192 | 2024-07-23 |
11012 | [주간 OSS 동향리포트] ‘2024 오픈소스 컨트리뷰션 아카데미(OSSCA) 참여형 발대식’을 개최 | 1843 | 2024-07-23 |
0개 댓글