2025.02.24
생성형 AI와 오픈소스 : 주요 모델의 OSAID 1.0 기준 분석
- Open UP -
중국 스타트업 딥시크가 DeepSeek-R1 모델을 오픈소스로 공개하면서, 생성형 AI 기술의 접근성과 활용성을 높이는 오픈소스 AI 생태계가 재조명되며 기업들의 오픈소스 전략 채택 가능성도 증가
생성형 AI 모델 4가지에 대해 OSAID 1.0 기준으로 분석한 결과, Mixtral 8x7, DeepSeek-R1이 가장 많은 조건을 충족한 반면, Stable Diffusion 3.5와 Llama 3.1은 OSI에서 승인한 라이선스를 사용하지 않고 특정 조건에 대한 제한 조항이 포함되어있어 일부 요건만 충족
기업들이 생성형 AI에 대해 오픈소스 전략을 채택하는 주요 이유는 개발 비용 절감과 연구 효율성 향상에 있으며, 다양한 연구 커뮤니티 및 개발자들이 참여로 인해 기술 발전 속도가 더욱 가속화되고 있음
생성형 AI 기술 혁신 이끄는 오픈소스 AI 생태계 재조명 : 주요 모델별 특징 및 OSAID 1.0 요구 사항 적용 분석
그동안 AI 모델 생태계는 주요 AI 기업들이 개발한 폐쇄형(closed) 모델(오픈AI(GPT-4o), 구글(Gemini) 등)이 주도해왔으나 메타의 LLaMA 모델 공개와 Big Science 프로젝트 'BLOOM' 등 개방성을 갖춘 모델 생태계가 확장되면서 오픈소스 AI가 주목받고 있음
중국 스타트업 딥시크가 DeepSeek-R1 모델을 오픈소스로 공개하며 AI 기술의 접근성과 활용도에 기여하는 오픈소스 AI의 중요성이 더욱 강조되고 있음
지금까지 AI 기술은 폐쇄형 모델이 이끌어 왔으나 딥시크가 고성능 모델의 소스코드를 개방하면서 개발 속도와 비용 효율성을 향상시키는 새로운 가능성을 보여줌
AI 개발에 오픈소스 생태계가 주목받게 되면서 오픈소스 전략을 선택하는 기업이 점차 늘어날 가능성이 높아지고 있음
지금까지 메타(LLaMA), 미스트랄AI(Mixtral), 알리바바(Qwen2.5), 딥시크(DeepSeek) 등의 기업이 오픈소스를 기반으로 한 AI 모델을 출시하여 공개
이번 기획브리핑에서 오픈소스 AI 정의 OSAID(Open Source AI Definition) 1.0에 대한 주요 요건 설명 및 주요 생성형 AI 모델별 특징을 살펴보고 모델별 OSAID 1.0 충족 여부를 종합적으로 분석하고자 함
오픈소스 AI 정의 1.0 주요 기준 및 필수 요소
오픈소스 이니셔티브(OSI)는 AI의 오픈소스 기준을 명확히 하기 위해 '오픈소스 AI 정의 OSAID 1.0' 발표(‘24.10)
정의 설계에 마이크로소프트, 구글, 메타, 아마존, 인텔, 삼성 등 주요 업체와 모질라 재단, 리눅스 재단, 아파치 소프트웨어 재단, 유엔 국제전기통신연합 등 25개 이상의 단체 참여
[오픈소스 AI 시스템을 위한 4대 자유]
| 구분 | 설명 |
|---|---|
| 사용의 자유 | 어떤 목적으로든 허가 요청 없이 시스템을 사용할 수 있는 자유 |
| 연구의 자유 | 시스템 작동 방식을 연구하고 구성 요소를 검사할 수 있는 자유 |
| 수정과 개선의 자유 | 시스템의 출력 변경을 포함해 어떤 목적으로든 시스템을 수정할 수 있는 자유 |
| 공유의 자유 | 수정 여부와 상관없이 다른 사람이 사용할 수 있도록 시스템을 공유할 수 있는 자유 |
[오픈소스 AI 4대 자유를 보장하기 위한 필수 요소]
| 구분 | 설명 |
|---|---|
| 데이터 정보 | 숙련된 사람이 동등한 시스템 구축이 가능하도록 학습 데이터에 대해 충분한 설명과 정보 제공 1) 데이터 출처, 범위 및 특성, 데이터 수집 및 선택 방법, 레이블 지정 절차, 데이터 처리 및 필터링 방법 공개 2) 공개적으로 이용 가능한 모든 학습 데이터 목록과 출처 표시 3) 제3자로부터 얻을 수 있는 모든 학습 데이터 목록과 출처 표시 (유료 데이터 포함) |
| 코드 정보 | 시스템을 훈련하고 실행하는 데 사용되는 데이터 처리, 필터링, 훈련, 검증, 테스트 등을 위한 전체 소스 코드가 제공되고 OSI 승인 라이선스 (118개)가 적용되어야 함 |
| 매개변수 정보 | AI 가중치 (모델이 데이터를 학습하면서 최적의 값을 찾아가는 핵심 요소) 또는 기타 구성 설정과 같은 모델 매개 변수 포함 |
OSI가 검토한 AI 시스템 중 OSAID 정의에 부합하는 오픈소스 AI는 Pythia(Eleuther AI), OLMo(AI2), Amber/CrystalCoder(LLM360), T5(구글)이고, 라이선스와 법적 조건을 변경하면 부합 가능한 모델은 BLOOM(빅사이언스), Starcoder2(빅코드), Falcon(TII)이며, 필수 구성 요소가 없거나 법적 계약이 오픈소스 원칙과 호환되지 않아 부합하지 않은 모델은 LLaMA2(메타), Grok(X/Twitter), Phi-2(마이크로소프트), Mixtral(미스트랄) 등임
주요 생성형 AI 모델별 특징
생성형 AI 모델은 최종 산출물 유형에 따라 텍스트, 이미지, 음성, 비디오, 기타(코드, 3D 등)으로 분류됨
텍스트(Text) 생성 모델 : 자연어 문장 생성, 기계 번역, 질문 응답, 요약 생성 등 수행
[텍스트 생성 모델의 특징]
| 모델명 | 개발사(국가) | 라이선스 | 주요 특징 |
|---|---|---|---|
| GPT-o3 | OpenAI(미국) | Commercial |
|
| Gemini 2.0 | Google DeepMind (미국) | Commercial |
|
| Claude 3.5 | Anthropic(미국) | Commercial |
|
| Llama 3.1 | Meta(미국) | Llama 3.1 Community License |
|
| Mixtral | Mistral AI(프랑스) | Apache 2.0 |
|
| DeepSeek-R1 | DeepSeek(중국) | MIT |
|
이미지(Text-to-Image) 생성 모델 : 자연어 텍스트나 이미지 입력에 대응하여 이미지 생성
[이미지 생성 모델의 특징]
| 모델명 | 개발사(국가) | 라이선스 | 주요 특징 |
|---|---|---|---|
| DALL-E 3 | OpenAI(미국) | Commercial |
|
| Midjourney 6.1 | Midjourney(미국) | Commercial |
|
| Imagen 3 | Google DeepMind (미국) | Commercial |
|
| Stable Diffusion 3.5 | Stability AI(영국) | Stability AI (모델), MIT(추론 코드) |
|
음성 생성(Text-to-Speech) 모델 : 텍스트와 음성 샘플 등을 통해 새로운 음성 생성, 변환 등 수행
[음성 생성 모델의 특징]
| 모델명 | 개발사(국가) | 라이선스 | 주요 특징 |
|---|---|---|---|
| WaveNet | Google DeepMind (미국) | Commercial |
|
| Whisper-large-v3 | OpenAI(미국) | Apache 2.0 |
|
| OpenVoice v2 | MyShell(캐나다)/MIT(미국) | MIT |
|
비디오 생성(Text-to-Video) 모델 : 자연어 텍스트, 이미지, 영상 등을 통해 비디오 생성, 변환 등 수행
[비디오 생성 모델의 특징]
| 모델명 | 개발사(국가) | 라이선스 | 주요 특징 |
|---|---|---|---|
| Sora | OpenAI(미국) | Commercial |
|
| Make-A-Video | Meta(미국) | Commercial |
|
| Dreamix | Google(미국) | Commercial |
|
기타(3D, 코드) 생성 모델
3D 생성 모델 : 텍스트, 2D 이미지등을 통해 3D 모델 자동 생성 수행
코드 생성 모델 : 자연어 텍스트 및 코드 샘플 등을 통해 코드 자동 생성 및 디버깅 수행
[기타(3D, 코드) 생성 모델의 특징]
| 모델명 | 개발사(국가) | 라이선스 | 주요 특징 |
|---|---|---|---|
| NVIDIA GET3D | NVIDIA(미국) | Commercial |
|
| DreamFusion | Google(미국) | Commercial |
|
| Copilot | Microsoft + OpenAI(미국) | Commercial |
|
| AlphaCode | DeepMind(영국) | Commercial |
|
| Code Llama 70B | Meta(미국) | Llama 2 Community License |
|
| CodeGemma | Google(미국) | Gemma |
|
주요 생성형AI의 오픈소스 AI 정의의 요구 사항 적용 분석
[주요 생성형AI 모델별 OSAID 1.0 정의 충족 여부 확인]
[X - 미충족, △ - 부분 충족, ○ - 충족]
| 모델명 | ChatGPT GPT-o3 | LLaMA 3.1 | Mixtral 8x7B | Stable Diffusion 3.5 | DeepSeek-R1 |
|---|---|---|---|---|---|
| 국가 | 미국 | 미국 | 프랑스 | 영국 | 중국 |
| 개발사 | OpenAI | Meta | Mistral AI | Stability AI | DeepSeek |
| 출시일 | 2022년 11월 | 2024년 7월 | 2023년 12월 | 2024년 10월 | 2025년 1월 |
| 라이선스 | Commercial | Llama 3.1 Community License | Apache 2.0 | Stability AI Community License(모델), MIT(추론 코드) | MIT |
| 특징 |
|
|
|
|
|
| OSAID 1.0 요구 사항 | |||||
| 데이터 정보 | X | X | X | X | X |
|
|
|
|
| |
| 코드 정보 | X | △ | ○ | △ | ○ |
|
|
|
|
| |
| 매개변수 정보 | X | △ | ○ | △ | ○ |
|
|
|
|
| |
| 오픈소스 AI 정의 (OSAID 1.0) | |||||
| 사용의 자유 | X | △ | ○ | △ | ○ |
|
|
|
|
| |
| 연구의 자유 | X | △ | △ | △ | △ |
|
|
|
|
| |
| 수정과 개선의 자유 | X | △ | ○ | △ | ○ |
|
|
|
|
| |
| 공유의 자유 | X | △ | ○ | △ | ○ |
|
|
|
|
| |
| 종합 | 해당없음 | OSAID 1.0 정의 일부 충족 | OSAID 1.0 정의 대부분 충족 | OSAID 1.0 정의 일부 충족 | OSAID 1.0 정의 대부분 충족 |
|
|
|
|
| |
생성형 AI 개방성과 기업 전략
앞서 살펴본 주요 생성형 AI 모델의 OSAID 1.0 기반 오픈소스 AI요구사항 분석 결과를 보면 대부분의 생성형 AI 모델이 OSAID 1.0의 엄격한 기준을 충족하지 못하고 있음
생성형 AI 기업별 전략에 따라 개방성의 수준을 달리하고 있음
메타나 Stability AI 기업 등과 같이 비표준 라이선스를 사용하거나, 모든 핵심 구성 요소를 공개하지 않는 경우가 다수임
AI 개방성은 단순히 오픈소스와 폐쇄형으로 나뉘지 않으며, 다양한 방식의 공개 형태로 존재하고 있음
이는 AI 개방성을 유지하면서도 기술 주도권을 확보하려는 기업의 전략으로 보임
비표준 라이선스를 사용하거나, 모든 핵심 구성 요소를 공개하지 않는 등 다양한 수준의 개방성을 가진 모델들을 포괄하여 ’오픈 가중치 모델‘로 분류될 수 있음
▶ 오픈 가중치 모델(Open Weight Model)이란
∙ AI 모델을 구성하는 가중치(weight) 값은 공개되어 있지만, 훈련 코드나 데이터셋은 비공개인 인공지능 모델을 의미
∙ (특징) 사전 훈련된 모델의 가중치를 다운로드하여 연구자, 개발자, 기업 등이 모델을 직접 분석하거나 개인 데이터로 특정 용도에 맞게 미세 조정하여 활용 가능
∙ 오픈소스 AI와 유사하지만, 반드시 오픈소스 라이선스를 따르는 것은 아니며 테스트 세트를 공개하지 않는 경우가 많고 학습 과정의 완전한 재현은 불가능
완전한 오픈소스는 아니지만 개방성을 표방하는 오픈 가중치 모델로 공유되는 모델들도 AI 기술의 재사용을 통해 AI 생태계를 확장하고 다양한 혁신과 발전에 기여하고 있음
기업들이 생성형 AI에 대해 오픈소스 전략을 채택하는 주요 이유는 독점적인 폐쇄형 AI 대비 개발 비용 절감이라는 장점이 있으며 기존 모델을 활용하여 빠르게 개발하여 연구 효율성이 향상됨
딥시크가 약 560만 달러(오픈AI 투자비용의 약 5.6%)라는 낮은 비용으로 GPT-4와 유사한 성능으로 개발(‘25.02, Deloitte)하여 업계의 주목을 받고 있음
오픈소스 AI는 다양한 연구 커뮤니티 및 개발자가 참여하여 기술 발전 속도를 가속화하고 있음
일부 기업들은 완전한 오픈소스가 아닌 오픈 가중치 모델을 제공하여 시장 점유율을 높이는 전략을 활용하고 있음
시사점
생성형 오픈소스 AI 연구 및 개발을 통해 투명성을 강화하고 공정한 경쟁 환경을 조성하기 위한 산업 내 협력 필요
기업과 연구기관 간 협력을 통해 오픈소스 AI 개발을 촉진하고, 공정한 경쟁 환경을 조성할 산업 내 협력 모델을 구축해야 함
생성형 AI 모델의 신뢰성 확보를 위해 데이터 품질 강화 및 윤리적·법적 기준을 반영한 오픈소스 AI 거버넌스 전략이 필요
생성형 AI 모델에서 학습 데이터의 품질이 핵심 요소이므로 개방성과 보안을 유지하면서 AI 기술의 책임 있는 활용을 보장해야 함
오픈소스 AI 생태계의 지속 가능성을 확보하기 위해 공공 데이터셋 구축, AI 연구 인프라 제공, 오픈소스 AI 모델 개발 지원 등 공공 연구기관과 정부 차원의 지원 필요
※ 참고 Reference
Introducing Llama 3.1: Our most capable models to date, Meta, 2024.07.23.
https://ai.meta.com/blog/meta-llama-3-1/
LLAMA 3.1 COMMUNITY LICENSE AGREEMENT,
https://huggingface.co/meta-llama/Llama-3.1-70B-Instruct/blob/main/LICENSE
The Ultimate Guide to Claude 3.5: Transforming Claude AI Interactions and Access, Claude AI HUB, 2024.6.29.
https://claudeaihub.com/claude-3-5-guide/#gsc.tab=0
OpenAI o3 explained: Everything you need to know, TechTarget, 2025.02.04.
https://www.techtarget.com/whatis/feature/OpenAI-o3-explained-Everything-you-need-to-know
Mixtral of experts, Mistral, 2023.12.11.
https://mistral.ai/en/news/mixtral-of-experts
Mixtral Overview,
https://huggingface.co/docs/transformers/model_doc/mixtral
DALL·E 3, OpenAI,
https://openai.com/index/dall-e-3/
Mastering Midjourney Discord with Midjourney.FM: Your Essential Guide to Free Access to Midjourney Features, Midjourney.Fm,
https://midjourney.fm/midjourney-discord
Midjourney Launches New Web Editor, Improving Workflow for Creators, Maginative, 2024.08.16.
https://www.maginative.com/article/midjourney-launches-new-web-editor-improving-workflow-for-creators/
Imagen, Google DeepMind,
https://deepmind.google/technologies/imagen-3/
'Stability-AI/sd3.5' Repository,
https://github.com/Stability-AI/sd3.5, https://huggingface.co/collections/stabilityai/stable-diffusion-35-671785cca799084f71fa2838
WaveNet launches in the Google Assistant, Google DeepMind, 2017.10.04.
https://deepmind.google/discover/blog/wavenet-launches-in-the-google-assistant/
WaveNet: A generative model for raw audio, Google DeepMind, 2016.09.08.
https://deepmind.google/discover/blog/wavenet-a-generative-model-for-raw-audio/
'openai/whisper' Repository,
https://github.com/openai/whisper/, https://huggingface.co/openai/whisper-large-v3
OpenVoice: Versatile Instant Voice Cloning, MyShell TTS,
https://research.myshell.ai/open-voice
'myshell-ai/OpenVoice' Repository,
https://github.com/myshell-ai/OpenVoice, https://huggingface.co/myshell-ai/OpenVoiceV2
Sora is here, OpenAI, 2024.12.09.
https://openai.com/index/sora-is-here/
OpenAI releases Sora AI video generator to public, Tech Xplore, 2024.12.09.
https://techxplore.com/news/2024-12-openai-sora-ai-video-generator.html
Introducing Make-A-Video: An AI system that generates videos from text, Meta, 2022.09.29.
https://ai.meta.com/blog/generative-ai-text-to-video/
Google launches AI-powered video editor Dreamix for creating and editing videos, and animating images, TechStartups, 2023.02.10.
https://techstartups.com/2023/02/10/google-launches-ai-powered-video-editor-dreamix-to-create-edit-videos-and-animate-images/
World-Class: NVIDIA Research Builds AI Model to Populate Virtual Worlds With 3D Objects, Characters, Nvidia, 2022.09.23.
https://blogs.nvidia.com/blog/3d-generative-ai-research-virtual-worlds/
DeepMind claims its new code-generating system is competitive with human programmers, VentureBeat, 2022.02.02.
https://venturebeat.com/ai/deepmind-claims-its-new-code-generating-system-is-competitive-with-human-programmers/
개발비 670조원 vs 80억원... 中 딥시크가 바꾼 글로벌 AI 지형도, 지디넷코리아, 2025.02.05.
https://zdnet.co.kr/view/?no=20250205152321
AI '환각'현상 극복…엉뚱한 답변 사라진다, 매일경제, 2025.02.09.
https://www.mk.co.kr/news/it/11236602
딥시크 R1, 타 AI 모델보다 해킹에 취약, 디지털투데이, 2025.02.10.
https://www.digitaltoday.co.kr/news/articleView.html?idxno=552587
Imagen 3: Google DeepMind가 공개한 최신 Text-to-Image 생성 모델, 파이토치 한국사용자모임, 2024.08.
https://discuss.pytorch.kr/t/imagen-3-google-deepmind-text-to-image/5053
“원하는 감정·억양 넣은 목소리 만든다”··· 마이쉘, 목소리 생성 오픈소스 알고리즘 공개, CIO Korea, 2024.01.02.
https://www.cio.com/article/3512056/%EC%9B%90%ED%95%98%EB%8A%94-%EA%B0%90%EC%A0%95%C2%B7%EC%96%B5%EC%96%91-%EB%84%A3%EC%9D%80-%EB%AA%A9%EC%86%8C%EB%A6%AC-%EB%A7%8C%EB%93%A0%EB%8B%A4%C2%B7%C2%B7%C2%B7-%EB%A7%8C%EC%9D%B4.html
구글, 3D 데이터 세트 없이 3D 이미지 생성하는 AI 모델 공개, AI타임스, 2022.10.05.
https://www.aitimes.com/news/articleView.html?idxno=147154
GitHub Copilot 소개, Microsoft,
https://learn.microsoft.com/ko-kr/training/modules/introduction-to-github-copilot/
스태빌리티 AI, 혁신적인 오픈소스 이미지 생성 모델 '스테이블 디퓨전 3.5' 공개, 인공지능신문, 2024.10.23.
https://www.aitimes.kr/news/articleView.html?idxno=32527
메타, '코드 라마 70B' 출시..."오픈 소스 최강, 더 길고 복잡한 코드 생성", AI타임스, 2024.01.30.
https://www.aitimes.com/news/articleView.html?idxno=156839
미스트랄, GPT-4의 'MoE' 방식 도입한 ‘믹스트랄 8x7B’ 공개, AI타임스, 2023.12.11.
https://www.aitimes.com/news/articleView.html?idxno=155775
Top Generative AI Models to Explore in 2025, 2025.01.20.
https://wowlabz.com/top-generative-ai-models/
Data Governance in Open Source AI (Enabling Responsible and Systemic Access), Alek Tarkowski, Open Future and Open Source Initiative, 2025.01.22.
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.