2025.09.22
|
○ 최근 맥킨지의 글로벌 조사 ‘AI 시대의 오픈소스 기술’에 따르면, 기업 리더와 개발자들은 비용 절감과 혁신 가속을 위해 오픈소스 솔루션을 더 많이 채택하고 있음 - 응답자의 50% 이상이 데이터, 모델, 툴 영역에서 오픈소스를 활용하고 있으며, 75%는 향후 오픈소스 활용을 늘릴 계획이 있다고 응답 - 오픈소스 AI 사용은 기술, 미디어, 통신 부문(70%)에서 가장 높으며, 경험이 풍부한 AI 개발자는 오픈소스를 사용할 가능성이 40% 더 높음 - 오픈소스 AI 채택의 주요 리스크는 보안 및 규정 준수, 지속적 지원 불확실성, 지적재산권에 대한 우려로 나타남 - 이러한 리스크를 완화하기 위해, AI 모델 기반 시스템을 구현할 때 리더들이 고려해야 할 네 가지 핵심 영역은 강력한 가드레일 구축, 표준화된 제3자 평가 SBOM 기반 문서화 및 취약점 추적, 사이버 보안 실천 방안 강화임 |
□ AI 기술 스택 전반에서 오픈소스 기술이 폭넓게 활용되고 있으며, 산업·기업 전반에 빠르게 확산 중
○ 생성형 AI가 기업과 사회 전반에 빠르게 확산하면서, 오픈소스 AI가 중요한 대안으로 급부상하는 가운데, 최근 맥킨지의 글로벌 조사 ‘AI 시대의 오픈소스 기술’에 따르면, 기업 리더와 개발자들은 비용 절감과 혁신 가속을 위해 오픈소스 솔루션을 더 많이 채택하고 있음
* ‘AI 시대의 오픈소스 기술(Open source technology in the age of AI)’ 보고서는 맥킨지, 모질라 재단, 패트릭 J. 맥거번 재단에서 전 세계 41개국 700명 이상의 기술 리더와 의사결정자들을 대상으로 한 오픈소스 AI 활용 실태와 인식에 대한 조사 보고서
- 오픈소스 AI 모델 환경은 2024년 크게 성장, 많은 오픈소스 모델이 출시되며 상용 모델과의 성능 격차도 줄이고 있어, 앞으로도 지속적으로 더 많은 모델이 오픈소스로 공개될 것으로 전망
- EleutherAI, Hugging Face, OpenMined 같은 오픈소스 이니셔티브가 상당한 성과를 거두며, 더 많은 사람들이 함께 참여할 수 있는 AI 개발 흐름을 만들어내면서, AI의 접근성과 개방성을 크게 높임
- 오픈소스 모델은 투명성과 커뮤니티 혁신에서는 강점을 보이지만, 상용 시스템의 대규모 훈련 인프라와 빠른 반복 주기 측면에서 여전히 한계와 과제를 안고 있음
○ ‘AI 시대의 오픈소스 기술’ 보고서를 바탕으로 오픈소스 AI의 주요 사용 동향과 가치를 분석
|
※ 월간 브리핑 내 용어 정의 - 본문에서는 OSAI와 오픈 모델을 구분하지 않고 ‘오픈소스 AI’라는 용어로 통일하여 작성 - Open Source Technology in the Age of AI (맥킨지·모질라 재단, 2025) 보고서에서는 OSI 표준을 충족하는 기술과 OSI 표준을 충족하지 않지만 일부 오픈 요소를 가진 도구(예: 오픈 웨이트 모델, OSI에서 승인하지 않은 오픈소스 라이선스를 가진 소프트웨어)는 부분적으로 오픈된 것으로 간주하여 모두 오픈소스 항목으로 포함하여 작성 |
▶ 오픈소스 AI 사용 및 동향
- 응답자의 50% 이상이 데이터, 모델, 툴 영역에서 오픈소스를 활용하고 있으며, 75%는 향후 오픈소스 활용을 늘릴 계획이 있다고 보고
- 오픈소스 AI 사용은 기술, 미디어, 통신 부문(70%)에서 높은 수준을 보이며, 경험이 풍부한 AI 개발자는 오픈소스를 사용할 가능성이 40% 더 높음
* 기술 성숙도와 개발자 경험이 오픈소스 사용에 영향을 주고 있음을 시사
- AI 기술 스택은 오픈소스와 상용 컴포넌트 모두를 사용하여 구축 가능
[그림 ] AI 기술스택
* AI 기술 스택은 단순히 모델만이 아니라 데이터 → 모델 → 수정 → 배포 인프라 → API 처리 → 최종 사용자 경험으로 이어지는 전체 구조를 설명하며, 오픈소스와 상용 기술이 함께 조합되어 사용될 수 있음을 강조하고 있음
- 오픈소스 AI 솔루션은 기술 스택 전반에 걸쳐 상당히 많이 사용되고 있으며, 모델(63%)과 툴(59%)에서 사용 비율이 가장 높게 나타남
[그림 2] 기술 스택 영역별 오픈소스 AI 솔루션 사용 비율
- AI 모델은 폐쇄형에서 완전 오픈형까지 다양한 스펙트럼을 이루고 있음
|
구분 |
수준 |
설명 |
예시 |
|
Closed (폐쇄형) |
Level 1 |
[내부] - 엄격히 통제, 외부 접근 제한적 또는 불가 |
Gemini Ultra (초기) |
|
Level 2 |
[외부 접근(API 등) 가능] - 전체 가중치 및 학습 정보 비공개 (가중치는 오픈소스 아님) |
GPT-4(API), Claude |
|
|
Partially Open (부분 오픈형) |
Level 3 |
[오픈 웨이트 모델] - 코드와 데이터는 제한적이거나 비공개 |
Llama 3, Llama 4 |
|
Level 4 |
[오픈 웨이트 + 지원 자료(예: 코드)를 사용] - OSI 오픈소스 정의 미충족 (예: 비승인 라이선스, 불충분한 데이터) |
Command R+ (Cohere), Stable Diffusion 2 |
|
|
Open (오픈형) |
Level 5 |
[OSI 오픈소스 AI 정의 충족] - 소스 코드 공개, 수정 허용, 재배포 제한 없음, 기술 중립적 |
Bloom (BigScience) |
|
Level 6 |
[OSI 기준 초과] - 데이터까지 공개적으로 사용 가능 |
Pythia (EleutherAI), |
|
구분 |
수준 |
응답 비율 (%) |
|
Closed (폐쇄형) |
Level 1 |
15% |
|
Level 2 |
19% |
|
|
Partially open (부분 오픈형) |
Level 3 |
31% |
|
Level 4 |
27% |
|
|
Open (오픈형) |
Level 5 |
19% |
|
Level 6 |
8% |
- 대부분의 기업들이 부분 오픈형(Level 3, 4) AI 모델 사용을 선호
- 오픈 웨이트 모델이 자체 인프라에 호스팅될 수 있기 때문에 기업 리더의 40%가 선호
- 기업 자체 인프라에 호스팅된 AI 모델의 경우, 오픈소스 모델이 더 접근하고 실행하기 쉽다고 판단
- 기업들이 가장 많이 사용되는 오픈소스 AI 모델은 Meta Llama(61%), Google Gemma(40%), Mistral(32%), Microsoft의 Phi(28%) 순임
- 가장 인기있는 오픈소스 AI 툴은 PyTorch(58%), TensorFlow(57%), PostgreSQL(45%), LangChain(33%) 순임
- 에이전트 개발로의 전환이 이루어지면서, 오픈소스 에이전트 프레임워크 및 평가 라이브러리를 제공하는 도구들이 더 많은 주목을 받을 것으로 전망
▶ 오픈소스 AI에 대한 산업별·지역별 차이
- 산업별로 오픈소스 AI 활용률을 살펴보면, 기술·미디어·통신 분야는 70%의 높은 활용률을 보였으며, 전체 응답자 중 가장 많은 비중(260명)을 차지해 산업 전반의 오픈소스 도입 흐름을 가장 잘 반영하는 분야임
- 반면, 공공부문(52%), 헬스케어 및 생명과학(51%)이 비교적 낮은 활용률을 기록
- 지역별로는 인도(77%), 영국(66%), 미국(62%)이 오픈소스 AI 활용을 선도하는 반면, 프랑스(56%), 브라질(46%)은 상대적으로 낮은 활용률을 보임
[그림 3] 오픈소스 AI 모델 사용률(지역 및 산업별)
▶ 기업과 개발자 관점에서 오픈소스 AI의 가치
- 오픈소스 AI는 성능 및 사용 편의성에서 높은 만족도와 함께 기업의 실질적인 가치 실현(매출 증가나 비용 절감)을 동시에 실현하고 있는 기술
* 오픈소스를 사용하는 응답자 중 ‘만족’이라고 답한 비율은 ‘불만족’ 응답자보다 10배 이상 많았음
* 비용 측면에서 구현 비용 절감(60%), 유지 비용 절감(46%), 소프트웨어 툴 비용 절감(51%) 등의 이점이 있다고 응답
* 오픈소스 AI가 자주 사용되는 영역은 IT, 소프트웨어 엔지니어링, 제품/서비스 개발이며, 서비스 운영에서 오픈소스 AI가 상용 솔루션보다 6% 더 높은 매출 성장 기록
- AI 시스템 개발 경험이 많은 개발자일수록, 오픈소스 AI 모델을 정기적으로 사용하는 비율이 높게 나타남
* 10개 이상 프로젝트 참여한 개발자의 94%가 오픈소스 AI 모델을 정기적으로 사용
- 전체 개발자의 81%는 오픈소스 AI 툴 경험이 업계에서 높게 평가된다고 인식했으며, 42%는 오픈소스 AI 툴 경험이 상용 툴보다 더 가치 있다고 응답
- 66%의 개발자는 오픈소스 AI 툴 경험이 직무 만족도에 중요하다고 답변
▶ 오픈소스 AI의 주요 리스크 및 대응 전략
- AI 리스크에 대한 인식은 오픈소스 AI 툴이 상용 AI보다 더 위험하다고 여겼으며, 가장 우려되는 리스크는 사이버 보안(62%), 규제 준수(54%), 지적 재산권(50%) 이라고 인식
- 국가별로 살펴보면, 프랑스와 영국은 사이버 보안(64%)을 강조하고, 인도는 규제 준수(70%)와 지적재산권 침해(63%)에 민감하며, 미국은 사이버 보안(60%), 지적재산권(55%)과 정확성(50%) 등을 중시
- 공통적으로 규제·보안·지적재산권을 주요 리스크로 인식하지만, 특정 국가에서는 환경·정확성·공정성 등의 요소도 강조됨
* 브라질은 사이버보안(68%)이 글로벌 평균(62%)보다 높으며 환경적 위험에 대한 인식(8%)은 약하며 프랑스와 영국은 환경 영향(25%, 22%)에 대해 다른 국가보다 친환경 관련 인식이 강함
* 설명 가능성(Explainability)에 대한 우려는 인도와 미국에서 각각 30%로, 글로벌 평균(24%)보다 다소 높은 것으로 보아 복잡한 AI 모델의 투명성 문제를 상대적으로 더 중시함을 시사
|
리스크 유형 |
글로벌 평균 |
브라질 |
프랑스 |
인도 |
영국 |
미국 |
|
사이버보안 |
62% |
68% |
64% |
61% |
64% |
60% |
|
규제 준수 |
54% |
47% |
43% |
70% |
64% |
42% |
|
지적재산권 침해 |
50% |
49% |
46% |
63% |
43% |
55% |
|
개인정보보호 |
46% |
56% |
46% |
52% |
41% |
43% |
|
부정확성 |
44% |
42% |
40% |
42% |
48% |
50% |
|
조직 평판 |
36% |
32% |
29% |
44% |
38% |
33% |
|
설명 가능성 |
24% |
8% |
21% |
30% |
19% |
30% |
|
형평성·공정성 |
23% |
16% |
20% |
34% |
20% |
28% |
|
국가 안보 |
17% |
12% |
14% |
22% |
22% |
16% |
|
환경 영향 |
15% |
8% |
25% |
12% |
22% |
15% |
|
노동력 대체 |
11% |
12% |
4% |
15% |
10% |
13% |
|
정치적 안정성 |
8% |
10% |
7% |
8% |
9% |
5% |
- 조사한 대부분의 개발자들은 오픈소스 AI를 위험하다고 생각하지만, 위험 인식은 개발자의 경험에 따라 달라짐
* 6개 이상의 AI 시스템 개발에 기여한 숙련된 개발자들은 오픈소스 AI에 훨씬 더 익숙하며, 지적 재산권 침해(11%↓), 사이버 보안(15%↓), 규제 준수(11%↓) 측면에서 오픈소스가 더 위험하다고 인식할 가능성도 상대적으로 낮음
- 오픈소스 AI 채택의 주요 리스크는 보안·규제, 지속적 지원 부족, 지적재산권 문제이며, 기술적 성숙도, 인재 확보, 기존 시스템과의 통합 역량도 채택 여부에 영향을 주는 요인으로 작용
- 이러한 리스크를 완화하고 안전하게 AI 모델 기반 시스템을 구현하기 위해 리더들은 강력한 가드레일 구축, 표준화된 벤치마크 기반 제3자 평가, SBOM(소프트웨어 구성 목록) 기반 문서화 및 취약점 추적, 사이버 보안 실천 방안 강화 등의 전략을 고려해야 함
|
영역 |
핵심 내용 |
|
가드레일 (Guardrails) |
책임 있는 사용과 안전한 결과 보장을 위한 강력한 가드레일을 구축하여 규제 및 윤리 기준 준수 (오픈소스 예 : NeMo Guardrails, Llama Guard, Guardrails AI) |
|
제3자 평가 (Third-party evaluations) |
정기적이고 표준화된 벤치마크 평가를 수행하여 오픈 모델의 리스크 최소화 및 신뢰 확보 |
|
문서화 및 모니터링 (Documentation and monitoring) |
운영 환경에서 소프트웨어 구성 목록(SBOM)을 기반으로 취약점 및 불일치 추적 (예 : CVSS(공통 취약점 평가 시스템) 활용하여 점검) |
|
사이버보안 관행 (Cybersecurity practices) |
데이터 프라이버시와 시스템 무결성 보호를 위한 운영 보안 실천 방안 강화 (예 :TEE(신뢰 실행 환경)에서 모델을 실행, 차등 프라이버시와 연합 학습 기법 활용, 보안 사고의 지속적 모니터링 등) |
▶ 오픈소스 AI의 미래 전망
- 오픈소스 모델은 협업을 통한 혁신 가속, 중복 개발 감소, 생태계 전반의 기술 진보를 촉진하며 두 가지 주요 AI 기술 트렌드에 영향을 줄 것으로 전망
◆ (SLM) 프라이버시 중심 엣지 애플리케이션과 온디바이스 인텔리전스를 가능하게 하는 소형언어모델은 산업별 특화된 비용 효율적 언어 모델 및 도메인 특화 툴로 확장
* 예시 : 엣지 AI 제품 OEM의 니즈를 충족시키는 Qualcomm AI Hub, 개별 고급 사용자의 PC에서 오픈소스 모델을 배포.실행할 수 있는 프레임워크와 툴을 지원하는 Ollama 등
◆ (추론 모델) 추론 시 더 높은 연산을 활용해 복잡한 작업을 수행하는 모델로 초기에는 OpenAI의 o1과 같은 상용 모델이 주도했지만, DeepSeek-R1, Alibaba, Hugging Face의 Smolagents 등 오픈소스 대안도 빠르게 등장
- 오픈소스 AI는 개발자 경험 개선, 모듈화된 아키텍처 구성, 커뮤니티 기반 혁신을 통해 기업이 프라이버시, 지연 시간, 성능 요구에 따라 AI를 엣지 또는 클라우드에 유연하게 배포 가능하도록 함
- 이러한 운영 모델과 아키텍처의 유연성은 급변하는 환경 속에서 더욱 가치 있는 특성으로, 회복력 있는 AI 시스템을 구축하는 데 기여
- 클라우드와 소프트웨어 산업에서 관찰된 것처럼, 오픈소스와 상용 기술을 병행하는 하이브리드 접근이 주류가 될 전망임
□ 시사점
○ 오픈소스 기술은 AI 기술 스택 전반에서 핵심 기반으로 자리잡으며, 산업과 기업의 AI 전략에서 중심적인 역할을 하고 있음
○ 오픈소스 AI는 협업 중심의 혁신을 이끌며, 개발자 경험을 중시하는 기술 인재를 끌어들이는 데에도 긍정적 효과가 있음
○ AI 시스템 구축에 있어 보안·규제·지속가능성과 같은 리스크에 대응하기 위한 체계적인 전략 마련이 필수적임
|
※ 참고문헌 Reference
· Open source technology in the age of AI, McKinsey & Company, the Mozilla Foundation, and the Patrick J. McGovern Foundation, 2025.04.22. |
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.
* 표시는 필수 입력 사항입니다.