2024.12.16
AI 시대의 오픈소스 개발자 생태계: GitHub Octoverse 2024 분석
- Open UP -
전 세계적으로 생성형 AI 활동이 급증하고 있으며, 개발자들은 코드 생성 이상의 다양한 분야에서 AI 도구와 모델을 활용
생성형 AI 프로젝트에 대한 기여가 59% 급증, 전체 프로젝트 수는 98% 증가
아프리카, 라틴아메리카, 아시아 지역에서 개발자 수가 빠르게 증가하고 있음
비영어권의 인구 밀도가 높은 지역에서의 개발자 커뮤니티 부상은 생성 AI 도구의 확산과 동시에 일어나고 있다는 점 주목
AI가 코드 학습과 소프트웨어 개발을 쉽게 만들어 더 많은 사람들이 개발자가 되도록 돕고 있음을 시사
2024년은 AI, IoT, 블록체인 등의 기술이 오픈소스 기여를 주도하며 다양한 프로젝트가 활발히 성장
전 세계 개발자들은 GitHub의 오픈소스에 약 10억 건의 기여를 기록
Python은 머신러닝, 데이터 과학, 과학 컴퓨팅, 홈 자동화 등 다양한 분야에서 널리 사용되며 가장 많이 사용되는 언어로 등극
이는 생성형 AI 붐과 데이터 분석, Jupyter Notebook 사용 증가가 주요 원인
AI와 오픈소스, 소프트웨어 개발 생태계 혁신하고 전 세계 개발자 커뮤니티의 다양성과 협력을 촉진
AI가 급속히 확대되면서 개발자들은 AI 모델을 애플리케이션에 통합하고 다양한 AI 프로젝트에 참여하여 오픈소스 프로젝트에 기여하고 있음
개발자와 AI, 글로벌 오픈소스 커뮤니티와의 상호작용 및 시너지에 대해 2024 GitHub Octoverse 보고서를 통해 주요 트렌드를 분석
2024년 주요 트렌드

글로벌 생성형 AI의 급격한 성장
전 세계적으로 생성형 AI 활동이 급증하고 있으며, 개발자들은 코드 생성 이상의 다양한 분야에서 AI 도구와 모델을 활용
GitHub Copilot과 같은 AI 도구의 사용이 증가하고 있으며, 오픈소스 응답자의 73%가 코딩이나 문서화에 이러한 도구를 사용한다고 보고
생성형 AI 프로젝트에 대한 기여가 59% 급증, 전체 프로젝트 수는 98% 증가
미국이 생성형 AI 프로젝트에 대한 기여를 선도하고 있으나 기여 활동량의 많은 부분은 인도, 독일, 일본, 싱가포르에서 진행
2024년 생성형 AI 현황 분석
2024년 모든 생성형 AI 프로젝트에 대한 총 기여도 거의 60% 증가

[그림] GitHub 내 생성 AI 프로젝트 수
2024년 공개 및 오픈소스 신규 생성형 AI 프로젝트가 7만개 이상 생성, 전년 대비 98% 증가
AI 모델이 개발자 기술 스택의 핵심 부분으로 자리잡고 있으며, 생성형 AI의 역할이 코드 작성 지원에서 애플리케이션 개발의 주요 구성 요소로 확장되고 있음
2024년 기여자 수 기준으로 가장 빠르게 성장하는 오픈소스 AI 프로젝트가 ollama/ollama 임
이는 개발자들이 성능이 좋고 컴퓨팅 비용이 낮은 소형 AI 모델을 선호하고 로컬에서 실행되는 LLM에 대한 관심이 증가하고 있음을 시사
앞으로 더 작고 효율적인 AI 모델로 변화하며 더 많은 개발자가 애플리케이션에서 모델을 사용할 것으로 예상
생성형 AI 프로젝트 Top 10
이미지 생성(AUTOMATIC1111/stable-diffusion-webui)과 AI 에이전트 개발(Significant-Gravitas/AutoGPT)에 대한 관심이 지속되고 있음
프로세스 자동화를 위한 AI 에이전트 개발이 여전히 중요한 영역임을 나타냄
| 2023년 대비 2024년 상위 10개 공공 생성 AI 프로젝트 | ||
|---|---|---|
| No. | 2023 | 2024 |
| 1 | AUTOMATIC1111/stable-diffusion-webui | AUTOMATIC1111/stable-diffusion-webui |
| 2 | Significant-Gravitas/AutoGPT | Significant-Gravitas/AutoGPT |
| 3 | ChatGPTNextWeb/ChatGPT-Next-Web | ollama/ollama |
| 4 | Chanzhaoyu/chatgpt-web | nomic-ai/gpt4all |
| 5 | ggerganov/llama.cpp | binary-husky/gpt_academic |
| 6 | binary-husky/gpt_academic | comfyanonymous/ComfyUI |
| 7 | oobabooga/text-generation-webui | run-llama/llama_index |
| 8 | lencx/ChatGPT | Chanzhaoyu/chatgpt-web |
| 9 | lm-sys/FastChat | chatchat-space/Langchain-Chatchat |
| 9 | huggingface/diffusers | open-webui/open-webui |
소규모 및 오픈소스 AI 모델에 대한 관심이 증가하고 있음
binary-husky/gpt_academic 등 학술 연구와 같은 특수 목적의 AI 도구 개발에 대한 관심 증가
국가별 생성형 AI 프로젝트에 대한 기여 및 기여자의 성장률

[그림] 국가별 생성형 AI 기여 순위 Top 10

[그림] 국가별 생성형 AI 기여자 순위 Top 10
미국, 홍콩 특별행정구, 인도, 독일, 프랑스가 생성형 AI 프로젝트 기여를 주도
인도는 생성형 AI 프로젝트에 대한 기여가 전년 대비 95% 증가, 프랑스는 70% 증가
네덜란드, 에티오피아, 코스타리카, 세르비아, 베트남 등의 국가에서 생성형 AI 프로젝트 기여자 수가 크게 증가
이러한 성장은 소형 언어 모델의 도입으로 AI로 소프트웨어를 개발하는 데 필요한 컴퓨팅 요구 사항이 줄어들고 있음
생성형 AI 코딩 도구기 언어 장벽을 낮춰 전 세계 개발자들의 프로젝트 기여를 촉진할 것으로 예상
생성형 AI 기여자가 많은 지역과 기여 수가 많은 지역을 비교해보면, 전 세계적으로 성장세가 여전히 지속되고 있지만 개발자 수가 더 많은 지역이 상위권으로 부상
전 세계 개발자 수의 급격한 증가
아프리카, 라틴아메리카, 아시아 지역에서 개발자 수가 빠르게 증가
인도는 2028년까지 세계에서 가장 많은 개발자를 보유할 것으로 예상되며 브라질의 개발자 커뮤니티도 빠르게 성장 중
AI가 사람들이 더 쉽게 코드를 배우고 소프트웨어를 빠르게 구축할 수 있도록 돕는 것뿐만 아니라, 더 많은 사람들이 개발자가 되도록 유도하고 있음
Copilot 무료액세스 프로그램을 통해 학생, 교사, 오픈소스 유지 관리자의 연간 사용자 수가 100% 증가
2024년 개발자 커뮤니티 성장 분석
전 세계 개발자들은 5.2억 개 이상의 프로젝트에 52억 건 이상의 기여
깃허브에서 전 세계적으로 가장 많은 개발자 보유 국가는 미국이며, 개발자가 가장 많이 증가한 국가는 인도이며, 브라질, 나이지리아도 빠르게 성장 중임
이는 언어적으로 다양한 인구를 가진 각 대륙에서 가장 인구가 많은 지역임
비영어권의 인구 밀도가 높은 지역에서의 개발자 커뮤니티 부상은 생성형 AI 도구의 확산과 동시에 일어나고 있다는 점 주목
생성형 AI 도구는 개발자가 자연어로 코드에 참여할 수 있도록 더 많은 도움을 줌
신규 저장소는 총 1억 8백만개 생성
지난 2019~2024년 국가별 개발자 커뮤니티 Top 10

[그림]국가별 개발자 커뮤니티 Top 10
상위 20개 개발자 커뮤니티에서 주목할 점은 필리핀(#18)이 호주(#19)를 추월하고 파키스탄(#20)이 폴란드(#21)를 추월하였음
향후 5년 동안 가장 높은 성장 잠재력을 살펴보면 인도는 2028년까지 깃허브 개발자 수에서 미국을 앞지를 것으로 예측됨
현재 성장률을 기반으로 예측
개발자 커뮤니티의 대륙별 증가율
아시아 태평양 지역
아시아 태평양 커뮤니티에서 깃허브의 개발자 수는 전 세계적으로 가장 빠른 속도로 증가하고 있으며, 이러한 추세는 계속될 것으로 예상
특히 생성형 AI가 개발자가 말하는 언어와 관계없이 코드와 커뮤니티에 참여할 수 있는 권한을 점점 더 강화하고 있음
아시아 태평양 주요 국가의 기술 및 정부 정책 분석
[아시아 태평양 지역 주요 기술 및 정책 특징]
| 국가 | 주요 기술 및 정책 특징 |
|---|---|
| 인도 |
|
| 싱가포르 |
|
| 일본 |
|
| 한국 |
|
유럽 및 중동 지역
지난 5년 동안 유럽 연합은 디지털 서비스법, 디지털 시장법, AI법, 데이터 거버넌스법을 포함하여 기술 및 플랫폼 공급자와 생성형 AI를 규제하기 위한 여러 프레임워크와 법률을 제시
중동 국가들은 글로벌 AI 허브가 되고자 AI에 투자하고 있음
유럽 및 중동 주요 국가의 기술 및 정부 정책 분석
[유럽 및 중동 지역 주요 기술 및 정책 특징]
| 국가 | 주요 기술 및 정책 특징 |
|---|---|
| 네덜란드 |
|
| 스페인 |
|
| 프랑스 |
|
| 스위스 |
|
| 터키 |
|
| 아랍에미리트 |
|
라틴 아메리카 지역
라틴 아메리카 국가의 기술 부문은 주로 오픈 뱅킹, 클라우드 기반 인프라, AI에서 급성장함
라틴 아메리카 주요 국가의 기술 및 정부 정책 분석
[라틴 아메리카 지역 주요 기술 및 정책 특징]
| 국가 | 주요 기술 및 정책 특징 |
|---|---|
| 페루 |
|
| 브라질 |
|
| 멕시코 |
|
아프리카 지역
아프리카는 차세대 기술 기업가 정신을 주도할 준비가 된 개발자 풀을 점점 더 많이 육성하고 있음
개발자들은 Open Source Community Africa 및 All In Africa와 같은 이니셔티브를 통해 오픈소스 커뮤니티를 육성
아프리카 지역의 주요 국가의 기술 및 정부 정책 분석
[아프리카 지역 주요 기술 및 정책 특징]
| 국가 | 주요 기술 및 정책 특징 |
|---|---|
| 케냐 |
|
| 나이지리아 |
|
| 남아프리카공화국 |
|
| 이집트 |
|
| 아프리카 빅 4 |
|
| 모로코 |
|
기타 지역
2024년에 남극과 같은 외딴 지역에서의 개발자 활동은 깃허브 개발자의 연간 성장률 379%로 19명에서 91명으로 증가하였우며 이 지역의 활동은 주로 과학 연구와 해양 과학에 집중되어 있음
2024년 오픈소스 현황 분석
2024년은 AI, IoT, 블록체인 등의 기술이 오픈소스 기여를 주도하며 다양한 프로젝트가 활발히 성장하면서 전 세계적으로 오픈소스 활동과 소비가 증가하고 생태계가 성숙해지고 있음
2024년 전 세계 개발자들은 GitHub의 오픈소스 및 공개 저장소*에 약 10억 건의 기여를 기록
Open Source Initiative에서 승인한 라이선스가 있는 오픈소스 프로젝트와 라이선스가 없는 공개 프로젝트가 포함
이러한 기여는 인기 프로젝트(home-assistant/core), 생성형 AI 프로젝트(ollama/ollama), 상업적으로 지원되는 프로젝트(vercel/next.js) 등 다양
상업적 지원 프로젝트와 생성형 AI 프로젝트가 가장 많은 기여를 유도하였으며 북미와 유럽 외 지역에서 활동 급증한 점이 주요 특징
주요 생태계(예: JavaScript)가 성숙함에 따라 오픈소스를 사용하는 개발자도 증가
npm 레지스트리를 통한 JavaScript 패키지 사용량이 15% 증가했으며 상위 50개 패키지는 순성장 기록
오픈소스 프로젝트에 처음으로 기여하는 개발자 수는 계속 증가
전 세계적으로 140만 명의 신규 개발자가 오픈소스에 참여
대부분 상업적 지원 프로젝트와 생성형 AI 프로젝트에 기여
거절된 풀 리퀘스트의 증가는 없었으며, 새로운 기여자가 증가했음에도 높은 수준의 품질을 유지하고 있음을 시사
2024년 GitHub에서 가장 많은 신규 기여자를 유치한 상위 10개 오픈소스 및 공개 프로젝트
| 순위 | 프로젝트 | Repository |
|---|---|---|
| 1 | Visual Studio Code | microsoft/vscode |
| 2 | Home Assistant | home-assistant/core |
| 3 | Microsoft PowerToys | microsoft/PowerToys |
| 4 | Minecraft Java to Bedrock Converter | Kas-tle/java2bedrock.sh |
| 5 | Ultralytics YOLO11 | ultralytics/ultralytics |
| 6 | Flutter | flutter/flutter |
| 7 | LangChain | langchain-ai/langchain |
| 8 | Ultimaker Cura | Ultimaker/Cura |
| 9 | PlatformIO Home | platformio/platformio-home |
| 9 | Zigbee2MQTT | Koenkk/zigbee2mqtt |
2024년 GitHub에서 기여자 수 기준 상위 오픈소스 프로젝트
| No. | 프로젝트 | 기여자 수수 |
|---|---|---|
| 1 | home-assistant/core | 20,000명 이상 |
| 2 | ProvableHQ/leo | 20,000명 이상 |
| 3 | ProvableHQ/leo | 20,000명 이상 |
| 4 | firstcontributions/first-contributions | 13,000명 이상 |
| 5 | flutter/flutter | 10,000명 이상 |
| 6 | NixOS/nixpkgs | 9,000명 이상 |
| 7 | vercel/next.js | 9,000명 이상 |
| 8 | langchain-ai/langchain | 8,000명 이상 |
| 9 | godotengine/godot | 7,000명 이상 |
| 9 | ollama/ollama | 7,000명 이상 |
home-assistant/core와 flutter/flutter는 기여자 수 기준 상위 프로젝트로 커뮤니티 강점과 인기를 유지, 특히 vercel/next.js가 전체 기여자 상위 10위 목록에 다시 등장하며, 웹 개발 분야에서의 지속적인 성장과 위상을 나타냄
ultralytics/ultralytics, langchain-ai/langchain, NixOS/nixpkgs 등의 프로젝트는 대형 언어 모델(LLMs) 및 클라우드 네이티브 개발 방식의 확산 반영
ollama/ollama는 기여자 증가로 PyTorch와 PowerToys를 제치며 세 번째로 빠르게 성장하는 프로젝트로, 컴퓨팅 자원 소모가 적은 AI 모델에 대한 관심 반영
새롭게 주목받는 프로젝트로 실내 온도와 같은 데이터를 가져오는 데 사용될 수 있는 IoT 프로젝트인 koenkk/zigbee2mqtt가 포함되었으며 home-assistant/core의 인기와 관련될 가능성 있음
프로그래밍 언어 프로젝트 ProvableHQ/leo가 처음으로 기여자 기준 상위 오픈소스 프로젝트 목록에 포함되었는데 주로 블록체인 기반 비공개 응용 프로그램 개발에 사용 정적 타입 언어
가장 인기 있는 프로그래밍 언어 분석
Python은 머신러닝, 데이터 과학, 과학 컴퓨팅, 취미 프로젝트, 홈 자동화 등 다양한 분야에서 널리 사용되며 GitHub에서 가장 많이 사용되는 언어로 등극
Python 사용량의 증가는 전통적인 소프트웨어 개발자뿐 아니라 STEM 분야에서 오픈소스 커뮤니티에 참여하는 사람들이 늘어난 것과 관련이 있음
STEM은 과학(Science), 기술정보 (Technology), 공학(Engineering), 수학(Mathematics)의 약자

[그림]인기 프로그래밍 언어 Top 10
여전히 Python, JavaScript, TypeScript, Java가 가장 널리 사용되는 언어임
Python은 Jupyter Notebooks와 함께 지속적인 성장, GitHub의 활동이 기존 소프트웨어 개발을 넘어 확장되고 있음을 시사
Jupyter Notebooks의 사용률은 생성형 AI와 머신러닝에 대한 연구가 활발해지면서 2022년부터 170% 이상 급증, 작년 이후에만 92% 증가
이는 데이터 과학, AI, 머신러닝, 학계 등에서 GitHub 사용이 증가한 것을 나타냄
TypeScript는 2014-2019년 동안 급성장한 이후, 작년에 Java를 제치고 GitHub의 상위 3대 언어로 진입
JavaScript는 코드 푸시에서는 여전히 1위를 차지하고 있으며, npm 패키지 소비량에서 연간 15% 증가라는 강력한 성장세를 보이고 있음
Rust 등 시스템 프로그래밍 언어는 안전성, 성능, 생산성 등으로 인해 성장세 지속

[그림] 빠르게 성장중인 프로그래밍 언어 Top 10
원래 Rust는 C와 C++에 대한 안전한 대안으로 의도되었으나 Rust의 채택률이 폭발적으로 증가
Microsoft Windows와 같은 애플리케이션이 코어 라이브러리를 Rust를 사용하여 메모리 안전 코드로 다시 작성
새롭게 부상하는 언어와 인기 언어를 확인해보면 개발자라는 개념이 소프트웨어 개발자를 넘어 운영이나 IT 개발자, 머신 러닝 연구자, 데이터 과학자, 학생, 교사, 수학자 등의 역할로 확장
HCL과 Go의 지속적인 인기는 운영 및 IaC 작업, 특히 클라우드 네이티브 인프라 관리에 대한 성장세를 반영
HCL은 연간 25% 성장하며 선언형 언어를 통한 클라우드 배포 관리에서 주목받음
IaC 채택 증가는 개발자들이 클라우드 배포의 표준화를 촉진하고 있음을 시사
HCL과 Go, Dockerfiles의 인기는 개발자들이 클라우드 네이티브 애플리케이션에서 작업을 확장하고 있음을 시사
시사점
개발자 수가 증가하는 국가(인도, 브라질, 나이지리아 등)에서의 활발한 활동은 다양한 문화와 배경의 아이디어가 글로벌 소프트웨어 개발에 기여할 것으로 기대
AI 기반 도구의 보편화로 프로그래밍에 대한 진입 장벽이 낮아, 더 많은 사람들이 소프트웨어 개발에 참여할 수 있게 되고 개발자 커뮤니티의 다양성과 규모가 지속적으로 확대될 것으로 기대
AI, 클라우드, IoT, 블록체인 등 다양한 오픈소스 프로젝트의 성장은 개발자들이 혁신적인 기술을 더욱 쉽게 활용할 수 있도록 돕고, 협업 환경을 강화하여 소프트웨어 개발의 효율성과 품질을 향상시킬 것
주목할 만한 월간 이슈(12월)
(AI) 엔씨소프트, 한국어 특화 오픈소스 비전언어모델(VLM) 공개
엔씨소프트는 한국어 특화 중소형 오픈소스 비전언어모델(VLM) 모델 ‘바르코-비전(VARCO-VISION)’ 공개
VLM은 자연어와 이미지를 활용해 입력값(프롬프트)을 넣을 수 있는 언어모델로 현재 오픈소스로 공개된 대부분 VLM 중 한국어 지원 모델은 소수에 불과
바르코-비전은 한글과 영어 프롬프트, 이미지 입력 값을 이해할 수 있는 중소형 모델이며 오픈소스로 공개
대형언어모델(LLM)과 유사한 수준의 언어 능력을 보유하고 있어, LLM과 VLM 두개를 따로 운용하지 않고 단일 모델 만으로 이미지-텍스트 작업과 텍스트 전용 작업을 모두 처리 가능
엔씨소프트는 ▲OCR ▲그라운딩 ▲레퍼링 등 이미지를 인식 및 추론하는 비전 태스크에서도 뛰어난 결과값을 제공한다고 설명
이 모델을 활용하면 ▲이미지 인식 및 질의응답 ▲이미지 설명 ▲글자인식(OCR) ▲사물 위치 검출(그라운딩) 기능을 활용한 각종 멀티모달 AI 서비스를 개발 가능
엔씨소프트가 개발 중인 ‘바르코 스튜디오(VARCO Studio)’에도 이를 적용할 예정
(리눅스) 네이버클라우드, 무료 리눅스 배포판 ‘네빅스’ 공개
네이버클라우드는 오픈 엔터프라이즈 리눅스 협회(Open Enterprise Linux Association, OpenELA)의 프레임워크를 기반으로 개발된 무료 리눅스 배포판인 ‘네빅스’ 공개
네이버 인프라에 직접 적용해 운영하고 관리하면서 엔터프라이즈에 최적화된 안정적인 개발 환경을 제공
팀네이버 인프라의 15%를 네빅스 기반으로 안정적으로 운영하고 있으며, 향후 점진적으로 적용 범위를 확대한다는 계획
장기적인 기술 지원과 업데이트를 보장해 안정적인 개발 환경을 제공함으로써 갑작스러운 기술 지원 종료, 유료 전환 등과 같은 문제점을 해소하고 기업의 리눅스 활용 확산을 주도한다는 방침
누구나 소스코드에 접근해 소프트웨어를 자유롭게 수정하고 배포할 수 있도록 해 기업과 개발자들에게 기술 혁신과 성장의 기회를 제공하는 것이 목표
※ 참고 Reference
Octoverse: AI leads Python to top language as the number of global developers surges, Github Blog, 2024.10.29.
https://github.blog/news-insights/octoverse/octoverse-2024/
네이버클라우드, 지속 가능 무료 리눅스 배포판 '네빅스' 공개, 아시아경제, 2024.12.09.
https://view.asiae.co.kr/article/2024120909381093731
NC, 한국어 특화 오픈소스 VLM·벤치마크 5종 공개…“오디오·비디오까지 확대할 것”, AI타임스, 2024.12.04.
https://www.aitimes.com/news/articleView.html?idxno=165915
공개SW 포털(oss.kr) ‘공개SW 소식’ 참조
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.