본문 바로가기

2018 SAS,R, Python 선호도 조사...Burtch Works

OSS 게시글 작성 시각 2018-09-21 11:30:18

2018년 9월 21일

 

데이터 과학과 머신 러닝 분야에서 선호하는 언어는 무엇입니까?

 

20180921112820ea4e9d5dc0f442562a5463404961cc0d43ea334f.jpg
[pixabay]

 

Burtch Works(미국의 데이터 과학 및 분석 전문가 채용 회사)는 지난 7월 데이터 과학자 및 분석 전문가 네트워크를 통해 SAS, R 또는 Python 중 선호하는 프로그래밍 언어를 조사한 결과를 발표하였습니다. 
또한 인구 통계 정보에 대한 응답을 매칭하여 경력, 교육수준, 지역, 산업 분야별 선호도와 데이터 과학자 vs 기존 예측 분석 전문가의 선호도 차이 등도 확인할 수 있습니다.

 

[전반적인 결과] 2018년도는 Python 33%, R이 33%, SAS 34% 로 전반적으로 고르게 선호하는 양상을 보였습니다.

 

[최근 2년간 트렌드] 2016년부터 2년간의 추이를 보면 R은 선호도가 조금씩 떨어졌고, SAS는 비슷한 양상을 보이며, Python은 지속적으로 상승하였습니다. 

 

[경력에 따른 선호도] R 및 Python과 같은 공개SW 도구는 5년 이하의 전문가가 압도적(R 38%, Python 48%)으로 선호합니다. 16년 이상의 전문가들은 SAS를 계속 선호(47%)하고 있으며, 6-15년의 경력의 전문가들은 R을 36%로 약간 더 선호하지만 SAS 33%, Python 31%로 언어간 차이는 5% 이내입니다. 

 

[주니어 전문가의 선호도 변화] 5년 이하의 전문가에 대한 지난 3년간의 선호도 변화를 살펴보면 시장의 변화를 유추할 수 있습니다. 5년 이하 전문가들의 R과 SAS에 대한 선호도는 감소했습니다. R의 선호도는 2016년 50%가 넘었었지만 2018년도에는 40%에도 미치지 못합니다. 반면에 Python 선호도는 2016년 24%에서 2018년의 48%로 두 배로 R의 선호도를 역전하였습니다.

 

[교육수준에 따른 선호도] 학사 및 석사 학위 소지자는 SAS에 대한 선호도(39%, 37%)가 가장 높았으며, 박사 학위 소지자는 Python(43%), R(33%)과 같은 공개SW 도구를 선호했습니다. 이것은 연구 및 학술적 환경에서 공개SW 도구를 사용이 포함되며, 이러한 공개SW 도구의 선호도는 라이선스 비용이 없고 Python 모델을 제품 환경에 쉽게 적용 할 수 있다는 점 뿐만 아니라 여러 도구 중에 비즈니스 커리어에 함께 사용될 수 있는 점 등 여러 가지 이유 때문일 수 있습니다 

 

[산업분야에 따른 선호도] SAS는 금융 서비스(42%) 및 의료/제약 업계(43%)에서 가장 높은 결과를 유지하고 있으며 Python은 기술/통신 회사(41%) 및 컨설팅 분야(40%)에서 높은 선호도를 보입니다. R은 소매 및 소비재 산업(39%)에서 우세하였습니다. 

 

[데이터 과학자와 기존 예측 분석 전문가 비교] 데이터 과학자들은 Python(69%)을 압도적으로 선호하지만 구조화 된 데이터로 작업하는 예측 분석 전문가는 SAS(40%) 또는 R(34%)을 선호합니다.

[참고 : BurtWorks에서 정의한 ‘데이터 과학자’ 기준 ]
Burtch Works에서는 급여 밴드, 도구 사용, 데이터 볼륨 및 구조 및 기타 다양한 요소의 차이로 인해 기존의 예측 분석 전문가와 데이터 과학자를 구분합니다. 가장 큰 차이점은 데이터 과학자는 주로 비구조화 또는 스트리밍 데이터로 작업하는 것으로 정의하는 반면, 기존의 예측 분석 전문가는 주로 구조화 된 데이터로 작업한다는 것입니다. 


* 전체 조사 결과를 시각적으로 보려면 이 설문조사결과 참조

 

※ 참고자료 Reference

  • Not Just a Title: How to Identify a Data Scientist, 2015.05.11.
  • 2017 SAS, R, or Python Flash Survey Results, 2017.06.19.
  • 2018 SAS, R, or Python Survey Results: Which do Data Scientists & Analytics Pros Prefer?, 2018.07.16.

 

- 공개SW 역량프라자 -

2018
공개SW 가이드/보고서 - 번호, 제목, 작성자, 조회수, 작성
번호 제목 작성자 조회수 작성
공지 [2024년] 오픈소스SW 라이선스 가이드 개정판 발간 file support 12539 2024-01-03
공지 [2024년] 기업 오픈소스SW 거버넌스 가이드 개정판 발간 file support 10059 2024-01-03
공지 [2024년] 공공 오픈소스SW 거버넌스 가이드 개정판 발간 file support 9951 2024-01-03
공지 공개 소프트웨어 연구개발(R&D) 실무 가이드라인 배포 file support 22454 2022-07-28
공지 공개소프트웨어 연구개발 수행 가이드라인 file OSS 20799 2018-04-26
328 [Redhat Brandpost]컨테이너 플랫폼으로 데브옵스 환경까지 조성하는 법 OSS 2164 2018-11-06
327 [Redhat Brandpost] ‘더 풍요로운 쿠버네티스 생태계의 미래’ 오픈시프트 4.0 이후를 말한다. OSS 1827 2018-11-02
326 [Redhat Brandpost] 오픈시프트가 지원하는 베어메탈과 쿠버네티스 환경 OSS 2218 2018-11-02
325 오픈소스 보안 현황과 시사점 OSS 4542 2018-10-23
324 블로그 | 머신러닝, 이론과 실제의 간극 메우려면… OSS 1771 2018-10-10
323 DevOps 성과을 위한 13가지 공개SW 툴 OSS 4897 2018-10-08
322 [리눅스 재단] '엔터프라이즈를 위한 오픈 소스 가이드' 사이트 OSS 2214 2018-10-02
321 칼럼 | 성공적인 인공지능(AI) 적용을 위한 단계 OSS 2398 2018-10-01
320 2018 SAS,R, Python 선호도 조사...Burtch Works file OSS 2434 2018-09-21
319 칼럼 | 더 많은 개발자를 채용해야 한다, 그러나··· OSS 1966 2018-09-20
맨 위로
맨 위로