2025.11.25
11월 4주의 국내외 오픈소스SW 관련 동향을 모아 정리하였습니다.
자세한 기사 내용은 아래 기사 내용 중 굵게 표시된 제목을 클릭하시면 보실 수 있습니다.
AI 음성 기업 수퍼톤이 클라우드나 값비싼 GPU 없이도 실시간으로 텍스트를 고품질의 음성으로 바꿔주는 AI 모델 ‘수퍼토닉(Supertonic)’을 누구나 자유롭게 사용·수정·배포할 수 있는 오픈소스로 공개했습니다.
TTS(Text-to-Speech) 모델인 수퍼토닉은 일반 노트북이나 모바일 환경에서도 빠른 속도로 구동하는 모델이라는 게 가장 큰 특징으로 사용자의 기기 자체에서 AI 연산 처리가 되는 온디바이스 모델이기 때문에 클라우드나 네트워크 연결 없이도 텍스트를 고품질의 음성으로 바꿔줍니다. 6천600만개 파라미터(매개변수)의 초경량 구조로 설계되었기 때문에 교육용의 초소형 컴퓨터는 물론, 고가의 GPU가 없는 일반 노트북이나 모바일 환경에서도 실시간 수준으로 음성을 생성할 수 있습니다.
개발자들의 편의를 위해 소스 코드는 파이썬, C++, 자바스크립트 등 8개 이상의 프로그래밍 언어로 지원되는 수퍼토닉의 소스코드는 ‘깃허브(GitHub)’에, 모델의 학습 결과물인 체크포인트와 모델을 체험해볼 수 있는 데모 페이지는 ‘허깅페이스(Hugging Face)’에 공개하였습니다.
□ 마이크로소프트, 기상·기후 예측 AI ‘오로라’ 전면 오픈소스화 선언(테크데일리)
전 세계 곳곳에서 극한 기상 현상이 일상이 된 가운데, 마이크로소프트가 차세대 기상·기후 예측 AI 모델 ‘오로라(Aurora)’의 완전한 오픈소스화를 선언하며 글로벌 연구 생태계 강화를 예고했다. 2024년 한 해에만 80만 명 이상이 극한 기후로 피해를 입은 만큼, 정확하고 신속한 예측 기술의 중요성은 더욱 높아지고 있다. 오로라는 방대한 기상·환경 데이터를 기반으로 지구 시스템을 모델링하도록 설계된 AI 모델이다.
□ 中 휴머노이드로봇 센터, ‘세계 최강’ 오픈소스 초거대 모델 발표(로봇신문)
중국에서 휴머노이드 로봇을 위한 오픈소스 초거대 모델이 발표됐다. 14일 중국 IT 전문 매체 IT즈자에 따르면 베이징 휴머노이드로봇혁신센터가 오픈소스 임바디드 인텔리전스 VLM 모델 ‘펠리칸(Pelican) VL 1.0’을 발표했다. 이 모델은 7B, 72B 매개변수를 보유, 최근까지 발표된 오픈소스 임바디드 멀티모달 초거대 모델 중 최대 규모이면서, 최근까지 세계 가장 최대 규모인 임바디드 인텔리전스 VLM 모델이다.
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.