이 누리집은 대한민국 공식 전자정부 누리집입니다.

스텝펀, 'GPT-4o' 음성 기능 능가하는 ‘스텝-오디오 2 미니’ 오픈 소스 출시

2025.09.16

2025.09.14

ⓒAI타임스 박찬 기자

중국의 유력 인공지능(AI) 스타트업 스텝펀 AI가 표현력 있고 현실감 있는 실시간 오디오 상호작용을 제공하는 음성 모델을 공개했다. 음성 인식, 오디오 이해, 음성 대화 등 다양한 벤치마크에서 `GPT-4o-오디오` 등 상용 시스템을 능가하는 성능을 보였다.

스텝펀 AI는 최근 온라인 아카이브를 통해 80억 매개변수의 음성-음성 언어모델 ‘스텝-오디오 2 미니(Step-Audio 2 Mini)’를 발표했다.

(후략)

[원본기사 :

https://www.aitimes.com/news/articleView.html?idxno=202227

]

댓글 0

첫 댓글을 작성해보세요!

댓글 작성

댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.