2025.09.16
ⓒAI타임스 박찬 기자
중국의 유력 인공지능(AI) 스타트업 스텝펀 AI가 표현력 있고 현실감 있는 실시간 오디오 상호작용을 제공하는 음성 모델을 공개했다. 음성 인식, 오디오 이해, 음성 대화 등 다양한 벤치마크에서 `GPT-4o-오디오` 등 상용 시스템을 능가하는 성능을 보였다.
스텝펀 AI는 최근 온라인 아카이브를 통해 80억 매개변수의 음성-음성 언어모델 ‘스텝-오디오 2 미니(Step-Audio 2 Mini)’를 발표했다.
(후략)
[원본기사 :
https://www.aitimes.com/news/articleView.html?idxno=202227
]
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.