본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.06.19

ⓒAI타임스/박찬 기자

 

로봇이 특별한 훈련 없이도 새로운 작업을 수행할 수 있도록 하는 최초의 오픈 소스 시각-언어-행동(VLA) 모델이 나왔다.
벤처비트는 18일(현지시간) 스탠포드 대학교, UC 버클리 대학교, 구글 딥마인드, MIT 등의 연구진이 오픈 소스 VLA 모델 ‘오픈VLA(OpenVLA)’에 관한 논문을 아카이브에 게재했다고 전했다.
언어 모델이 웹 규모의 데이터에서 일반적인 아이디어와 개념을 학습하는 방식과 마찬가지로, 오픈VLA는 웹에서 가져온 텍스트와 이미지를 사용해 다양한 현실 세계 개념을 이해하고 이 지식을 로봇 행동에 대한 일반화된 지침으로 변환한다.
(후략)

 

[원본기사 : https://www.aitimes.com/news/articleView.html?idxno=160754]

 

맨 위로
맨 위로