로봇 시각·언어·행동 통합 첫 오픈 소스 모델 'VLA' 등장.."기존 구글 RT-2 능가"
support
게시글 작성 시각 2024-06-20 10:48:15
2024.06.19
ⓒAI타임스/박찬 기자
로봇이 특별한 훈련 없이도 새로운 작업을 수행할 수 있도록 하는 최초의 오픈 소스 시각-언어-행동(VLA) 모델이 나왔다.
벤처비트는 18일(현지시간) 스탠포드 대학교, UC 버클리 대학교, 구글 딥마인드, MIT 등의 연구진이 오픈 소스 VLA 모델 ‘오픈VLA(OpenVLA)’에 관한 논문을 아카이브에 게재했다고 전했다.
언어 모델이 웹 규모의 데이터에서 일반적인 아이디어와 개념을 학습하는 방식과 마찬가지로, 오픈VLA는 웹에서 가져온 텍스트와 이미지를 사용해 다양한 현실 세계 개념을 이해하고 이 지식을 로봇 행동에 대한 일반화된 지침으로 변환한다.
(후략)
[원본기사 : https://www.aitimes.com/news/articleView.html?idxno=160754]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 301762 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 291419 | 2020-10-27 |
10995 | [ET톡]국산 DBMS 경쟁력, 생태계 육성에 달렸다 | 11 | 2024-07-03 |
10994 | LG전자 – Qt그룹, ‘차량용 webOS 콘텐츠 플랫폼’ 구축 협력 나선다 | 47 | 2024-07-02 |
10993 | 저커버그 한마디에 ‘오픈소스’ 논쟁 재점화 | 52 | 2024-07-02 |
10992 | KAIST "GPT-4V 뛰어넘는 오픈 소스 LMM 개발" | 250 | 2024-06-25 |
10991 | [주간 OSS 동향리포트]생성형 AI 사용 시 SW 보안·라이선스 규정 준수 필요 | 340 | 2024-06-24 |
10990 | 메타, 첨단 멀티모달 모델 '카멜레온' 오픈소스 출시…새로운 AI 모델은? | 389 | 2024-06-21 |
10989 | 달아 오르는 음향 생성 AI...일레븐랩스도 오픈 소스 앱 출시 | 386 | 2024-06-20 |
10988 | “생성형 AI 사용 시 SW 보안·라이선스 규정 준수 주의해야” | 386 | 2024-06-20 |
10987 | 데이터브릭스, 유니티 카탈로그 오픈소스 제공 | 362 | 2024-06-20 |
10986 | 로봇 시각·언어·행동 통합 첫 오픈 소스 모델 'VLA' 등장.."기존 구글 RT-2 능가" | 373 | 2024-06-20 |
0개 댓글