Ai2가 2026년 5월 5일 공개한 MolmoAct 2는 오픈소스 로봇 제어 모델 계열에서 속도와 실사용성을 함께 끌어올린 사례로 볼 만합니다. 핵심은 단순한 데모가 아니라, 공개 가중치·데이터셋·코드 경로를 함께 제공하면서 실제 로봇 작업에 가까운 평가 결과를 제시했다는 점입니다.

이번 업데이트를 한 줄로 요약하면, "오픈소스 로봇 AI가 연구용 시연을 넘어 현장 테스트에 조금 더 가까워졌다"입니다. 다만 실제 도입은 여전히 하드웨어 보정, 안전 제어, 작업 환경 차이에 크게 좌우된다는 점은 분명히 봐야 합니다.
핵심 요약
- Ai2는 MolmoAct 2를 2026년 5월 5일 공개했습니다.
- 이전 MolmoAct 대비 최대 37배 빠른 추론 속도를 제시했습니다.
- Molmo 2-ER 기반의 체화 추론 성능이 13개 벤치마크 평균 63.8점으로 GPT-5, Gemini 2.5 Pro 등을 앞섰다고 설명했습니다.
- 720시간 이상 규모의 bimanual YAM 데이터셋과 모델 가중치, 데이터, 코드 경로를 함께 공개했습니다.
- 실제 로봇 배치에서는 여전히 시야 가림, 제어 지연, 미세 조작 한계 같은 리스크가 남아 있습니다.
왜 주목받는가
로봇 AI는 텍스트나 이미지 생성형 AI보다 현실 제약이 훨씬 큽니다. 조금만 느려도 동작이 끊기고, 카메라 시야가 바뀌거나 물체 위치가 달라져도 실패 확률이 크게 올라갑니다.
Ai2는 이번 글에서 MolmoAct 2가 단일 행동 호출 기준으로 약 180ms, adaptive depth reasoning 사용 시 약 790ms, 이전 MolmoAct는 6700ms 수준이었다고 설명했습니다. 이 차이는 사람 눈에 보일 정도로 멈칫하는 로봇과 거의 실시간으로 반응하는 로봇의 차이로 이어질 수 있습니다.
또 하나는 공개 범위입니다. Ai2는 모델 가중치뿐 아니라 MolmoAct 2-Bimanual YAM 데이터셋, Molmo 2-ER 관련 데이터, GitHub 저장소, Hugging Face 체크포인트를 함께 열었습니다. 오픈소스 로봇 모델이 늘고는 있지만, 데이터와 재현 경로까지 넓게 공개하는 사례는 아직 많지 않습니다.
실사용 관점에서 봐야 할 포인트
첫째, 이 모델은 "바로 가정용 만능 로봇이 된다"는 뜻이 아닙니다. 공식 블로그와 README 모두 하드웨어, 카메라, 캘리브레이션, 제어 방식에 따라 성능이 달라질 수 있다고 적고 있습니다.
둘째, 연구실과 물류, 반복 조작 작업처럼 비교적 구조화된 환경에서 먼저 가치가 커질 가능성이 높습니다. Ai2는 Stanford School of Medicine의 Cong Lab과 협업해 CRISPR 실험 워크플로의 반복 조작 작업에 파일럿 적용 중이라고 밝혔습니다.
셋째, 한국 개발자나 연구팀 입장에서는 "폐쇄형 로봇 모델을 직접 못 써도 공개 모델로 빠르게 검증할 수 있는 선택지"가 늘었다는 점이 중요합니다. 특히 양팔 조작, 경량 로봇, 저비용 오픈소스 로봇 데이터까지 공개된 점은 후속 실험의 진입장벽을 낮춰 줍니다.
확인해야 할 한계
MolmoAct 2가 공개한 성능 수치는 분명 인상적이지만, 이 결과가 모든 작업 환경에 그대로 재현된다고 보긴 어렵습니다. 공식 설명에도 그리퍼가 카메라를 가리거나, 제어 시스템이 모델 응답 속도를 따라가지 못하거나, 아주 정밀한 조작이 필요한 경우 성능이 떨어질 수 있다고 적혀 있습니다.
또 README에는 물리 로봇 배치 전 human supervision, emergency stop, 속도·작업공간·토크·접촉력 제한 같은 안전 장치를 권고하고 있습니다. 즉 "모델이 좋아졌다"와 "현장에 곧장 투입 가능하다"는 같은 말이 아닙니다.
빠른 결론
MolmoAct 2는 오픈소스 로봇 AI가 어디까지 왔는지 보여주는 중요한 공개입니다. 속도, 체화 추론, 양팔 조작 데이터, 공개 범위를 함께 끌어올렸다는 점에서 연구용 가치가 높고, 실험실 자동화나 반복 조작 업무 자동화 흐름에도 영향을 줄 가능성이 있습니다.
다만 당장 일반 사용자가 체감할 제품 변화라기보다, 앞으로 6개월에서 18개월 사이 로봇 연구와 산업 파일럿의 속도를 높일 기반 공개에 가깝습니다. 이 분야를 보는 관전 포인트는 "얼마나 똑똑한가"보다 "얼마나 안전하게, 얼마나 꾸준히, 얼마나 싼 하드웨어에서 돌아가느냐"입니다.
원문과 참고 링크
- Ai2 공식 블로그: https://allenai.org/blog/molmoact2
- GitHub README: https://github.com/allenai/molmoact2
- 기술 리포트/모델 허브: https://raw.githubusercontent.com/allenai/molmoact2/main/README.md
'AI' 카테고리의 다른 글
| ChatGPT 프로젝트로 자료를 묶을 때 먼저 볼 7가지 (0) | 2026.05.09 |
|---|---|
| Ollama Claude Desktop 연동, Claude Code에서 오픈 모델 쓰는 법 (2) | 2026.05.05 |
| 영상 속으로 직접 들어간다? Odyssey AI, 인터랙티브 3D 세계 스트리밍 기술 공개! (4) | 2025.06.05 |
| 애플 WWDC 2025, AI 발표는 '글쎄'? 기대치 낮춰야 하나… 블룸버그 전망 (3) | 2025.06.05 |
| MIT가 제시하는 AI의 미래: 불확실성 정량화부터 인간처럼 그리는 AI까지! (1) | 2025.06.04 |