Yuk Kenalan dengan Gemini Robotics 

Gemini Robotics adalah model AI mutakhir dari Google DeepMind yang mendekatkan kemampuan AI bukan cuma di dunia digital, tetapi dalam dunia fisik. Inti dari Gemini Robotics adalah menggabungkan vision-language-action (VLA) AI yang bisa melihat (vision), mengerti instruksi lewat bahasa (language), dan bertindak secara fisik (action), semua dalam satu model.  

(Gemini Robotics : https://deepmind.google/discover/blog/shaping-the-future-of-advanced-robotics/ ) 

Cara Kerja / Algoritma & Fitur Utama 

Untuk membuat robot yang tangguh di lingkungan nyata, ada beberapa aspek penting dalam Gemini Robotics: 

Generalitas (Generality) 

  • Model ini bisa menangani tugas-tugas yang belum pernah dilatih sebelumnya. Misalnya, ketika diperintahkan menggunakan objek baru, atau lingkungan yang berbeda dari data latih, AI ini bisa menyesuaikan.   
  • Contoh: Gemini RoboticsER (embodied reasoning) bisa memprediksi genggaman objek (grasp prediction), jalur (trajectory) gerakan, dan memilih cara merespons perubahan di lingkungan secara langsung.   

Interaktivitas & Kemampuan Adaptasi RealTime 

  • Model  mampu menerima instruksi dalam bahasa sehari-hari, menanggapi perubahan lingkungan (misalnya objek bergeser, atau instruksi berubah), dan merencanakan ulang aksi jika situasi tidak sesuai rencana awal.   
  • Contoh tugas: robot bisa lipat origami, buka resleting tas, lipat kertas, atau memasukkan sayuran ke kotak jika diperintah.   

OnDevice / Offline Mode & Embodied Reasoning 

  • Ada versi Gemini Robotics OnDevice, yaitu model yang dirancang supaya bisa beroperasi langsung di robot tanpa harus selalu terkoneksi ke internet/cloud. Ini penting untuk kasus di mana koneksi jaringan tidak stabil atau tak ada.   
  • Fitur embodied reasoning: model ini mengerti ruang (spatial understanding), bagian objek, bagaimana bergerak dalam 3D, serta memprediksi gestur tangan yang aman untuk objek tertentu. 

(Gemini Robotics : https://www.independent.co.uk/tech/google-deepmind-robot-gemini-ai-b2714364.html ) 

Contoh Tugas Nyata & Demo 

Beberapa contoh ilustratif yang diperagakan oleh Gemini Robotics: 

  • Robot dilatih untuk lipat origami fox, fold paper, menata sayuran, dan mengatur objek ringan ke dalam wadah / kantong berdasarkan instruksi manusia.   
  • Jika objek terlepas atau manusia mengubah posisi objek secara tibatiba, robot mampu mendeteksi perubahan tersebut dan menyesuaikan rutenya (replan) agar tugas tetap bisa diselesaikan.   
  • Demonstrasi juga dilakukan di berbagai robot body forms: robot dengan dua tangan (dualarm), platform seperti ALOHA 2, Franka arms, dan robot humanoid seperti Apollo dari Apptronik.  

Mengapa Ini Penting? 

  • Robot Asisten di Rumah & Industri: Gemini Robotics memberikan harapan bahwa robot bisa membantu pekerjaan rumah tangga sederhana atau tugas manusia di industri dengan fleksibilitas lebih tinggi. Contohnya angkat barang ringan, merapikan, atau membantu tenaga kerja di area manufaktur yang dinamis. 
  • Kemandirian Robot & Keamanan Data: Mode OnDevice memungkinkan robot beroperasi tanpa latency tinggi / tergantung cloud, juga memperkecil risiko keamanan atau privasi data karena sebagian proses dilakukan lokal. 
  • Efisiensi & Biaya: Karena model ini bisa beradaptasi ke hardware berbeda dan tugas baru tanpa pelatihan ulang besar, potensi penghematan biaya pelatihan & deployment akan besar. 
  • Penelitian & Pendidikan: Model ini membuka peluang riset tentang embodied AI, manipulasi objek nyata, safety robotics, dan interaksi manusiarobot. Mahasiswa bisa eksplorasi penggunaan model di lab, eksperimen tugas nyata, atau tugas akhir. 

Tantangan & Catatan 

  • Model masih di tahap relatif awal; banyak demo dan video, tetapi penggunaan komersial atau deployment massal masih memiliki banyak hambatan.   
  • Keamanan dan kontrol tindakan robot sangat penting: Gemini RoboticsER juga dilengkapi framework safety seperti teknik lowlevel controller, memastikan robot tidak melakukan aksi yang berbahaya.   
  • Perbedaan hardware bisa besar pengaruhnya: performa terbaik dicapai jika hardware robot mendukung kemampuan fisik & sensor yang mumpuni. 

Kesimpulan 

Gemini Robotics adalah langkah signifikan menuju robot yang lebih pintar, fleksibel, dan bisa “hidup” di dunia nyata. Bukan hanya sebagai simulasi atau lab fizikal yang tertutup, tapi menunjukkan bahwa kombinasi antara vision, language, dan action dapat memungkinkan robot menangani situasi tak terduga dengan interaksi manusia yang lebih natural. Bagi masa depan AI dan robotik, ini bukan cuma eksperiment, tapi fondasi untuk aplikasi nyata, dirumah, ditempat kerja, dan mungkin dimana pun manusia butuh bantuan robot yang adaptif. 

 

Penulis 

Stefanus Benhard S.Kom. M.Kom. (FDP Scholar) 

 

Referensi 

  1. https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/  
  2. https://arxiv.org/html/2503.20020v1  
  3. https://www.wired.com/story/googles-gemini-robotics-ai-model-that-reaches-into-the-physical-world/