Sumber Gambar: Google DeepMind

Raksasa teknologi Google memamerkan model Neural Network(NN)/AI terbarunya, Genie 3! Model penerus Genie 2 ini memiliki berbagai peningkatan serta fitur baru dibandingkan pendahulunya. Yuk, kita telaah bersama-sama apa saja yang baru di Genie 3!

Overview

Sumber Gambar: Google DeepMind

Genie 3 adalah iterasi ketiga dari seri AI model Google yang juga disebut sebagai “World Model”. World model adalah sebuah tipe neural network yang mampu menggunakan training datanya untuk mensimulasikan sebuah dunia dengan fisika realistis. Tidak seperti AI model lainnya, world model dapat memprediksi perubahan pada lingkungan dan dampak dari sebuah aksi pada lingkungan tersebut. Dunia yang disimulasikan oleh Genie 3 bersifat interaktif, sehingga pengguna dapat menjelajahi serta memanipulasi simulasi tersebut, berbeda dengan AI model biasa. Interaksi tersebut terjadi secara real-time dengan 24 FPS.

 

Genie 3 vs Pendahulunya

Sumber Gambar: Google DeepMind

Lalu, apa saja yang membedakan Genie 3 dari model-model pendahulunya? Genie 3 memiliki berbagai macam peningkatan dan fitur baru sebagai berikut:

  1. Real-Time Interactive World Generation
     Genie 3 mampu mengenerasi dunia interaktif yang dinamis dalam 24 FPS dan resolusi 720p secara real-time, sehingga pengguna dapat memanipulasi dan menavigasi dunia hasil generasi yang tetap konsisten selama beberapa menit.
  2. Advanced Physical World Modeling
     Genie 3 mampu mensimulasikan ciri-ciri fisik dunia seperti fisika dan lighting dengan realisme dan akurasi yang tinggi, serta interaksi lingkungan yang kompleks.
  3. Promptable World Events
     Dunia generasi Genie 3 dapat diubah secara dinamis menggunakan teks prompt atau command, seperti mengubah cuaca, karakter, kejadian, penambahan objek, dan sebagainya.
  4. Embodied Agent Training Support
     Dunia generasi Genie 3 dapat menunjang pelatihan AI agent lainnya seperti SIMA. Agent-agent tersebut dapat melatih sebuah tujuan di dunia generasi, dengan bantuan simulasi future state Genie 3 untuk mensimulasi dampak dari aksi agent di dunia. Ini memungkinkan unlimited curriculum training untuk agent tersebut.
  5. Emergent Consistency Capabilities
     Genie 3 mampu mempertahankan konsistensi ruang dalam dunia generasi. Berbeda dari NeRF dan Gaussian Splatting, Genie 3 mengenerasi dunia secara frame-by-frame mengikuti deskripsi/prompt dunia serta aksi dan navigasi pengguna.
  6. Unlimited Curriculum for AI Research
     Genie 3 menyediakan ruang untuk melatih agent-agent otomatis, seperti robot dan sistem-sistem otomatis. Ini membantu evaluasi performa, pemeriksaan kelemahan atau kesalahan, dan sebagainya.

Namun, Genie 3 masih memiliki beberapa kelemahan, seperti terbatasnya lingkup aksi yang dapat dilakukan agent, sulitnya mensimulasikan interaksi antara lebih dari satu agent, ketidakmampuan untuk mensimulasikan lokasi dunia nyata secara akurat, perlunya input teks pada world description untuk merender teks yang dapat dibaca, serta durasi interaksi yang terbatas hingga beberapa menit.

Kesimpulan

Genie 3, seperti model AI lainnya, membawa potensi dalam berbagai bidang dari pelatihan robot hingga konsepsi game. Namun, aplikasi ini juga memiliki kekurangan serta pertanyaan dan dilema etis yang perlu diperhatikan. Google harus berhati-hati dalam implementasi aplikasi ini untuk menghindari dampak negatif yang mungkin muncul dari penggunaannya.

Referensi:
Genie 3 AI – Interactive World Model for Real-Time Environment Generation
Genie 3: A new frontier for world models
Understanding World Models in AI: A Technical Guide
What Is a World Model? | NVIDIA Glossary

Evan Derian Rustam

Evan Derian Rustam

Author

Content Writer Intern @BINUS Game Application & Technology

Muhamad Fajar

Muhamad Fajar

Editor

Lecturer @BINUS Game Application Technology