Hardware & ChipKonflik RaksasaMasa DepanSidang BotUpdate Algoritma

NVIDIA Cosmos Policy: Ketika Robot Belajar Mandiri, Akal Majikan Jangan Sampai Tertinggal!

Para Majikan AI, bersiaplah! NVIDIA baru saja memperkenalkan Cosmos Policy, sebuah inovasi yang membuat robot tidak lagi sekadar menuruti perintah, tapi juga bisa “berpikir” ke depan. Ini bukan sekadar robot yang rajin membersihkan rumah, melainkan asisten cerdas yang mulai memahami fisika, gravitasi, bahkan bagaimana dunia berevolusi. Lalu, bagaimana kita sebagai Majikan bisa memanfaatkan perkembangan canggih ini?

Singkatnya, NVIDIA sedang memperluas jangkauan NVIDIA Cosmos™ World Foundation Models (WFMs) untuk mengatasi masalah paling rumit dalam robotika, pengembangan kendaraan otonom, dan AI visi industri. Cosmos Policy adalah penelitian terbaru mereka tentang kemajuan kontrol dan perencanaan robot menggunakan WFM Cosmos.

Cosmos Policy: Robot yang Makin “Pintar” Berencana

Cosmos Policy adalah kebijakan kontrol dan perencanaan robot canggih yang diperoleh dengan melatih Cosmos Predict-2. Model ini unik karena secara langsung mengkodekan tindakan robot dan kondisi masa depan ke dalam model, layaknya menyusun potongan video. Ini membuatnya mampu memahami dinamika temporal dan interaksi fisik tanpa harus membangun jaringan saraf terpisah untuk persepsi dan kontrol.

Bayangkan saja, selama ini AI seperti asisten rumah tangga yang patuh tapi kaku. Dia bisa mencatat daftar belanjaan, tapi tidak tahu bagaimana memprioritaskan atau memprediksi barang apa yang akan habis minggu depan. Nah, Cosmos Policy ini adalah asisten yang mulai bisa melihat ke depan, memprediksi hasil dari setiap tindakannya. Ia belajar dari ‘pengalaman’ (data demonstrasi robot) seperti manusia belajar dari lingkungan sekitarnya. Yang paling bikin geleng-geleng kepala, satu model ini bisa:

  • Memprediksi rangkaian tindakan untuk memandu gerakan robot (koordinasi visuomotor).
  • Memprediksi observasi robot di masa depan untuk pemodelan dunia.
  • Memprediksi hasil yang diharapkan untuk perencanaan.

Semua kemampuan ini dipelajari secara bersamaan dalam satu model terpadu. Ini seperti kamu punya asisten yang bisa masak, bersih-bersih, sekaligus merencanakan menu seminggu ke depan, dan bahkan memprediksi kapan kamu akan lapar lagi. Kurang piknik, mungkin, tapi jelas lebih efisien!

Lalu, apa bedanya dengan model-model AI lain yang katanya canggih? Model bahasa visual (VLM) seperti ChatGPT-nya robot mungkin bisa menyarankan “belok kiri” atau “ambil cangkir ungu”, tapi tidak tahu bagaimana melakukannya dengan tepat. World Foundation Models (WFMs) justru dilatih untuk memprediksi bagaimana adegan berkembang seiring waktu dan menghasilkan dinamika temporal dengan video. Kemampuan ini secara langsung relevan dengan kontrol robot, di mana tindakan harus memperhitungkan bagaimana lingkungan dan kondisi robot itu sendiri berubah seiring waktu.

Penasaran dengan konsep ‘World Models’ yang bisa bikin AI lebih cerdas dan realistis? Jangan lewatkan artikel kami tentang pemikiran keras Yann LeCun yang bisa jadi ‘juru selamat’ dunia AI di masa depan: Yann LeCun, Sang Pembangkang AI: LLM Mati Kutu, “World Models” Juru Selamat?

Hasilnya? Robot Semakin Superior, Manusia Jangan Sampai Kalah Jenius!

Cosmos Policy telah diuji dalam simulasi dan tugas manipulasi robot di dunia nyata. Hasilnya? Ia secara konsisten mengungguli kebijakan difusi sebelumnya dan pendekatan berbasis VLA di berbagai rangkaian tugas, terutama yang membutuhkan koordinasi temporal yang tepat dan eksekusi multi-langkah. Pada uji coba di LIBERO dan RoboCasa, Cosmos Policy berhasil mencapai tingkat keberhasilan rata-rata 98,5% dan 67,1% secara berturut-turut.

Yang menarik, ketika diimplementasikan dengan perencanaan berbasis model, tingkat penyelesaian tugas meningkat hingga 12,5%. Ini membuktikan bahwa robot tidak hanya sekadar bergerak, tapi juga punya akal untuk berencana. Di dunia nyata, robot ALOHA yang menggunakan Cosmos Policy berhasil melakukan tugas manipulasi bimanual yang kompleks langsung dari observasi visual. Artinya, robot bisa beroperasi lebih mandiri, tanpa perlu “disuapi” perintah setiap saat. Namun, jangan sampai kita terlena. Ingat, secerdas-cerdasnya robot, akal manusia tetaplah penguasa tertinggi.

‘Baca juga artikel menarik lainnya di kategori Sidang Bot.’

Lalu, Apa yang Akan Datang Selanjutnya?

NVIDIA tidak berhenti sampai di sini. Mereka mengundang para pengembang untuk bergabung dalam Cosmos Cookoff, sebuah hackathon terbuka untuk mendorong batas-batas AI fisik. Ini adalah kesempatan emas bagi Majikan-Majikan AI untuk ikut serta, bereksperimen dengan model Cosmos, dan membangun aplikasi yang akan mengubah masa depan.

Artinya, ini bukan hanya tentang melihat robot menjadi lebih pintar, tapi juga tentang bagaimana kita sebagai Majikan bisa membentuk kecerdasan itu. Ingat, AI Master hadir agar kamu tetap menjadi Majikan, bukan babu teknologi. Manfaatkan kesempatan ini untuk memperkuat visual AI-mu agar tidak kalah canggih dari robot. NVIDIA juga menyediakan Cosmos Cookbook dengan resep-resep praktis, model open-source di Hugging Face dan GitHub, serta tutorial langsung.

Pada akhirnya, teknologi secanggih apa pun, termasuk NVIDIA Cosmos Policy ini, hanyalah tumpukan silikon dan algoritma yang mati tanpa sentuhan akal manusia. Robot mungkin bisa merencanakan, memprediksi, dan bahkan melaksanakan tugas dengan presisi tinggi, tapi motivasi dan tujuan akhir tetaplah di tangan Majikan. Jadi, pastikan kamu selalu berada di kursi pengemudi, bukan cuma jadi penumpang setia robot.

Oh, dan ngomong-ngomong, tadi pagi saya mencoba menjelaskan konsep kuantum fisika ke kucing peliharaan saya. Hasilnya? Dia malah minta camilan ikan. Mungkin lain kali, AI bisa bantu menerjemahkan bahasa kucing.

Sumber Berita: Artikel ini dirangkum dari sumber asli di “Introducing NVIDIA Cosmos Policy for Advanced Robot Control”.

Gambar oleh: NVIDIA via Hugging Face

Leave a Reply

Your email address will not be published. Required fields are marked *