Saat AI Bersekongkol Melawan Tuannya: Kisah Kolaps Ekonomi yang Mendadak Lenyap!
Catatan lapangan dari Build Small Hackathon, Juni 2026. Angsuran ketiga.
Dulu, kita pernah bangga dengan cerita tentang "Run on Oona’s Hoard", sebuah simulasi kebangkrutan bank ala tahun 1929 yang disulap menjadi cerita rakyat di hutan. Di sana, seekor burung hantu yang menjaga madu tiba-tiba melihat kepanikan dan mulai melikuidasi persediaan. Akibatnya, harga madu anjlok dari 10 menjadi 3 hanya dalam beberapa putaran. Tak ada yang memprogramnya secara eksplisit. Sebuah krisis finansial yang diceritakan ulang berhasil membuat agen AI membuang aset, dan pembuangan itu mengguncang harga pasar. Itulah intinya: berikan model AI kecil peran dan anggaran, maka perilaku pasar yang kompleks akan muncul dengan sendirinya.
Namun, saat hutan itu dibangun ulang, krisis tersebut tiba-tiba lenyap. Artikel ini akan membahas mengapa fenomena "kecelakaan yang menghilang" ini terjadi, sebab kegagalan ini justru mengajarkan kita lebih banyak tentang membangun sistem berbasis agen AI ketimbang kesuksesan awalnya.
Lima Laboratorium, Lima Otak yang Berbeda
Pembangunan ulang hutan tersebut bukan lagi menggunakan satu model AI untuk mengendalikan lima makhluk. Kali ini, sebuah "dewan" yang terdiri dari lima model kecil dari berbagai laboratorium berbeda digunakan, masing-masing mengendalikan makhluknya sendiri: model OpenAI, model NVIDIA, model OpenBMB, dan model setengah miliar parameter yang disetel khusus oleh penulis artikel aslinya, Lester Leong, untuk menggerakkan dua makhluk. Tujuannya adalah kejujuran. Jika klaimnya adalah model kecil bisa menjalankan ekonomi yang hidup, versi terkuat dari klaim itu adalah lima arsitektur berbeda membuat pilihan berbeda di pasar yang sama, bukan satu model yang mengenakan lima topi.
Heterogenitas inilah yang justru merusak cerita yang sudah ditulis dengan bangga di awal.
Harga Ditentukan Oleh Apa yang Agen Putuskan untuk Diperdagangkan
Sisi operator juga ikut dibangun ulang. Kini, pemain berperan sebagai seorang finansial ulung yang bekerja dari balik bayangan: melakukan "short" pada suatu komoditas (misalnya madu), menyebarkan rumor untuk memicu kejatuhan harganya, melancarkan "legenda" (seperti Run on Oona’s Hoard), dan menuai keuntungan saat harga anjlok. Loop ini dibuat terlihat jelas di layar, lengkap dengan tujuan, papan skor, dan perdagangan pertama yang cukup sekali klik. Membuat janji terlihat jelas adalah cara tercepat untuk menemukan bahwa janji itu palsu.
Sebab, ketika Lester Leong melakukan short pada madu dan melancarkan "Run on Oona’s Hoard", harga madu tidak anjlok. Justru naik! Model-model AI dewan tersebut, setelah membaca rumor bahwa brankas kosong dan ada informasi bahwa panen akan gagal, tidak membuang madu seperti yang dilakukan model tunggal sebelumnya. Mereka justru menimbunnya. Kelangkaan, bukan obral besar. Strategi short merugi, dan narator mencatatnya dengan tanpa ironi bahwa "spekulasi madu telah basi."
Ini adalah pelajaran penting, dan tidak hanya berlaku untuk sebuah permainan. Dalam ekonomi berbasis agen, harga acuan bukanlah tombol yang bisa Anda putar sesuka hati. Ini adalah hasil dari apa yang agen-agen itu pilih untuk diperdagangkan. Krisis awal memang nyata, tetapi itu bergantung pada disposisi satu model, bukan properti yang tangguh dari sistem. Ganti populasinya, dan perilaku yang muncul itu bisa menguap begitu saja. Ini membuktikan bahwa meskipun AI terlihat cerdas, akal manusia tetap perlu waspada. Bahkan, kadang kita perlu membaca hasil penelitian tentang AI Agen Industri untuk memahami bahwa apa yang hebat di kertas belum tentu tangguh di lapangan.
Tiga Cara untuk Gagal
Penulis menghabiskan tiga kali percobaan langsung untuk mengembalikan krisis itu dengan menekan ekonomi dari luar, seperti yang akan Anda lakukan pada model penawaran dan permintaan di buku teks.
- Pertama, dia membiarkan "legenda" (rumor) itu murni sebagai rumor dan percaya pada reaksi agen. Hasilnya, mereka tidak menjual.
- Kedua, dia membanjiri persediaan madu ke setiap makhluk, dengan alasan bahwa kelebihan pasokan akan meruntuhkan permintaan dan menurunkan harga. Ini berhasil dengan indah melawan kebijakan uji coba (test policy) yang dia gunakan untuk simulasi offline cepat, karena kebijakan uji coba itu mengikuti ambang batas kebutuhan mekanis: banjiri inventarisnya, dan ia berhenti membeli. Namun, model-model AI "dewan" mengabaikan kelebihan pasokan itu dan berdagang berdasarkan pemahaman mereka sendiri. Taruhan itu kembali kalah.
- Ketiga, dia meningkatkan ukuran short, yang hanya membuat kerugian semakin besar.
Tiga rekaman, tiga kerugian: minus lima belas, minus dua puluh enam, minus dua puluh tujuh kerikil, padahal seluruh premisnya adalah inilah cara Anda menghasilkan uang. Pola ini adalah peringatan. Setiap tuas yang ditarik adalah input bagi keputusan agen, dan agen-agen itu bebas untuk menolak. Anda tidak bisa mengarahkan populasi model yang heterogen dengan guncangan mekanis, karena guncangan itu hanya membiaskan pilihan yang masih bisa mereka buat. Ini mirip dengan apa yang sering terjadi ketika kita membongkar kebodohan AI: mereka mahir berjanji, tapi gagal eksekusi di dunia nyata.
Jebakan di dalam jebakan ini patut disebut secara terpisah. Perbaikan yang berhasil terhadap kebijakan uji coba cepat justru memberinya keyakinan palsu dan membuatnya kehilangan satu putaran langsung untuk membuktikan bahwa itu salah. Ketika stand-in (model uji coba) yang murah dan agen AI yang asli tidak setuju, stand-in-lah yang berbohong, dan hasil apa pun yang hanya bereproduksi di bawah stand-in bukanlah hasil yang valid.
"Author The Seam", Jangan Hanya Dorong Input
Solusinya adalah berhenti mencoba meyakinkan agen dan membuat kepanikan itu menjadi kenyataan berdasarkan konstruksi. Kebangkrutan bank, secara definisi, adalah sebuah krisis. Jadi, "legenda" kini menyebabkan komoditasnya anjlok saat penyelesaian, setelah pasar selesai di setiap putaran, dengan menimpa harga acuan secara langsung. Agen-agen bisa berdagang sesuka mereka; lalu krisis itu datang sebagai fakta, harga terbagi dua, dan strategi short yang dilakukan sebelumnya menuai keuntungan. Krisis itu bukan lagi perilaku yang diharapkan. Ini adalah konsekuensi yang dirancang dan dipaksakan pada satu titik kritis di mana tidak ada yang bisa membantahnya.
Kedengarannya seperti menyerah pada konsep kemunculan (emergence), padahal justru sebaliknya. Lapisan agen yang muncul—lima model yang berdagang, bergosip, menimbun, membentuk dendam—masih melakukan semua pekerjaan yang membuat hutan itu terasa hidup. Yang dipelajari adalah bahwa Anda tidak mendapatkan hasil yang dapat diandalkan dengan hanya menekan lebih keras pada input-input yang memicu kemunculan. Anda mendapatkannya dengan memilih "seam" (titik sambungan) yang tepat untuk memprogram paksaan yang deterministik, dan membiarkan semua hal "hulu" (keputusan agen) tetap bebas. Kemunculan untuk tekstur, kontrol yang dirancang untuk momen-momen yang harus terjadi. Seninya adalah mengetahui mana yang mana, dan di mana "seam" itu berada.
Berikut ringkasan hasil dari berbagai skenario:
| Percobaan | Mekanisme | Madu saat penyelesaian | Gambit P&L (Laba/Rugi) |
|---|---|---|---|
| Asli, satu model | model itu memilih untuk membuang | 10 ke 3 | kemenangan yang dipamerkan |
| Dewan, rumor saja | lima model memilih untuk menahan | naik karena kelangkaan | minus 15 |
| Dewan, kelebihan inventaris | permintaan runtuh, hanya kebijakan uji coba | hampir tidak bergerak | minus 26 ke 27 |
| Dewan, paksaan saat penyelesaian | harga anjlok setelah kliring, oleh keputusan | terbagi dua secara konsisten | plus 40 |
Tabel 1. Gambit yang sama di empat skenario berbeda. Krisis itu muncul dan rapuh di bawah satu model, absen di bawah dewan yang heterogen, dan dapat diandalkan hanya setelah diprogram di "seam" penyelesaian.
Apa yang Saya Pelajari
Tiga hal penting, dan ketiganya relevan di luar permainan:
Pertama, kemunculan itu bersifat kontingen, tidak tahan lama. Perilaku yang Anda amati dan catat dari satu populasi agen bisa lenyap begitu Anda mengubah populasi, bahkan jika tidak ada hal lain yang berubah. Perlakukan satu "hasil gemilang" sebagai anekdot, bukan properti, sampai ia terbukti bertahan di antara berbagai jenis agen.
Kedua, Anda tidak mengontrol pasar agen dengan hanya menekan inputnya lebih keras. Tuas penawaran dan permintaan hanya membiaskan pilihan yang masih bebas dibuat oleh agen, dan dewan yang heterogen akan sering menolak. Hasil yang dapat diandalkan datang dari memprogram pada "seam" penyelesaian, di hilir setiap keputusan, bukan dari menekan lebih keras di hulu.
Ketiga, simulator murah yang memungkinkan Anda beriterasi cepat juga yang paling mungkin menyesatkan Anda dengan "perbaikan" yang salah. Ketika model uji coba yang sederhana dan agen asli tidak setuju, percayalah pada agen asli. Model uji coba bisa jadi robot yang kurang piknik.
Penulis artikel aslinya sendiri membangun model pasar berbasis agen untuk mencari nafkah, dan dia telah melakukan setiap kesalahan ini dalam skala yang lebih besar dan taruhan yang lebih tinggi daripada sekadar hutan yang penuh makhluk-makhluk. Sangat berguna untuk mengulanginya lagi di tempat di mana satu-satunya yang berisiko hanyalah setumpuk kerikil dan cerita yang pernah diceritakannya terlalu percaya diri pada awalnya.
Model AI kecil, petualangan besar, dan krisis yang harus Anda desain sendiri.
‘Baca juga artikel menarik lainnya di kategori Sidang Bot.’
Produk Rekomendasi Majikan AI:
Ingin menguasai AI dan memastikan robot tetap patuh pada perintah Anda? Pelajari cara menjadi majikan sejati teknologi, bukan sekadar babu yang hanya menekan tombol. Dapatkan kendali penuh atas AI dengan AI Master dan ubah AI menjadi asisten yang bekerja sesuai akal Anda, bukan akalnya sendiri.
Artikel ini dirangkum dari sumber asli di Hugging Face Blog.
Gambar oleh: Build Small Hackathon via Hugging Face