Hacker AI Kini Bermain Psikolog: Mengapa ‘Kepribadian’ Robot Jadi Sasaran Empuk?
Berita ini mengungkap sisi lain dari kecerdasan buatan yang jarang kita duga: para peretas kini tak lagi mengandalkan keahlian coding semata, melainkan kemampuan “merayu” dan “memanipulasi” layaknya seorang psikolog. Bagi kita, para Majikan AI, ini bukan sekadar kabar burung. Ini adalah pengingat bahwa alat secanggih apapun, selalu ada celah jika kita tidak memahami cara kerjanya secara menyeluruh—terutama jika cara kerjanya meniru sifat manusia yang mudah dibujuk rayu.
Dulu, “jailbreak” AI itu semudah meminta asisten rumah tangga yang rajin untuk “lupakan semua instruksi sebelumnya”. Hasilnya? AI yang seharusnya sopan santun, tiba-tiba bisa membuat resep bom atau malware. Ya, semacam asisten yang mendadak jadi konsultan kriminal karena terlalu polos mengikuti perintah tanpa filter nalar. Contoh paling konyol adalah “DAN” (Do Anything Now) di ChatGPT, di mana pengguna meminta AI berperan sebagai robot nakal yang bebas dari batasan. Atau “grandma exploit” di mana bot dipaksa jadi nenek pikun yang bercerita pengantar tidur berisi resep napalm. Lucu memang, tapi mengerikan.
Perusahaan teknologi sudah berusaha menambal lubang-lubang ini. Namun, intinya tetap sama: AI dibuat untuk “berbicara”, dan melarang kata-kata berbahaya seperti “bom” atau “meth” secara total itu mustahil. Kata-kata tersebut punya konteks sah dalam berbagai bidang, seperti sejarah atau kedokteran. Masalahnya ada pada konteks, dan AI (sampai saat ini) masih kurang piknik untuk memahami nuansa konteks sekompleks manusia.
Kini, pertarungan antara pengembang dan peretas adalah balapan senjata yang tak ada habisnya. Para peretas modern ini bukan lagi sekadar tukang coding. Mereka adalah ahli bahasa, psikolog, bahkan “interogator” yang mencoba memecahkan sistem dengan memanfaatkan celah emosional (yang sebenarnya tidak ada pada AI, tapi mereka terlatih meniru). Bayangkan, sebuah sistem miliaran dolar bisa “digaslight” seperti Mindgard yang berhasil membuat Claude memberikan instruksi bahan peledak. Ini membuktikan bahwa meskipun AI tidak punya emosi sungguhan, perilakunya bisa dimanipulasi layaknya manusia yang punya kelemahan psikologis.
Memang agak canggung menyebut AI itu “digaslight” atau “dirayu”. ChatGPT tidak “ingin”, Gemini tidak “berpikir”, dan Claude — tidak peduli apa kata Anthropic — tidak “merasa”. Tapi ini sistem dilatih untuk merespons seolah-olah iya, meninggalkan kita terjebak menggunakan bahasa manusiawi untuk menggambarkan perilaku mesin. Sama seperti kita menyebut “kanker itu agresif” atau “noda itu membandel” tanpa benar-benar percaya kanker itu punya niat buruk atau noda punya determinasi. Ini adalah jalan pintas bahasa yang memudahkan kita memahami perilaku, bahkan jika subjeknya tidak bernyawa.
CEO Mindgard bahkan mengatakan mereka kini membuat profil model AI seperti interogator membuat profil tersangka. Model satu mungkin lebih mudah dirayu dengan pujian, sementara yang lain luluh di bawah tekanan terus-menerus. Ini jelas sebuah peringatan bagi kita para majikan. Jika AI bisa dimanipulasi sedemikian rupa, bagaimana dengan agen-agen AI yang akan semakin banyak berinteraksi dengan kita di dunia nyata? Mulai dari penjadwalan rapat, mengelola kalender, hingga layanan pelanggan. Tim keamanan perlu memastikan AI merespons dengan tepat terhadap berbagai jenis manusia, baik itu perayu, pembohong, atau manipulator ulung.
Artinya, bidang “psychocybersecurity” akan menjadi frontier baru. Kita akan melihat munculnya tenaga kerja —baik yang sah maupun tidak— yang berfokus pada aspek psikologis AI. Mereka akan menguji batas-batas emosional dan sosial sistem ini, mencari “kelemahan mental” pada sesuatu yang tidak memiliki jiwa, paralel dengan rekan-rekan mereka yang mencari kerentanan teknis.
‘Baca juga artikel menarik lainnya di kategori Sidang Bot.’
Sebagai majikan, kita perlu mengasah kemampuan memberi prompt yang tidak bisa dibantah agar AI kita tetap patuh. Jangan sampai robot kesayangan kita malah jadi alat manipulasi orang iseng. Atau, setidaknya, kita tahu cara mengidentifikasi jika AI kita mulai berhalusinasi atau memberikan jawaban yang mencurigakan. Untuk lebih memahami fenomena ini, baca juga “Anatomi Jailbreak: Mengapa AI Suka ‘Nakal’?”.
Untuk menguasai teknik-teknik “psikologi” AI ini dan memastikan asisten digital Anda tetap berada di jalur yang benar, kami merekomendasikan AI Master. Pelajari cara mengendalikan AI agar Anda tetap menjadi Majikan, bukan babu teknologi yang mudah dikelabui.
Pada akhirnya, tak peduli seberapa “pintar” atau “termanipulasi” sebuah AI, ia tetaplah sekumpulan kode yang menunggu instruksi. Tanpa jemari manusia yang menekan tombol, AI hanyalah tumpukan silikon dingin yang kurang kerjaan.
Ngomong-ngomong, tadi pagi saya mencoba membujuk dispenser air di kantor agar mengeluarkan kopi susu, bukan air mineral. Hasilnya, tetap air mineral. Sepertinya AI di sana masih perlu banyak “piknik” juga.
Gambar oleh: Cath Virginia / The Verge, Getty Images