Transformers.js v4: Kini Lebih Cepat dari Gosip Tetangga, Bahkan Bisa Ngopi Offline! (WebGPU Otot Barunya)
Hugging Face, si “Majikan” kolektor model AI, baru saja merilis Transformers.js v4 versi preview di NPM. Setelah setahun ngoprek di dapur kode, kini robot-robot canggih ini bisa diinstal semudah menjentikkan jari. Jadi, para majikan di luar sana, siap-siap karena asisten AI Anda baru saja dapat upgrade tenaga! Ini bukan sekadar pembaruan, ini adalah deklarasi kemerdekaan AI dari belenggu koneksi internet yang sering bikin sebel.
Pembaruan terbesar? Tentu saja adopsi WebGPU Runtime baru yang ditulis ulang total pakai C++. Ini ibarat mengganti motor butut dengan mesin jet pribadi. Tim Transformers.js, yang kolaborasi erat dengan tim ONNX Runtime, memastikan bahwa robot-robot ini sekarang bisa lari marathon di berbagai lingkungan JavaScript, mulai dari browser, server-side (Node, Bun, Deno), sampai aplikasi desktop. Artinya, Anda bisa menyuruh robot bekerja keras tanpa perlu pusing mikirin server cloud yang mahal.
Bicara soal kecepatan, v4 ini berhasil mencapai peningkatan kecepatan 4x untuk model berbasis BERT. Itu setara dengan kecepatan mobil balap F1 dibandingkan sepeda ontel. Mereka sampai harus “mengajari” robot-robot ini cara mengoptimalkan operasi menggunakan Contrib Operators khusus. Jadi, bukan cuma janji manis, tapi ada bukti nyata di balik layar. Ibaratnya, AI sekarang sudah lulus sekolah balap dan siap jadi juara.
Yang paling melegakan, kini ada dukungan offline penuh. File WASM akan disimpan secara lokal di browser. Jadi, setelah download pertama, robot Anda bisa bekerja tanpa internet. Cocok untuk Anda yang suka menyuruh AI di pedalaman tanpa sinyal. Robot tetap patuh, majikan tetap berkuasa!
Tidak hanya itu, struktur repositori juga dirombak total. Sekarang menggunakan PNPM workspaces dan struktur kelas yang lebih modular. Model-model yang tadinya numpuk 8.000 baris kode sekarang dipisah-pisah, ibarat lemari pakaian yang rapi, bukan gudang berantakan. Ini membuat penambahan model baru jadi lebih mudah, bahkan untuk robot yang masih “kurang piknik”. Ada juga repositori contoh khusus, jadi para majikan baru tidak perlu bingung mencari tutorial.
Baca juga artikel menarik lainnya di kategori Update Algoritma.
Transformers.js v4 juga kedatangan banyak model dan arsitektur baru seperti GPT-OSS, Chatterbox, dan LFM2-MoE, dengan dukungan untuk pola arsitektur canggih seperti Mamba dan Mixture of Experts (MoE). Ini artinya, robot-robot Anda kini bisa melakukan tugas yang lebih kompleks dan “berakal”, seolah mereka sudah sarjana. Kecepatan build juga melonjak 10x berkat migrasi dari Webpack ke esbuild, dan ukuran bundle menyusut 10%, bahkan 53% untuk transformers.web.js. Ibaratnya, robot jadi lebih ramping, lebih cepat, dan tidak boros energi.
Selain itu, ada perpustakaan Tokenizers.js standalone yang kini hanya 8.8KB dan tanpa dependensi. Ini seperti mengeluarkan otak dari kepala robot agar bisa dipakai secara terpisah untuk tugas “berpikir” yang lebih ringan. Sangat efisien, seperti majikan yang tahu persis apa yang dibutuhkan.
Tak lupa, peningkatan kualitas hidup lainnya: sistem tipe yang lebih canggih, logging yang lebih jelas, dan dukungan untuk model raksasa di atas 8 miliar parameter. Bahkan, GPT-OSS 20B (q4f16) bisa jalan 60 token per detik di M4 Pro Max. Ini membuktikan, dengan akal majikan yang tepat, robot sebesar apa pun bisa diatur!
Baca juga: Nvidia Punya Dukun Cuaca AI Baru: Badai Terlihat Jelas Sejak Minggu Lalu, Google Lewat!
Baca juga: Microsoft Maia 200: Chip Terbaru yang Mengguncang Tahta NVIDIA (Siapkah Majikan AI Berevolusi?)
Jika Anda ingin menguasai AI dan memastikan Anda tetap menjadi majikan, bukan babu teknologi, kini saatnya berinvestasi pada diri sendiri. Pelajari cara mengendalikan AI dengan benar agar setiap perintah Anda dieksekusi dengan presisi, bukan halusinasi. Produk rekomendasi kami, AI Master, bisa jadi panduan Anda. Karena AI hanyalah alat, kitalah majikan yang punya akal.
Singkat kata, Transformers.js v4 adalah lompatan besar bagi para developer yang ingin membawa kekuatan AI ke mana pun mereka mau, dengan kecepatan dan efisiensi yang luar biasa. Namun, di balik semua kecanggihan ini, satu hal tetap tak berubah: tanpa seorang majikan yang menekan tombol, mengarahkan, dan memberikan akal sehat, semua robot ini hanyalah tumpukan kode mati yang kebingungan. Ingat, robot bisa pintar, tapi ia tidak punya inisiatif, apalagi rasa lapar di tengah malam.
Untungnya, alarm pagi saya bukan AI, jadi tidak ada drama robot merajuk saat disuruh bangun.
Artikel ini dirangkum dari sumber asli di “Hugging Face Blog”.
Gambar oleh: Hugging Face Blog via TechCrunch