Microsoft Pamer Otot AI Baru: Robot Bisa Ngomong, Gambar, dan Ngetik (Tapi Akal Majikan Tetap Nomor Satu!)
Microsoft kembali unjuk gigi di kancah persaingan kecerdasan buatan. Raksasa teknologi ini baru saja meluncurkan tiga model AI dasar terbaru yang diklaim lebih efisien dan murah. Sebagai majikan sejati, Anda tentu bertanya, “Apa untungnya ini buat saya, dan apakah robot-robot ini benar-benar bisa diandalkan?” Mari kita bedah lebih lanjut, karena AI hanyalah alat, kitalah majikan yang punya akal.
Microsoft Pamer Otot AI Baru: Robot Bisa Ngomong, Gambar, dan Ngetik (Tapi Akal Majikan Tetap Nomor Satu!)
Lama berinvestasi dan bekerja sama dengan OpenAI, kini Microsoft AI (MAI) melangkah lebih jauh dengan meluncurkan tiga model AI fondasional terbarunya: MAI-Transcribe-1 untuk transkripsi suara, MAI-Voice-1 untuk generasi audio, dan MAI-Image-2 untuk membuat video. Ini bukan cuma gertak sambal, tapi sinyal jelas bahwa Microsoft serius ingin mendominasi pasar AI multimodal yang semakin ramai. Konon, model-model ini diklaim lebih ‘hemat biaya’ dibanding saingannya dari Google dan OpenAI. Sebuah klaim yang perlu kita uji dengan akal sehat, bukan cuma angka di atas kertas.
Mari kita lihat apa yang dijajakan si robot baru ini:
- MAI-Transcribe-1: Robot yang ahli menyalin ucapan. Dikatakan mampu mentranskripsi suara ke teks dalam 25 bahasa berbeda dan 2,5 kali lebih cepat dari layanan Azure Fast Microsoft sebelumnya. Cukup impresif untuk asisten yang rajin tapi kaku ini.
- MAI-Voice-1: Ini dia robot jagoan pengisi suara. Mampu menghasilkan audio 60 detik hanya dalam satu detik dan bahkan bisa menciptakan suara kustom. Bayangkan, robot bisa punya suara ala manusia, tapi tetap saja, ia tak bisa berteriak kesal karena macet di jalan.
- MAI-Image-2: Model pembuat video ini awalnya dirilis di MAI Playground, semacam taman bermain untuk model bahasa besar (LLM) mereka. Sekarang, ketiga model ini sudah tersedia di Microsoft Foundry, dan model transkripsi serta suara juga bisa diakses di Playground.
Model-model ini adalah hasil kerja keras tim MAI Superintelligence di bawah komando Mustafa Suleyman, CEO Microsoft AI. Suleyman sesumbar bahwa mereka membangun “Humanist AI” yang mengutamakan manusia dan penggunaan praktis. Kedengarannya mulia, tapi kita tahu, setiap robot punya batasnya. Robot mungkin bisa meniru suara dan membuat gambar, namun sentuhan emosi, intuisi, dan kreativitas acak yang tak terduga hanya dimiliki oleh majikan sejati.
Baca juga artikel menarik lainnya di kategori Update Algoritma.
Di tengah hiruk pikuk pasar LLM yang semakin padat, klaim bahwa model-model ini lebih murah dari Google dan OpenAI tentu menarik. MAI-Transcribe-1 dimulai dari $0.36 per jam, MAI-Voice-1 dari $22 per 1 juta karakter, dan MAI-Image-2 dari $5 per 1 juta token input teks, serta $33 untuk 1 juta token output gambar. Harga memang seringkali jadi pembeda, tapi kualitas dan “akal sehat” robot itu sendiri jauh lebih penting.
Meskipun Microsoft kian agresif dengan model AI-nya sendiri, mereka tetap berkomitmen pada kemitraan dengan OpenAI. Ini mirip seperti punya asisten rumah tangga yang sudah jago masak, tapi tetap berlangganan katering bintang lima. Agaknya, restrukturisasi kerja sama dengan OpenAI-lah yang memungkinkan Microsoft untuk lebih leluasa mengeksplorasi penelitian superintelligence ini.
Microsoft juga tidak hanya jualan janji; mereka sudah menanam investasi lebih dari $13 miliar ke lab riset AI dan mengintegrasikan model-modelnya ke berbagai produk. Strategi “main dua kaki” ini juga terlihat pada pendekatan mereka terhadap chip. Seperti yang pernah kita bahas dalam artikel Microsoft Maia 200: Chip Terbaru yang Mengguncang Tahta NVIDIA, Microsoft tak hanya memproduksi chip sendiri, tetapi juga tetap membeli dari pemain luar seperti Nvidia dan AMD. Ini menunjukkan bahwa mereka paham betul, mengandalkan satu “otot” saja di dunia AI yang bergerak cepat ini adalah tindakan bunuh diri.
Perang dingin antar raksasa teknologi memang tak pernah usai. Setiap pemain berlomba-lomba memamerkan robot terbarunya, dari yang bisa transkripsi sampai yang bisa ngedit video. Tapi ingat, di balik semua kecanggihan itu, tetap dibutuhkan seorang majikan yang cerdas dan punya akal untuk memerintah. Jangan sampai Anda terbuai janji manis robot dan lupa bahwa kendali tetap ada di tangan Anda.
Untuk Anda para majikan yang ingin melatih “robot” Anda lebih dari sekadar menyalin teks atau membuat suara, ada baiknya Anda mulai mengendalikan AI agar Anda tetap menjadi Majikan, bukan babu teknologi. Kursus AI Master bisa jadi pegangan Anda untuk itu. Atau, jika Anda ingin robot Anda lebih kreatif dalam menghasilkan konten visual, jangan lewatkan kesempatan untuk mempertajam skill Anda dengan Creative AI Pro, agar konten Anda tidak terlihat “robot banget.”
Pada akhirnya, Microsoft mungkin punya robot yang bisa ngomong, ngetik, dan bikin video, tapi mereka tetap tidak bisa memutuskan baju apa yang akan dipakai ke kantor besok. Itu tugas Anda, majikan sejati.
Ngomong-ngomong, tadi pagi saya menemukan kunci motor di dalam kulkas. Mungkin robot saya yang kurang piknik.
Artikel ini dirangkum dari sumber asli di TechCrunch.
Gambar oleh: David Ryder/Bloomberg via TechCrunch