xAI meluncurkan dua model: Grok 4 dan Grok 4 Heavy. Musk mengklaim Grok 4 Heavy menciptakan beberapa agen untuk mengerjakan suatu masalah secara bersamaan, lalu mereka semua membandingkan pekerjaan mereka untuk menemukan jawaban terbaik.
"Mirip dengan kelompok belajar," kata Musk.
xAI mengklaim bahwa Grok 4 menunjukkan kinerja tingkat tinggi pada beberapa tolok ukur, termasuk Humanity’s Last Exam—sebuah tes menantang yang mengukur kemampuan AI untuk menjawab ribuan pertanyaan crowdsourced pada mata pelajaran seperti matematika, humaniora, dan ilmu pengetahuan alam.
Menurut xAI, Grok 4 memperoleh skor 25,4 persen pada Humanity’s Last Exam mengungguli Gemini 2.5 Pro milik Google, yang memperoleh skor 21,6 persen, dan o3 milik OpenAI, yang memperoleh skor 2 persen.
Bersamaan dengan peluncuran Grok 4 dan Grok 4 Heavy, xAI juga mengumumkan paket langganan AI termahalnya, yaitu SuperGrok Heavy seharga USD300 atau sekitar Rp4,8 juta per bulan. Pelanggan paket ini akan mendapatkan pratinjau awal Grok 4 Heavy, serta akses awal ke fitur-fitur baru.