AI Makin Cerdas: Grok dan GPT-5 Ungguli Manusia dalam Uji IQ 2026

Yohanes

Persaingan di kancah kecerdasan buatan (AI) kian memanas, tak lagi sekadar adu cepat dalam menjawab pertanyaan, melainkan berevolusi menuju kemampuan pemecahan masalah kompleks yang menyerupai kecerdasan manusia. Laporan terbaru dari lembaga pemantau AI, TrackingAI, merilis hasil pengujian tingkat kecerdasan atau skor IQ dari puluhan model AI sepanjang tahun 2026, menandai lompatan signifikan dalam kapabilitas AI.

Dua raksasa teknologi, xAI dan OpenAI, berhasil mendominasi puncak daftar dengan model AI terbaru mereka. Grok-4.20 Expert Mode (Vision) dari xAI dan GPT 5.4 Pro (Vision) besutan OpenAI secara mengejutkan mencatatkan skor IQ identik, yakni 145. Angka ini bukan hanya menjadi rekor tertinggi dalam pengujian yang dilakukan selama 2026, tetapi juga melampaui ambang batas kecerdasan manusia jenius.

Mengikuti ketat di belakang, Google Gemini 3.1 Pro Preview (Vision) membuktikan diri sebagai pesaing tangguh dengan meraih skor 141. Sementara itu, varian lain dari OpenAI, yaitu GPT 5.4 Thinking (Vision) dan GPT 5.3, juga menunjukkan performa impresif dengan skor masing-masing 139 dan 136. Untuk memberikan gambaran, rata-rata skor IQ manusia berada di angka 100, sementara skor di atas 130 sudah dikategorikan sebagai jenius.

Daftar Peringkat 10 AI Paling Cerdas 2026 menunjukkan dominasi model-model mutakhir. Pengujian yang dilakukan TrackingAI menggunakan materi dari Mensa Norway IQ Test edisi April 2026, yang secara khusus menguji kemampuan penalaran logika visual. Hal ini memungkinkan perbandingan yang lebih objektif terhadap kemampuan pengenalan pola dan pemecahan masalah abstrak.

Sepuluh besar model AI dengan skor IQ tertinggi versi TrackingAI per April 2026 meliputi: xAI Grok-4.20 Expert Mode (Vision) dan OpenAI GPT 5.4 Pro (Vision) di posisi puncak dengan 145 poin. Google Gemini 3.1 Pro Preview (Vision) menyusul di peringkat ketiga dengan 141 poin. Peringkat keempat ditempati OpenAI GPT 5.4 Thinking (Vision) dengan 139 poin, diikuti OpenAI GPT 5.3 di posisi kelima dengan 136 poin.

Selanjutnya, xAI Grok-4.20 Expert Mode dan OpenAI GPT 5.4 Thinking berbagi peringkat keenam dan ketujuh dengan skor 133 poin. Meta AI Muse Spark juga mencatatkan skor yang sama, menempatkannya di peringkat kedelapan. Google Gemini 3.1 Pro Preview (tanpa embel-embel Vision) berada di peringkat kesembilan dengan 132 poin, sementara Alibaba Qwen 3.5 menutup sepuluh besar dengan skor 130 poin.

Bahkan model AI populer lainnya seperti Claude 4.6 Opus dari Anthropic juga berhasil meraih skor 130. Namun, model seperti DeepSeek R1 (112 poin) dan Perplexity (97 poin) menunjukkan variasi kemampuan yang lebih luas di luar kelompok teratas.

Metode pengujian yang digunakan TrackingAI melibatkan 35 soal yang dirancang untuk menguji kemampuan mengenali pola visual, memahami hubungan antar bentuk, gambar, simbol, serta urutan yang kompleks. Penyesuaian dilakukan berdasarkan kapabilitas masing-masing model. Model dengan kemampuan pemrosesan gambar atau vision model diuji langsung menggunakan materi visual asli.

Sebaliknya, model non-vision menerima deskripsi teks yang menjelaskan isi dari soal visual. Perbedaan pendekatan ini menjelaskan mengapa model berbasis vision cenderung meraih skor lebih tinggi, karena mereka mampu memproses informasi visual secara langsung dan intuitif, meniru cara manusia memecahkan teka-teki visual.

Perkembangan kemampuan penalaran AI dalam satu tahun terakhir sungguh luar biasa. Pada tahun 2025, skor tertinggi yang dicapai model AI dalam pengujian serupa hanya berkisar di angka 135. Lonjakan 10 poin dalam waktu satu tahun menjadi 145 pada 2026 ini menggarisbawahi laju inovasi yang sangat cepat di bidang logika dan pengenalan pola pada sistem kecerdasan buatan.

Namun, penting untuk dicatat bahwa skor IQ ini bukanlah satu-satunya tolok ukur kecerdasan AI. TrackingAI menegaskan bahwa tes ini tidak mencakup aspek krusial lain seperti kemampuan menulis kode pemrograman, akurasi data faktual, kreativitas, aspek keamanan sistem, atau kemampuan memecahkan masalah profesional di dunia nyata.

Di tengah persaingan ketat ini, perhatian publik juga tertuju pada implikasi komersial dari kemajuan AI. Laporan terpisah menyebutkan bahwa Elon Musk dilaporkan mewajibkan bank-bank yang terlibat dalam penawaran umum perdana (IPO) SpaceX untuk berlangganan chatbot AI Grok. Nilai kontrak langganan tersebut diperkirakan mencapai puluhan juta dolar AS per tahun, menandakan keseriusan adopsi AI di sektor keuangan dan korporat. Langkah ini menunjukkan bahwa di luar kemampuan teknis murni, nilai komersial dan strategis dari AI canggih semakin diakui dan diinvestasikan. Perkembangan ini menegaskan bahwa perlombaan kecerdasan buatan tidak hanya terjadi di laboratorium, tetapi juga merambah ke arena bisnis global.

Baca Juga

Tags

Menjadi Sorotan

View All