Baru! Grok 4.1 Sudah Bisa Dicoba Sekarang di X dan Aplikasi, Lebih Pintar dan Lebih Manusiawi

Baru! Grok 4.1 Sudah Bisa Dicoba Sekarang di X dan Aplikasi, Lebih Pintar dan Lebih Manusiawi

kabaRakyat.web.id - Grok 4.1 resmi tersedia untuk semua pengguna di grok.com, X, dan aplikasi iOS serta Android. Versi ini langsung aktif di mode Otomatis.

Pengguna bisa pilih "Grok 4.1" secara manual di pemilih model. Sobat KabaRakyat, ini bawa peningkatan besar untuk interaksi sehari-hari.

Peluncuran diam-diam berlangsung 1-14 November 2025. xAI uji coba bertahap di trafik produksi untuk evaluasi buta.

Peningkatan Kemampuan Umum

Grok 4.1 unggul di interaksi kreatif, emosional, dan kolaboratif. Model ini lebih peka terhadap nuansa maksud pengguna.

Kepribadian lebih koheren dan menarik. Tetap pertahankan kecerdasan tajam dari Grok 4 sebelumnya.

Optimasi pakai infrastruktur RLHF skala besar. Metode baru gunakan model penalaran sebagai reward untuk iterasi mandiri.

Win rate 64,78% lawan model sebelumnya. Evaluasi buta tunjukkan preferensi pengguna lebih tinggi.

Grok 4.1 setel standar baru di evaluasi preferensi manusia. Posisi #1 di LMArena Text Leaderboard dengan 1483 Elo.

Kecerdasan Emosional dan Kreatif

EQ-Bench3 ukur empati dan keterampilan interpersonal. Grok 4.1 unggul di 45 skenario roleplay sulit.

Contoh respons empati soal kehilangan kucing lebih hangat. Bahasa lebih personal dan mendukung.

Creative Writing v3 nilai tulisan dari 32 prompt. Elo normalisasi tunjukkan kreativitas lebih tinggi.

Contoh X post soal kesadaran diri lebih hidup. Sentuhan humor dan refleksi dalam.

Sobat KabaRakyat, ini bikin Grok 4.1 lebih seperti teman bicara. Cocok untuk cerita pribadi atau brainstorming.

Reduksi Halusinasi dan Contoh Nyata

Fokus post-training kurangi halusinasi faktual. Rate halusinasi turun signifikan di query info-seeking.

Evaluasi FActScore pada 500 pertanyaan biografi. Skor lebih rendah, artinya lebih akurat.

Contoh rekomendasi wisata San Francisco lebih ringkas. Sertakan tips cuaca dan transportasi praktis.

Grok 4.1 non-reasoning kalahkan model lain dengan thinking tokens. Elo 1465 di posisi #2.

Model card lengkap tersedia di data.x.ai. Detail teknis termasuk metodologi EQ-Bench3 dan Creative Writing v3.

Perbandingan dengan Model Sebelumnya

Grok 4.1 tinggalkan Grok 4 di peringkat #33 LMArena. Margin 31 poin atas model non-xAI tertinggi.

Non-thinking mode tetap cepat tanpa token tambahan. Lebih efisien untuk respons instan.

Peluncuran bertahap pastikan stabilitas. Trafik live evaluasi pasangan buta konfirmasi win rate.

Sobat KabaRakyat, ini lompatan besar dari Grok 4. Lebih berguna untuk tugas kreatif sehari-hari.

Dampak untuk Pengguna Global

Akses mudah via web dan app. Mode Otomatis pilih Grok 4.1 secara default untuk pengalaman optimal.

xAI antusias optimasi gaya dan keselarasan. Metode baru skalakan evaluasi respons mandiri.

Benchmark tunjukkan superioritas di Elo normalisasi. Cocok profesional butuh AI kolaboratif.

Grok 4.1 pertahankan keandalan inti. Kurangi error di info faktual untuk kepercayaan lebih.

Peluncuran ini tandai era AI lebih emosional. Pantau update xAI untuk fitur mendatang.

Reference:
  • https://x.ai/news/grok-4-1
Tags:
Bagikan:
Baca juga
  • Skeleton Image
  • Skeleton Image
  • Skeleton Image
  • Skeleton Image
Berita terbaru
  • Skeleton Image
  • Skeleton Image
  • Skeleton Image
  • Skeleton Image
  • Skeleton Image
  • Skeleton Image
Close Ads