Neler yeni

Foruma hoş geldin, Ziyaretçi

Forum içeriğine ve tüm hizmetlerimize erişim sağlamak için foruma kayıt olmalı ya da giriş yapmalısınız. Foruma üye olmak tamamen ücretsizdir.

Web Arşivi

Sizleri Aramızda Görmekten Mutluluk Duyuyoruz :) ~ Tıklayın ~

Bu Yapay Zeka Ne Hissettiğinizi Sizden Daha İyi Biliyor

AKY Çevrimdışı

AKY

MirayWeb Coder's
1 Ekim 2022
77,268
Mevcut yapay zeka modelleri, genel sorulara yanıt vermekte iyi olabilir ancak ona gönderdiğiniz istemlerdeki asıl niyetinizi anlamakta her zaman başarılı değiller. Bir yazıyı hangi duygularla yazdığınızı anlamamaları ise alakasız şekillerde cevaplar vermesine neden oluyor. Elon Musk'ın kurduğu xAI tarafından sunulan yeni model Grok 4.1 ise tam da bu soruna odaklanarak kullanıcıların karşısına önemli bir avantajla beraber çıktı. Grok 4.1'in Özellikleri Neler? Elon Musk'ın sahibi olduğu X (eski adıyla Twitter) ile entegre çalışan yapay zeka modeli Grok, yeni yapay zeka modeli ile güncellendi. Bunun yanı sıra Grok'un web sitesi ve uygulaması üzerinden de erişilebilen yeni model, Grok'u birçok yönden iyileştirecek özelliklerle birlikte geliyor. Yeni model artık kullanıcı niyetini çok daha iyi bir şekilde algılıyor. Kullanıcının bir kelime ile esasında ne kastetmek istediğini anlama konusunda diğer modellere göre daha üstün performans sergiliyor. Modelin duygusal zeka, empati ve benzeri yönlerden değerlendirildiği EQ-Bench testinde Grok 4.1 Thinking ilk sırada, Grok 4.1 ise ikinci sırada konumlandı. Bu modelin arkasından Kimi K2 ve Horizon Alpha'dan sonra modelin en büyük rakipleri olarak görülen Gemini 2.5 Pro, GPT-5, Claude Opus 4 geldi. Yaratıcılık konusunda nasıl bir iş çıkardığını ortaya koymayı amaçlayan Create Writing v3 kıyaslamasında Grok 4.1 Thinking 1721.9 puanla ikinci, Grok 4.1 ise üçüncü sırada yer aldı. Şu anda yapay zeka modellerinin önündeki en büyük sorunlardan biri halüsinasyon. Bu, modelin doğru olmayan şeyleri gerçekmiş gibi size sunmasına neden oluyor. Grok 4.1'in eğitim sürecinde ise halüsinasyon sorununun azaltılmaya çalışıldığı belirtildi. Akıl yürütme modunun devre dışı olduğu Grok 4, yüzde 9,89 FActScore puanı elde ederken Grok 4.1 ise yüzde 2.97 puan elde etti. Yanlış anlaşılmaya mahal vermemek adına düşük puanın daha iyi olduğunu belirtelim. Modelin genel yeteneğinin değerlendirildiği LMArena kıyaslamasında Grok 4.1 Thinking 1483 puanla ilk sırada konumlandı. Onu da 1465 puanla akıl yürütme içermeyen normal Grok 4.1 modeli takip etti. Grok 4.1'i ise Gemini 2.5 Pro takip etti. Bu arada Google'ın çok yakın bir zamanda Gemini 3'ü kullanıma sunmaya başlaması bekleniyor.
 

Forumdan daha fazla yararlanmak için giriş yapın yada üye olun!

Forumdan daha fazla yararlanmak için giriş yapın veya kayıt olun!

Kayıt ol

Forumda bir hesap oluşturmak tamamen ücretsizdir.

Şimdi kayıt ol
Giriş yap

Eğer bir hesabınız var ise lütfen giriş yapın

Giriş yap

Tema düzenleyici

Tema özelletirmeleri

Grafik arka planlar

Granit arka planlar