Gemini 2.5 Pro yetenekli çıktı

Gemini 2.5 Pro yetenekli çıktı
Yapılan bir test Gemini 2.5 Pronun diğer LLMlerden daha yetenekli olduğunu gösteriyor. İşte detaylar

Epoch AI, Googleın yeni LLM modeli (Large Language Model/Büyük Dil Modeli) Gemini 2.5 Pro nun performansını, GPQA Diamond benchmarkında ölçtü.

Gemini %84lük yüksek bir oran elde etti.

Google tarafından açıklanan sonuçla tam olarak eşleşiyor. 2.5 Pro böylece şimdiye kadar GPQAdan en yüksek sonucu elde eden yapay zeka modeli oldu.

Gemininin arkasından o3-mini, o1, Claude 3.7 Sonnet modelleri geliyor.Bilmeyenler için Epoch AI, yapay zekanın etkilerini araştıran bir enstütü.

GPQA Diamond (Graduate-Level Google-Proof Q&A) ise biyoloji, kimya ve fizik hakkında aşırı zor sorulardan oluşan bir veri seti.

Bu set yapay zeka modellerinin karmaşık sorulara doğru ve güvenilir cevaplar verme yeteneğini test etmek için kullanılıyor.

Alanlarında uzman olan kişiler bile GPQA Diamonddan %70 civarında sonuç elde edebiliyor.Gemini 2.5 Pro şu anda düşük hız limitlerine sahip deneysel bir model.

Daha yüksek limitler mevcut olduğunda 2.5 Pro, GPQAla daha fazla test edilecek.

FrontierMath dahil olmak üzere diğer farklı benchmarklar da işin içeriğine girecek.Yeni LLM modeli gelişmiş kodlama özelliğiyle de dikkat çekiyor. 2.5 Pro önceki Gemini modellerine kıyasla çok daha gelişmiş kodlama yapabiliyor.

Sosyal medya ve Reddit gibi yerlerden gelen geri dönüşlere bakarsak, yazılım geliştiriciler ilginç projeler ortaya çıkarmış.

Gemini 2.5 Proda Three.js kütüphanesi, JavaScript, CSS ve HTML kullanılarak oyunlar geliştirildi.

OpenAIın GPT-5i yayınlamasıyla birlikte rekabetin daha da kızışması bekleniyor.

İLGİLİ HABERLER