Yapay zeka dünyasında rekabet: Claude-3 vs ChatGPT-4

Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI’ın GPT-4 tabanlı modeli son zamanların en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Peki en iyi yapay zeka modeli hangisi?

Claude-3 vs ChatGPT-4: En iyi yapay zeka modeli

Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır lider olan GPT-4’ün geride kaldığını gösteriyor.

Liderlik Tablosu, “sohbet savaşları” sırasında jüriler tarafından değerlendirildi. Farklı konulardan çeşitli komutlar girerek sohbet botlarını test eden jüriler, karşılaştırma için Elo derecelendirme sistemini kullandı.

23342342342

Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla zirveye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.

Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic’in daha önceki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıca Çinli şirket Alibaba’nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.

İşte en iyi yapay zeka modeli listesi:

Claude 3 Opus – 1253

GPT-4-1106-preview – 1251

GPT-4-0125-preview – 1248

Bard (Gemini Pro) – 1203

Claude 3 Sonnet – 1196

GPT-4-0314 – 1193

Claude 3 Haiku – 1181

GPT-4-0613 – 1174

Mistral-Large-2402 – 1153

Qwen1.5-72B-Chat – 1153

GPT-4 geçen yıl piyasaya sürüldüğünde oldukça yüksek bir standart belirlemişti. Ancak Anthropic geliştiricileri, model eğitimlerinde GPT-4’ü aşmayı başarmış gibi duruyor. Claude Opus, sohbet savaşında +5/-5’lik skor elde ederek rekor da kırdı.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir