Llama 3: Meta’nın Yeni Yapay Zeka Canavarı

Meta, açık üretken yapay zeka modelleri serisi Llama’nın en yeni üyesi olan Llama 3’ü piyasaya sürdü. Llama 3, önceki sürümlerden farklı olarak 8B ve 70B parametreli iki modelden oluşuyor. Bu modellerin milyarlarca parametreye sahip olmaları, karmaşıklık ve güç açısından büyük bir artı sağlıyor.

Llama 3’ün Performansı ve Özellikleri

Meta, Llama 3’ün önceki nesil modelleri olan Llama 2’ye kıyasla büyük bir performans artışı gösterdiğini belirtiyor. Özellikle, 8B ve 70B parametreli Llama 3 modelleri, bugün piyasada en iyi performans gösteren yapay zeka modelleri arasında yer alıyor. Meta’nın belirttiğine göre, Llama 3 metin tabanlı yanıtlarda daha fazla çeşitlilik sunarken soruları daha az reddediyor ve daha iyi kod yazabiliyor.

Yapılan testlerde Llama 3’ün, Google’ın Gemma ve Gemini modelleri ile Anthropic’in Claude 3 modelini geride bıraktığı ve performans açısından üstün olduğu görülmüştür. Kullanılan kıyaslama testleri arasında MMLU, ARC ve DROP gibi popüler yapay zeka karşılaştırmaları bulunmaktadır.

Meta’nın açıklamalarına göre, Llama 3 8B modeli, Mistral 7B ve Gemma 7B gibi diğer modelleri kıyasladığında oldukça başarılı sonuçlar elde etmiştir. Öte yandan Llama 3 70B modeli, Google’ın Gemini 1.5 Pro ve Anthropic’in Claude 3 modelleriyle rekabet ederken bazen de onları geçebilmektedir.

Meta’nın uzunca blog yazısında, Llama 3’ün STEM alanlarıyla ilgili sorularda ve genel kodlama önerilerinde daha yüksek doğruluk sunduğu belirtilmektedir. Bu başarı, 15 trilyon tokenlik geniş bir veri seti üzerinde eğitim yapılmasına ve daha büyük veri setlerinin kullanılmasına dayanmaktadır.

Şu anda indirilebilen ve Meta’nın çeşitli platformlarda kullanılacak olan Llama 3 modelleri, yakında çeşitli bulut platformlarında hizmete sunulacak. Ayrıca, daha kapsamlı ve çok modlu yanıtlar verebilen Llama 3 modellerinin geliştirilmesi de devam etmektedir.

Paylaş

Haber Hakkında Bir Yorum Yazın

Exit mobile version