Yapay Zeka Modelleri Reddit Verilerini Öncelikli Olarak

Büyük dil modelleri, cevaplarını oluştururken en çok Reddit verilerini kullanıyor. Reddit, bu modellerin en çok alıntı yaptığı kaynak olarak dikkat çekiyor. Yapay Zeka

Yapay Zeka

Büyük dil modelleri, ChatGPT’nin yanı sıra Gemini, DeepSeek, Llama ve Grok gibi çeşitli modellerle günlük yaşamda önemli bir yer edinmiştir.

Bu modellerin hangi kaynaklardan beslenildiği, dünya genelinde tartışma konusu olmaya devam etmektedir.

Online istatistik portalı Statista’nın haziran ayında yaptığı araştırmaya göre, bu modellerin en çok alıntı yaptığı kaynak Reddit’tir. Reddit, yılın ilk çeyreğinde yüzde 40,11 ile en çok alıntı yapılan web sitesi olmuştur.

Uzmanlar, yapay zekanın Reddit’ten alıntı yapmasının, geliştiricilerin resmi bilgilerden ziyade gerçek kişilerin doğal konuşmalarını önceliklendirdiğini göstermektedir.

Reddit’ten sonra en çok alıntı yapılan kaynak ise yüzde 26,3 ile Wikipedia’dır. Wikipedia, düzenlenmiş makaleler sunarken, Reddit verileri herhangi bir düzenleme süzgecinden geçmemektedir.

Yapılan araştırmada, Reddit’ten sonra en çok alıntı yapılan diğer kaynaklar arasında yüzde 23,5 ile YouTube, yüzde 23,2 ile Google, yüzde 21 ile Yelp, yüzde 19,9 ile Facebook, yüzde 18,7 ile Amazon, yüzde 12,4 ile Tripadvisor, yüzde 11,2 ile Mapbox ve OpenStreetMap yer almaktadır.

Ayrıca, yapay zeka modellerinin eğitilmesi için sosyal medya devleri ile yapay zeka üreticileri arasında anlaşmalar yapılmaktadır. 2024 yılında Google ile Reddit arasında yapılan bir anlaşmaya göre, Google’ın yapay zekaları Reddit verileriyle de beslenmektedir.

Reuters’ta yer alan bilgilere göre, bu anlaşma kapsamında Google, Reddit’e yıllık 60 milyon dolar ödeme yapacaktır. Ayrıca, Reddit’in OpenAI ile ChatGPT için bir veri paylaşımı anlaşması yaptığı da iddia edilmektedir.

İlgili Haberler: Maya Uygarlığının En Eski Anıtı Evreni Sembolize Ediyor · Yıldızlararası Kuyruklu Yıldız 3I/ATLAS Mavi Renk Değiştirdi

Başa dön tuşu