Yapay zeka eğitimiyle ilgili YouTube videosu: “The Pile” verileri olmadan Apple Intelligence

xTasarim

Global Mod
Global Mod
Apple Intelligence, içerik oluşturucularına sorulmadan binlerce YouTube videosunun altyazılarını içeren ücretsiz The Pile veritabanı konusunda eğitilmemişti. Şirket bunu Apple 9to5Mac blogunda duyurdu. Şirket, yüksek verimli OpenELM serisi modelleriyle ilgili bilimsel bir makalesinde veri setinin kullanıldığını yazmıştı. Ancak OpenELM, Apple Intelligence veya diğer makine öğrenimi teknolojileri dahil olmak üzere şirketin kullandığı yapay zeka sistemlerinin bir parçası değildir.


Duyuru



170.000 YouTube videosundan altyazılar


9to5Mac'e göre Apple, OpenELM'i yapay zeka araştırmalarına ve açık kaynak dil modellerinin geliştirilmesine katkı olarak geliştirdiğini söyledi. O zamanlar şirket, teknolojiyi “son teknoloji ürünü açık dil modeli” olarak tanımlıyordu. Ancak OpenELM yalnızca araştırma amacıyla geliştirildi ve Apple'ın istihbarat işlevlerini yerine getirmek için geliştirilmedi. OpenELM, Apple'ın yapay zeka araştırma web sitesinde mevcut olmaya devam ediyor.

The Proof tarafından hazırlanan bir raporda, Nvidia, Anthropic ve Salesforce gibi diğer büyük şirketlerin de bu bilgileri kullandığını belirten, kar amacı gütmeyen EleutherAI'nin “The Pile” eğitim veri setine yönelik eleştirileri ortaya çıktı. “The Pile”ın diğer şeylerin yanı sıra 170.000 YouTube videosundan alınan altyazılarla desteklendiği söyleniyor. Bu konuda herhangi bir onayın olmadığı söyleniyor.

Eğitim verileriyle ilgili soru


Apple'ın Apple Intelligence için ne kadar eğitim verisi kullandığı henüz tam olarak belli değil. Şirket yalnızca “belirli özellikleri geliştiren veriler de dahil olmak üzere lisanslı içerik” kullandığını söylüyor. Ancak Apple'ın kendisinin de web tarayıcısıyla halka açık internetten elde ettiği veriler de var.

Bu seçeneği devre dışı bırakmak için web sitesi operatörlerinin özel “Applebot Extended”a içeriklerini göz ardı etmesi talimatını vermesi gerekir. Şirket, Apple'a yazdığına göre, web sitelerinin AppleBot (yapay zeka amacıyla değil, diğer hizmetler için kullanılan) tarafından taranması, “robots.txt” dosyasında aynı anda reddedilmediği sürece, devre dışı bırakıldıktan sonra bile devam ediyor. com. Grubun ayrıca eğitimlerine kullanıcıların kişisel verilerini veya “kullanıcı etkileşimlerini” dahil etmediği de biliniyor. Kredi kartı bilgileri veya “müstehcenlik” ve düşük kaliteli içerik için de filtreler mevcut ancak bunların nasıl filtrelendiği belli değil.





(bsc)
 
Üst