DeepSeek’in donanım harcamasının 500 milyon doları aşabileceği tahmin ediliyor – Son Dakika Ekonomi Haberleri


Teknoloji dünyasında bu hafta en çok konuşulan konulardan biri Çin merkezli şirketi DeepSeek oldu. Wall Street’ten sektörün içindeki uzmanlara kadar herkesin dikkatini çeken tek bir rakam vardı: 6 milyon dolar.

DeepSeek, en yeni yapay zeka modeline ilişkin yayımladığı makalede, modelin toplam eğitim maliyetinin 5,576 milyon dolar olduğunu, bu rakamın Nvidia’nın grafik işlemcilerinin (GPU) kiralama ücretine dayanarak hesaplandığını belirtti. Şirket ayrıca şu uyarıyı yaptı: Bu miktar yalnızca modelin “resmî eğitimi”ni kapsıyor ve yeni mimari, algoritma ya da veriyle ilgili önceki araştırma ve deneme (ablation) çalışmalarının maliyetleri bu hesaba dahil değil.

Haftanın başında, DeepSeek’in “AI Asistanı” Apple’ın App Store’unda ABD’de en çok indirilen ücretsiz uygulama unvanını, OpenAI’nin ChatGPT’sini geride bırakarak ele geçirdi. Bunun ardından küresel teknoloji hisselerinde bir satış dalgası yaşandı; özellikle çip üreticileri Nvidia ve Broadcom’un piyasa değeri Pazartesi günü toplamda 800 milyar dolar eridi.

CNBC’nin haberine göre, Yarı iletken sektörüne odaklanan araştırma ve danışmanlık firması SemiAnalysis’in yeni raporu, DeepSeek’in masraflarına dair ekstra bilgi sağlıyor. Rapora göre, DeepSeek’in donanım harcaması şirketin tarihçesi boyunca 500 milyon doları önemli ölçüde aşıyor. Rapor, araştırma-geliştirme (Ar-Ge) maliyetleri ile toplam sahip olma maliyetinin yüksek olduğunu ve “sentetik veri” üretmek için bile hatırı sayılır miktarda işlem gücüne ihtiyaç duyulduğunu vurguluyor.

Aynı raporda, Anthropic’in Claude 3.5 Sonnet modelini eğitmek için “on milyonlarca dolar” harcandığı, ancak Anthropic’in Amazon ve Google’dan milyarlarca dolarlık yatırım aldığı vurgulanıyor. Bu da genel olarak yapay zeka modelleri ve bu modelleri geliştiren şirketler için ne kadar büyük kaynak gerektiğini gösteriyor. SemiAnalysis, bu yüksek maliyetlerin nedenini “yeni yapılar denemek, veri toplamak ve temizlemek, çalışan maaşlarını ödemek ve çok daha fazlası” olarak açıklıyor.

DeepSeek’in kendi makalesinde, şirketin işlem gücüne ne kadar harcadığına dair bir tahmin yer almıyor. Şirket, bu konuda yorum yapma talebine henüz yanıt vermiş değil.

DeepSeek’in R1 adlı modeli

SemiAnalysis raporunda, “DeepSeek’in bu seviyede bir maliyet ve yeteneğe ilk önce ulaşması onu benzersiz kılıyor,” ifadesi kullanılıyor. Rapor, DeepSeek’in R1 adlı modelinin “çok iyi” olduğunu ve bu kadar kısa sürede akıl yürütme konusundaki en ileri seviyeye gelmesinin “nesnel olarak etkileyici” bulunduğunu ekliyor.

Hafta boyunca uzmanlar ve analistler, DeepSeek’in model kalitesine övgüde bulundu. Bunun, ABD’nin son üç yılda Çin’e yönelik çip ihracatını üç kez kısıtlamasına rağmen başarılmış olması ise dikkatleri iyice artırdı. Böylece 1 trilyon doların üzerinde gelir yaratması beklenen yapay zeka pazarında, ABD’nin en büyük rakibi karşısında geriye düşüp düşmeyeceği yönünde tartışmalar başladı.

Bernstein analistleri, Pazartesi günü yayımladıkları bir notta, hafta sonu boyunca gördükleri “zaman zaman abartılı yorumların” bir kısmının “Bu gerçekten ilginç” düzeyinde kaldığını, bazılarının ise “Mevcut yapay zeka altyapısının sonu geldi” kadar aşırı görüşleri içerdiğini belirtti.

DeepSeek, 2023 yılında, yapay zeka temelli bir nicel hedge fon olan High-Flyer’ın kurucu ortağı Liang Wenfeng tarafından kuruldu. Basında çıkan haberlere göre, bu yapay zeka girişimi aslında High-Flyer’ın yapay zeka araştırma biriminin bir uzantısı olarak Nisan 2023’te bağımsızlaşıp büyük dil modelleri ve yapay genel zeka (AGI) üzerine yoğunlaşmaya başladı. AGI, yapay zekanın insan zekasını çok çeşitli görevlerde eşitlemesi veya aşması anlamına geliyor ve OpenAI gibi birçok şirketin de hedefleri arasında bulunuyor.

Analistlerin aktardığına göre DeepSeek hâlâ tamamen High-Flyer’a ait ve o tarafından finanse ediliyor.

DeepSeek hakkındaki heyecan, şirketin OpenAI’nin “o1” modeline rakip olan R1 adlı akıl yürütme modelini bu ayın başında piyasaya sürmesiyle başladı. Üstelik R1 açık kaynaklı bir model, yani herhangi bir yapay zeka geliştiricisi bu modeli kullanabiliyor.

Çinli sohbet robotlarında olduğu gibi, DeepSeek’in chatbot’u da belirli konularda sınırlandırmalara sahip. Örneğin, Çin lideri Xi Jinping’in politikaları hakkında soru sorulduğunda, DeepSeek’in benzeri sorguları başka yönlere çektiği belirtiliyor.

OpenAI CEO’su Sam Altman, DeepSeek’in modelini kamuoyu önünde övdü; ancak şirket aynı zamanda DeepSeek’in, kendi ürününü geliştirmek için OpenAI verilerini izinsiz kullandığına dair kanıtlar olduğuna inandığını ifade ediyor.

Altman, Perşembe günü Washington, D.C.’de OpenAI’in düzenlediği bir etkinlikte, DeepSeek’in “kesinlikle harika bir model” olduğunu söyledi. “Bu durum, rekabetin ne kadar yüksek olduğunu ve ‘demokratik yapay zeka’nın kazanması gerektiğini hatırlatıyor,” diyen Altman, aynı zamanda akıl yürütme ve açık kaynak konularına gösterilen büyük ilgiye dikkat çekti.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir