Asya

Alibaba, DeepSeek’i geride bıraktığını söylediği yapay zeka modelini yayınladı

Yayınlanma

29.01.2025 14:32

Yazar

Harici.com.tr

Çinli teknoloji şirketi Alibaba çarşamba günü Qwen 2.5 yapay zeka modelinin, büyük beğeni toplayan DeepSeek-V3’ü geride bıraktığını iddia ettiği yeni bir versiyonunu yayınladı.

Qwen 2.5-Max’in, Çinlilerin çoğunun çalışmadığı ve aileleriyle birlikte olduğu Ay Yeni Yılı’nın ilk gününde piyasaya sürülmesinin alışılmadık zamanlaması, Çinli yapay zeka girişimi DeepSeek’in son üç haftadaki meteorik yükselişinin yalnızca denizaşırı rakipleri üzerinde değil, aynı zamanda yerel rekabeti üzerinde de yarattığı baskıya işaret ediyor.

Alibaba’nın bulut birimi resmi WeChat hesabından yaptığı duyuruda OpenAI ve Meta’nın en gelişmiş açık kaynaklı yapay zeka modellerine atıfta bulunarak “Qwen 2.5-Max… neredeyse tüm GPT-4o, DeepSeek-V3 ve Llama-3.1-405B’den daha iyi performans gösteriyor” dedi.

DeepSeek’in DeepSeek-V3 modeli tarafından desteklenen yapay zeka asistanının 10 Ocak’ta ve R1 modelinin 20 Ocak’ta piyasaya sürülmesi, Silikon Vadisi’ni şok etti ve teknoloji hisselerinin düşmesine neden oldu; Çinli girişimin düşük geliştirme ve kullanım maliyetleri, yatırımcıları ABD’deki önde gelen yapay zeka firmalarının büyük harcama planlarını sorgulamaya sevk etti.

Yerli rakipler arası mücadele

Ancak DeepSeek’in başarısı, yerli rakipleri arasında kendi yapay zeka modellerini yükseltmek için bir mücadeleye de yol açtı.

DeepSeek-R1’in yayınlanmasından iki gün sonra TikTok’un sahibi ByteDance, yapay zeka modellerinin karmaşık talimatları ne kadar iyi anladığını ve yanıt verdiğini ölçen bir kıyaslama testi olan AIME’de Microsoft destekli OpenAI’nin o1’inden daha iyi performans gösterdiğini iddia ettiği amiral gemisi yapay zeka modelinde bir güncelleme yayınladı.

Bu, DeepSeek’in R1 modelinin OpenAI’nin o1 modeline çeşitli performans kıyaslamalarında rakip olduğu iddiasını yineledi.

DeepSeek’in V3 modelinin öncülü DeepSeek-V2, geçtiğimiz mayıs ayında piyasaya sürüldükten sonra Çin’de bir YZ modeli fiyat savaşını tetikledi.

DeepSeek-V2’nin açık kaynaklı ve eşi benzeri görülmemiş derecede ucuz olması, 1 milyon token başına sadece 1 yuan (0,14 $) – ya da AI modeli tarafından işlenen veri birimleri – Alibaba’nın bulut biriminin bir dizi modelde %97’ye varan fiyat indirimleri açıklamasına yol açtı.

Mart 2023 ‘te Çin’in ilk ChatGPT eşdeğerini piyasaya süren Baidu ve ülkenin en değerli internet şirketi Tencent dahil olmak üzere diğer Çinli teknoloji şirketleri de aynı şeyi yaptı.

DeepSeek’in esrarengiz kurucusu Liang Wenfeng, temmuz ayında Çin medya kuruluşu Waves ile yaptığı nadir bir röportajda, girişimin fiyat savaşlarını “umursamadığını” ve AGI’ye (yapay genel zeka) ulaşmanın ana hedefi olduğunu söyledi.

OpenAI, AGI’yi ekonomik açıdan en değerli görevlerde insanları aşan otonom sistemler olarak tanımlıyor.

Alibaba gibi büyük Çinli teknoloji şirketlerinin yüz binlerce çalışanı varken, DeepSeek çoğunlukla Çin’in en iyi üniversitelerinden genç mezunlar ve doktora öğrencilerinden oluşan bir araştırma laboratuarı gibi çalışıyor.

Liang temmuz ayında verdiği röportajda, Çin’in en büyük teknoloji şirketlerinin yapay zeka endüstrisinin geleceği için uygun olmayabileceğine inandığını belirterek, bu şirketlerin yüksek maliyetleri ve tepeden inme yapıları ile DeepSeek’in yalın operasyonu ve gevşek yönetim tarzını karşılaştırdı.

“Büyük temel modeller sürekli inovasyon gerektirir, teknoloji devlerinin yeteneklerinin sınırları vardır” dedi.

Çok Okunanlar