Çin merkezli yapay zeka girişimleri, ABD’nin ileri teknoloji çiplere getirdiği kısıtlamalara rağmen hızla yol alıyor. Bu şirketlerden biri olan DeepSeek, son dönemde adından sıkça söz ettirmeye başladı.
DeepSeek, geçtiğimiz hafta tanıttığı büyük dil modeli DeepSeek R1 ile sektöre etkileyici bir giriş yaptı. Modelin, OpenAI ve Google (NASDAQ:GOOGL) DeepMind gibi ABD’li devlerle yarışacak nitelikte olduğu iddia ediliyor. 6 milyon doların altında bir maliyetle geliştirildiği söylenen DeepSeek R1, hem yüksek teknolojik kabiliyetleri hem de göreceli düşük maliyetiyle öne çıkıyor. Açık kaynaklı olması ve MOE (Mixture-of-Experts) mimarisini kullanmasıyla özellikle kod üretimi ve veri analizi gibi karmaşık görevlerde başarılı sonuçlar elde ettiği belirtiliyor. Bu durum, küresel ölçekte yapay zeka rekabetinin seyrini değiştirebilecek bir etki yaratıyor.
ABD’li Şirketlerde Büyük Yatırımlar
Öte yandan ABD’li şirketler de yapay zeka altyapılarına milyarlarca dolarlık yatırımlar yapmayı sürdürüyor. Kısa bir süre önce duyurulan ve benim de paylaştığım, Donald Trump tarafından desteklenen 500 milyar dolarlık Stargate Projesi bu kapsamda önemli bir örnek olarak öne çıkmıştı.
DeepSeek Neden Gündemde?
DeepSeek, 2.048 Nvidia H800 GPU ve yaklaşık 5,6 milyon dolar harcayarak 671 milyar parametreli bir modeli eğitmeyi başardı. Karşılaştırıldığında, OpenAI’nin GPT-4 modeliyle kıyaslandığında %95 daha düşük maliyetle işlem yapabildiği ifade ediliyor. Bu durum, gerek şirketler gerekse geliştiriciler için çarpıcı bir maliyet avantajı sunuyor. Benzer modellerin eğitimi çoğu zaman çok daha yüksek bütçeler gerektirdiğinden, bu fark daha da dikkat çekici hale geliyor. Buraya bir virgül koyalım, bu konuyu yeniden ele alacağım.
Teknik olarak bakıldığında, DeepSeek R1 128 bin tokene kadar destek sunarken, GPT-4’ün 8 bin tokenlik sınırını geride bırakıyor. MOE sistemi ile çalışarak 671 milyar parametrenin yalnızca 37 milyarını etkinleştiriyor, böylece kaynak ve enerji tüketimi de önemli ölçüde azalıyor. Ayrıca açık kaynaklı yaklaşımı, geliştirici toplulukları için daha fazla özelleştirme ve iş birliği imkânı sağlıyor.
NVIDIA’nın Rolü
NVIDIA (NVDA), ABD’nin teknoloji atağında yapay zeka ve yüksek performanslı çipler alanında ön planda olmayı sürdürüyor. Şirketin GPU’ları, derin öğrenme ve hızlandırılmış veri analizi gibi alanlarda sıklıkla tercih ediliyor. NVIDIA’nın DGX süper bilgisayarları da büyük dil modellerinin eğitimi için yaygın olarak kullanılıyor. Buraya kadar biliyoruz.
24 Ocak’ta NVIDIA Hisselerinde Düşüş ve DeepSeek Etkisi
Peki, 24 Ocak’ta Nvidia hisselerinin düşüşünde DeepSeek etkisi var mı?
DeepSeek’in düşük maliyetle güçlü bir model geliştirdiği haberi, “Yapay zeka bir balon mu?” sorusunu yeniden gündeme taşıdı. Bazı yatırımcılar, sektördeki aşırı yatırımların ve sermaye dağılımının yanlış olduğuna dair endişelere kapıldı. Buna bağlı olarak NVIDIA’nın hisseleri, 24 Ocak işlem gününü %3.12 düşüşle kapattı.
Ekonomik Politikalar ve Yatırımcılar Açısından Değerlendirme
Bundan sonra konuyu ekonomik politikalar ve yatırımcılar açısından yorumlayacağım;
Çin, NVIDIA’nın ileri seviye GPU’larını satın almakta yaptırım engelleriyle karşı karşıya. DeepSeek’in 50.000 NVIDIA H100 GPU satın aldığı iddia ediliyor; bu rakam, Tesla’nın devasa yapay zeka projelerinde kullandığı GPU miktarıyla aynı seviyede. Ancak bu alımlar, ABD yaptırımları nedeniyle doğrudan raporlanamıyor.
NVIDIA gelirlerinin önemli bir kısmı Asya’dan geliyor, ancak Çin dışındaki bölgelerde büyük çaplı yapay zeka çalışmaları yapılmıyor. Çinli teknoloji devleri Tencent, Alibaba ve ByteDance gibi şirketler, büyük hacimli GPU alımları gerçekleştiriyor. Ancak yaptırımlar nedeniyle bu satın alımlar resmî olarak raporlanmıyor veya Singapur, Tayvan gibi coğrafyalardan dolaylı yoldan yapılıyor. Böylece tam rakamlar görünür olmasa da asıl alıcıların Çinli şirketler olduğu biliniyor.
Teknolojik Rekabet
Çin’de geliştirilen veri ve yapay zeka projelerinin, özellikle büyük dil modelleri ve AGI (Genel Yapay Zeka) konusunda hâlâ ABD’nin gerisinde olduğu düşünülüyor. Çin’in kullandığı yazılım ve donanım, eski nesil çiplerle çalışıyor ve NVIDIA’nın H100 çip kümelerinin gücüne ulaşamıyor.
NVIDIA’nın çipleri sadece iki şirket tarafından üretilebiliyor ve bu çiplerin yazılım altyapısı (CUDA) düzenli bakım ve güncelleme gerektiriyor. Bu, Çin gibi ülkelerin eski çiplerle çalışmasını sınırlıyor.
Bu noktada, donanım ve yazılım güncelleme konusundaki güncel teknolojilere erişim kısıtlı olduğundan, Çin’li şirketlerin küresel rekabet için hala Nvidia çiplerine ihtiyacı olduğu söylenebilir.
Benim düşüncem ise,
Çin’in “yerli yapay zeka” hamleleri önümüzdeki dönemde küresel pazarda daha fazla yer bulabilir. Özellikle Çinli şirketlerin ABD teknolojilerine bağımlılığı azaltma gayreti ortada. Eğer DeepSeek gibi modeller, düşük maliyetle yüksek performans sağlayabilecekse, bu durum ABD yaptırımlarının olduğu bir ortamda Çin için stratejik bir avantaj doğurabilir.
Öte yandan yapay zekanın bir “balon” olduğu düşüncesine katılmıyorum. Teknoloji temelleri ve kullanım alanları hâlâ büyük bir potansiyele işaret ediyor. Şurası kesin ki, yapay zeka henüz emekleme aşamasında ve önümüzde alınması gereken uzun bir yol var. Yatırımcıların ve şirketlerin oluşturduğu beklentilerde bir şişkinlik olup olmadığı tartışılabilir, fakat DeepSeek’in şu an için Nvidia konusunda bir tehlike yarattığını düşünmeyenlerdenim. Şimdi önemli olan, sektördeki gelişmeleri izleyerek, yatırımların gerçeğe uygun bir ölçekte olup olmadığını değerlendirmek ve yapay zeka teknolojilerinin sunacağı fırsatlardan en verimli şekilde yararlanabilmek.