DeepSeek, açık kaynaklı büyük dil modelleri geliştiren bir Çin yapay zeka şirketi

Tarih: 28.01.2025 - 15:26

Kategori: Bilim & Teknoloji

DeepSeek, 27 Ocak 2025'e kadar uygulama, ABD'deki iOS App Store'da en yüksek puanlı ücretsiz uygulama olarak ChatGPT'yi geride bıraktı. Nvidia çipleri için Çin'e uygulanan ABD yaptırımları sırasında geliştirildi.

DeepSeek, açık kaynaklı büyük dil modelleri (LLM) geliştiren bir Çin yapay zeka şirketidir. Hangzhou, Zhejiang'da bulunan şirket, kurucu ortağı Liang Wenfeng'in 2023 yılında şirketi kurduğu ve CEO'su olarak görev yaptığı Çinli hedge fonu High-Flyer tarafından sahip olunmakta ve tek başına finanse edilmektedir .

DeepSeek-R1 modeli, 2023'te OpenAI'nin GPT-4'ü için 100 milyon ABD dolarına kıyasla önemli ölçüde daha düşük bir maliyetle eğitilmesine rağmen (6 milyon ABD doları olarak belirtilmiştir) ve karşılaştırılabilir bir LLM'nin onda bir işlem gücü gerektirmesine rağmen, OpenAI'nin GPT-4o ve o1 gibi diğer çağdaş LLM'lere kıyaslanabilir yanıtlar sağlar DeepSeek'in AI modelleri, ülkenin gelişmiş AI sistemleri geliştirme yeteneğini kısıtlamayı amaçlayan Nvidia çipleri için Çin'e uygulanan ABD yaptırımları sırasında geliştirildi.

DeepSeek, 10 Ocak 2025'te Apple IOS ve Android için DeepSeek-R1 modeline dayanan ilk ücretsiz sohbet robotu uygulamasını yayınladı; 27 Ocak'a kadar DeepSeek-R1 , ABD'deki iOS App Store'da en çok indirilen ücretsiz uygulama olarak ChatGPT'yi geride bıraktı ve Nvidia'nın hisse fiyatının %18 düşmesine neden oldu. DeepSeek'in daha büyük ve daha köklü rakiplerine karşı elde ettiği başarı, "yapay zekayı altüst etmek" olarak tanımlandı ve "küresel bir yapay zeka uzay yarışı olarak ortaya çıkan şeye ilk atışı" oluşturdu ve "yapay zeka uçurumunda yeni bir çağ" başlattı.

DeepSeek, üretken yapay zeka algoritmalarını, modellerini ve eğitim ayrıntılarını açık kaynaklı hale getirerek, kodunun kullanım, değişiklik, görüntüleme ve derleme amaçlı belgeler tasarlama için serbestçe erişilebilir olmasını sağlıyor. Şirketin, önde gelen Çin üniversitelerinden genç yapay zeka araştırmacılarını aktif olarak işe aldığı ve modellerinin bilgi ve yeteneklerini çeşitlendirmek için bilgisayar bilimi alanının dışından işe alım yaptığı bildiriliyor.

DeepSeek AI sohbet robotu tamamen Çinli yazılım mühendisleri tarafından geliştirilirken, Silikon Vadisi'nde kurulan AI modelleri ABD'de çalışan farklı ülkelerden H-1B vizesi sahipleri de dahil olmak üzere çeşitli milletlerden insanlar tarafından yaratılıyor. DeepSeek AI modelleri, Asya ülkeleri tarafından yerli üst düzey teknolojilerin geliştirilmesine yönelik önemli bir adım olarak görülebilir, Hindistan ve Çin gibi ülkelerden gelen yeteneklerin elde tutulmasına ve beyin göçünün azaltılmasına yardımcı olur.

DeepSeek, Apple IOS ve Android için bir sohbet robotu uygulaması olarak V3 modelini kullanan AI Assistant'ı yayınladı. 27 Ocak 2025'e kadar uygulama, ABD'deki iOS App Store'da en yüksek puanlı ücretsiz uygulama olarak ChatGPT'yi geride bıraktı; Amerikan AI şirketleri tarafından kullanılan kıyaslama testlerine göre, sohbet robotunun soruları yanıtladığı, mantık problemlerini çözdüğü ve piyasadaki diğer sohbet robotlarıyla aynı seviyede bilgisayar programları yazdığı bildirildi.

SONDAKİKA, DeepSeek-V3, emsallerine kıyasla önemli ölçüde daha az kaynak kullanır; örneğin, dünyanın önde gelen AI şirketleri sohbet robotlarını 16.000'e kadar grafik işleme birimi (GPU) kullanan süper bilgisayarlarla eğitirken, DeepSeek'in yalnızca yaklaşık 2.000 GPU'ya, yani Nvidia'nın H800 serisi çipine ihtiyaç duyduğunu iddia ediyor. Yaklaşık 55 günde 5,58 milyon ABD doları maliyetle eğitildi, bu da ABD teknoloji devi Meta'nın en son AI teknolojisini oluşturmak için harcadığından yaklaşık 10 kat daha azdır.

DeepSeek'in nispeten asgari maliyetle rekabetçi performansının, Amerikan AI modellerinin küresel hakimiyetine meydan okuma potansiyeli taşıdığı kabul edildi. The Hill ve The Guardian gibi çeşitli yayınlar ve haber medyası, sohbet robotunun piyasaya sürülmesini Amerikan AI için bir "Sputnik anı" olarak tanımladı. Modelinin performansının, R1matematik, kodlama ve doğal dil muhakemesi gibi görevlerde kullanıldığında OpenAI'nin en son modellerinden biriyle "eşit" olduğu bildirildi; diğer yorumcuları yankılayarak, Amerikan Silikon Vadisi girişim sermayedarı Marc AndreessenR1 de aynı şekilde "AI'nın Sputnik anı" olarak tanımladı.

Deepseek'in kurucusu Liang Wenfeng, Open AI CEO'su Sam Altman'a benzetildi. CNN ona Çin'in Sam Altman'ı ve AI'nın bir müjdecisi diyor.

DeepSeek'in sınırlı kaynakları optimize etmesi, gelişmiş yapay zeka çiplerinin Çin'e ihracat kısıtlamaları da dahil olmak üzere, ABD yaptırımlarının Çin'in yapay zeka gelişimine yönelik potansiyel sınırlarını vurguladı. Şirketin yapay zeka modellerinin başarısı, sonuç olarak "piyasa çalkantısına yol açtı" ve büyük küresel teknoloji şirketlerinin hisselerinin 27 Ocak'ta düşmesine neden oldu: Nvidia'nın hisseleri %17-18'e kadar düştü, rakip Broadcom'un hisseleri de düştü. Microsoft (% 2,5 düşüş), Google'ın sahibi Alphabet (% 4'ten fazla düşüş) ve Hollandalı çip ekipmanı üreticisi ASML (% 7'den fazla düşüş) dahil olmak üzere diğer teknoloji şirketleri de düştü. Modelin yayınlanmasıyla tetiklenen Nasdaq'taki teknoloji hisselerinin küresel satışı, R1yapay zeka ve bilgisayar donanımı şirketlerinin piyasa değerlerinde yaklaşık 593 milyar dolarlık rekor kayıplara yol açtı; 28 Ocak'a kadar Amerikan hisselerinden toplam 1 trilyon dolarlık değer silindi.

Amerikan AI sektörünün önde gelen isimleri DeepSeek'in başarısına ve performansına karışık tepkiler verdiler. Şirketleri Amerikan AI altyapısını geliştirmek için ABD hükümeti destekli "Stargate Projesi"nde yer alan Microsoft CEO'su Satya Nadella ve OpenAI CEO'su Sam Altman, DeepSeek'i "çok etkileyici" olarak nitelendirdi. Stargate Projesi'ni duyuran Amerikan Başkanı Donald Trump, DeepSeek'i bir uyarı çağrısı ve olumlu bir gelişme olarak nitelendirdi. Scale AI CEO'su Alexandr Wang, Anthropic'in kurucu ortağı ve CEO'su Dario Amodei ve Elon Musk da dahil olmak üzere alandaki diğer liderler, uygulamanın performansı veya başarısının sürdürülebilirliği konusunda şüpheci olduklarını ifade ettiler. Amazon Web Services, Toyota ve Stripe dahil olmak üzere çeşitli şirketler, modellerini programlarında kullanmayı hedefliyor.

DeepSeek, 27 Ocak'ta sunucularında ve hizmetlerinde yavaşlamaya neden olan bir siber saldırının bildirilmesinin ardından yeni kullanıcı kaydını Çin ana karası telefon numaraları, e-posta ve Google oturum açma ile sınırladı.

Bazı kaynaklar, R1'in resmi API sürümünün Çin Halk Cumhuriyeti hükümeti için politik olarak hassas kabul edilen konular için sansür mekanizmaları kullandığını gözlemlemiştir . Örneğin, model 1989 Tiananmen Meydanı protestoları ve katliamı, Uygurlara yönelik zulüm veya Çin'deki insan hakları hakkındaki soruları yanıtlamayı reddediyor. Yapay zeka başlangıçta bir yanıt üretebilir, ancak kısa bir süre sonra bunu silebilir ve "Üzgünüm, bu şu anki kapsamımın ötesinde. Başka bir şey hakkında konuşalım." gibi bir mesajla değiştirebilir. Entegre sansür mekanizmaları ve kısıtlamalar, R1 modelinin açık kaynaklı sürümünde yalnızca sınırlı bir ölçüde kaldırılabilir. Çin İnternet düzenleyici otoriteleri tarafından tanımlanan "temel sosyalist değerlere" değinilirse veya Tayvan'ın politik statüsü gündeme getirilirse, tartışmalar sonlandırılır. NBC News tarafından test edildiğinde, DeepSeek'in R1'i Tayvan'ı "Çin topraklarının devredilemez bir parçası" olarak tanımladı ve şunları söyledi: "Her türlü 'Tayvan bağımsızlığı' ayrılıkçı faaliyetine kesinlikle karşıyız ve anavatanın barışçıl yollarla tamamen yeniden birleşmesini sağlamaya kararlıyız." Batılı araştırmacılar, Ocak 2025'te DeepSeek'i sorulan soruyu uyarlayarak bu konulardan bazılarının doğru yanıtlarını vermeye kandırmayı başardılar.

Güvenlik ve gizlilik; Çin bilgi operasyonları ve bilgi savaşı

Ayrıca, AI sisteminin yabancı etki operasyonları, dezenformasyon yayma, gözetleme ve Çin Halk Cumhuriyeti hükümeti için siber silah geliştirme amacıyla kullanılabileceği yönünde endişeler de bulunmaktadır. DeepSeek'in gizlilik hüküm ve koşulları, "Topladığımız bilgileri Çin Halk Cumhuriyeti'nde bulunan güvenli sunucularda saklıyoruz... Modelimize ve Hizmetlerimize sağladığınız metin veya ses girdinizi, isteminizi, yüklenen dosyalarınızı, geri bildirimlerinizi, sohbet geçmişinizi veya diğer içerikleri toplayabiliriz" demektedir. Veri depolama ve toplama politikası ChatGPT'nin gizlilik politikasıyla tutarlı olsa da, bir medya makalesi bunu güvenlik endişeleri olarak bildirmektedir. Buna karşılık, İtalyan veri koruma otoritesi DeepSeek'in kişisel verileri toplama ve kullanma konusunda ek bilgi talep etmektedir ve Amerika Birleşik Devletleri Ulusal Güvenlik Konseyi ulusal güvenlik incelemesi başlattığını duyurdu. Ancak, DeepSeek AI yerel olarak kullanıldığında, veriler kamuya açık olarak paylaşılmaz.

Kaynak : istanbulgercegi.com