Genel
Prof Daron Acemoğlu DeepSeek’i yazdı
Nobel ödüllü gururumuz Acemoğlu, son yıllarda kurumsal ekonomi yanında Yapay Zeka hakkında da araştırmalar yayınlıyordu. Acemoğlu DeepSeek’in yapay zeka işkolunu nasıl etkileyeceği hakkında 3 kritik soruya cevap aradı.
Prof Daron Acemoğlu X hesabından DeepSeek analizi paylaştı.
Nobel ödüllü gururumuz Acemoğlu, son yıllarda kurumsal ekonomi yanında Yapay Zeka hakkında da araştırmalar yayınlıyordu. Acemoğlu DeepSeek’in yapay zeka işkolunu nasıl etkileyeceği hakkında 3 kritik soruya cevap aradı.
İşte görüşleri:
20 Ocak’ta DeepSeek R1’nin piyasaya sürülmesi bazı soruları da beraberinde getirdi. Bunların cevaplarını bilmiyorum. Belki de cevaplara ancak zaman içinde ulaşabileceğiz.
İlk ve belki de en önemli soru: DeepSeek’in bu başarısı ABD teknoloji endüstrisinin problemlere doğru yaklaşmamasının bir sonucu mu?
ABD’de muazzam bir YZ yatırımı var. Goldman Sachs teknoloji sektörünün yapacağı yatırımı 1 trilyon dolar olarak tahmin ediyor: (https://goldmansachs.com/insights/articles/will-the-1-trillion-of-generative-ai-investment-pay-off)
Uzun bir süredir, ben dahil birçok yorumcu YZ yatırımının ve teknoloji endüstrisinin gelişiminin yönünü sorguluyor. Benim anladığım kadarıyla esasen tüm lider teknoloji şirketleri aynı senaryoyu takip ediyorlar (Meta kısmi olarak açık kaynak olduğu için genelden ufak bir farklılığı söz konusu). Bu şirketler, devasa veri kaynaklarını kullanarak eğitilmiş bir sonraki kelimeyi tahmin etmeye dayanan, insanın yaptıkları işleri yapma amaçlı sohbet robotları şeklinde ve yayılmacı odaklı temel modellerini değiştirmeyi düşünmüyorlar bile.
DeepSeek de genelde diğerleriyle aynı yoldan gidiyor. Ancak takviyeli (pekiştirmeli) öğrenmeye ve uzmanların karışımı yöntemleri ile düşünce zinciri yönlendirmesinin bir karışımından oluşan mantığa diğerlerinden çok daha fazla bağlı olduğu görülüyor. Birçok yerde de yazılmış olduğu gibi, bunu lider şirketlerin yüzlerce milyon dolar maliyetli modellerinden çok daha ucuza, yaklaşık 5,5 milyon dolara yapmış durumda.
Bu duruma ABD endüstrisinin çok daha ucuz ve potansiyeli yüksek alternatif yaklaşımlara gözünü kapamış olmasının doğal sonucu gelinmiş olduğu, şeklinde bir yorum yapılabilir. Henüz YZ efsanesi daha başlamamışken Simon Johnson ile beraber yazmış olduğumuz İktidar ve Teknoloji kitabında, herkesin aynı senaryoyu takip etmesini ve yutturmacaları tahmin etmiştik: (https://amazon.com.tr/Iktidar-Ve-Teknoloji-Daron-Acemo/dp/6256570200/)
Sonuç olarak, diğer bir ifade ile ilk önemli soru şu oluyor: ABD teknoloji endüstrisinin başka görmezden geldiği daha da önemli şeyler var mı?. Acaba bu göz ardı edilmiş şeylerden biri de tamamen ve tüm sektörce modellerin daha “insan yanlısı yönde” geliştirilmesi olabilir mi?.
İkinci soru: bu durum Çin’in ABD’nin önüne geçmiş ya da geçmenin eşiğinde olduğunun kanıtı mı? Eğer böyle ise, tepeden aşağı kurumların (ya da James Robinson ile adlandırdığımız sömürücü kurumların) egemen olduğu otoriter bir rejimdeki inovasyon, tabandan gelen inovasyonu yakalayabilir ya da geçebilir mi?
Bu konuda benim görüşüm, James Robinson ile hem Ulusların Düşüşü: hem de Dar Koridor: (https://amazon.com.tr/Dar-Koridor-Devletler-Toplumlar-/dp/6050969000/) kitaplarında anlattığımız gibi, sömürücü kurumların inovasyonun gecikmesine yol açacağı yönünde.
Ancak itiraf etmem gerekirse bu artık bir olasılık. Bekleyip göreceğiz.
Yine de, DeepSeek’in yıllardır geliştirilen ABD ve bir kısım Avrupa teknolojilerinden faydalandığına da dikkat çekmek istiyorum. Daha da önemlisi, DeepSeek’in tüm kullandığı yöntemler ABD’de geliştirildi. Bunlardan bazıları, örneğin uzmanların karışımı ve takviyeli öğrenme, akademik araştırmalarla onlarca yıl önce geliştirildi. Dönüştürücü modeller ile düşünce zinciri yönlendirmesi lider teknoloji firmaları tarafından geliştirilerek kullanıma sunuldu.
Ancak DeepSeek bunları çok daha verimli ve değişik şekilde bir araya getirdi. Bundan sonra Çin şirketleri ve akademisi bir sonraki seviyeye taşıyan ve oyunu değiştiren teknik, yaklaşım ve ürünler geliştirebilecek mi göreceğiz.
DeepSeek genelde devlete ya da devlet fonlaması ile ürün ve teknoloji üreten diğer Çin YZ şirketlerinden farklı gibi duruyor. Örneğin, (http://davidyyang.com/pdfs/ai_draft.pdf ve http://davidyyang.com/pdfs/govtvcai_draft.pdf.) Bir bakıma, şirket gözetimden kaçmış gibi. Ancak artık bu söz konusu değil. Bu durumda, yaratıcılığı ve dinamizmi devam edebilecek mi?
Benim değerlendirmem, halihazırda gördüklerimizin Çin modelinin daha açık toplumları aşabileceğini gösteren bir kesin kanıttan uzak olduğu.
Üçüncü soru: bu durum ABD’nin uyguladığı ve Çin’in YZ araştırmalarını engelleme amaçlı ihracat kontrolü ve diğer yöntemlerin işe yaramadığını mı gösteriyor?
Bence bunun cevabı da henüz belli değil. DeepSeek V3 ve R1 dahil, lider modellerini eski ve göreceli olarak daha zayıf çiplerle eğitti. Ancak daha fazlası ve bir sonraki aşama için en iyi çiplere ihtiyaç duyabilir.
Benim bu konudaki görüşüm, Çin’e yönelik tamamen sıfır-toplam yaklaşımı uygulamada sorunluydu ve yanlıştı. Bu tip bir yaklaşımın ancak şu görüşleri taşıyorsanız bir mantığı olabilir: (a) üretken yapay zekaya (ÜYZ) doğru gidiyoruz; ve (b) ÜYZ’ye kim ilk ulaşırsa çok büyük jeopolitik avantaja sahip olacak. Ancak bu iki varsayım da garanti değil (ÜYZ hakkında daha fazlası aşağıda). Eğer bu varsayımlar doğru değilse Çin ve ABD’nin birçok konuda beraber çalışacağı alanlar var. Örneğin, eğer bir ülkede inovasyon insan üretkenliğini arttırıyor ya da enerjiyi daha iyi kullanmamıza yardım ediyorsa bu durum her iki ülkenin de faydasına olacaktır, özellikle de yaygın olarak kullanılıyorsa.
Son soru: DeepSeek bizi olması muhtemel ÜYZ’ye bir adım daha yaklaştırıyor mu?
Şirketin arzusu, Amerikalı kuzenleri gibi, ÜYZ’ye ulaşmak. Daha ucuza eğitilen ve takviyeli öğrenmeyi efektif kullanan modeller oyunu değiştirme potansiyeline sahipler.
Ancak yukarıda da belirttiğim üzere, bunlar zaten bilinen modeller ve bu modellerin eğitimini daha ucuz hale getirmek bizi birkaç yıl içinde mucizevi bir şekilde ÜYZ’ye ulaştırmayacak. Kısa dönemde ÜYZ’ye ulaşma hedefi gerçekçi mi sorusu hala baki. Bunun ne kadar arzu edilir bir hedef olduğu sorusu ise çok daha tartışmalı bir konu.