Makine-Öğrenmesi Üstadı Michael Jordan ile Büyük Veri Hülyaları ve Diğer Dev Mühendislik Çabaları Üzerine — Lee Gomes

Boşbeleş Büyük-Veri işleri ve beyinden-esinlenmiş yongalar yanlış anladığımız şeylerden iki tanesi sadece

Lee Gomes
20 Ekim 2014, spectrum.ieee.org

Fotoğraf-İllüstrasyon: Randi Klett

Fotoğraf-İllüstrasyon: Randi Klett

Büyük verilerin böyle aşırı istekle benimsenmesi muhtemelen ulusal köprü çökmeleri salgınıyla kıyaslanacak düzeyde bir dizi analiz felaketiyle sonuçlanacak. İnsan beynine dayanan yongalar yaratan donanım tasarımcılarının angaje olduğu girişim muhtemelen abesle iştigal olduğu anlaşılacak bir inanca dayanmakta. Son zamanlardaki tersi yöndeki iddialara rağmen, bilgisayar görmesinde kat etmiş olduğumuz ilerleme, Isaac Newton’ın elma ağacının altında oturduğundan bugüne fizikteki ilerleme kadardır ancak.

Bu sözler IEEE konferansında güvenliği kırıp abuk sabuk konuşan bir makinekırıcı çatlağın sözlerini andırıyor olabilir. Gerçekteyse bu görüşler bir IEEE Fellow’una, Kaliforniya/Berkeley Üniversitesi Pedong Chen Seçkin Profesörü Michael I. Jordan’a ait. Jordan, makine öğrenmesi üzerine dünyanın en saygın otoritelerinden birisi ve alanında uyanık bir gözlemci. Özgeçmişi tek başına dev bir veritabanı gerektirir, ve alanındaki konumu, 2013 Ulusal Araştırma Konseyi raporunun (“Dev Veri Analizinin Hudutları”) giriş yazısını yazmasına elveren bir düzeydedir. San Fransiscolu yazar Lee Gomes, IEEE Spectrum için 3 Ekim 2014’te onunla görüştü.

Michael Jordan’a sorduk…
— Hesaplamadan Bahsederken Neden Beyin Metaforları Kullanmayı Bırakmalıyız
— Makine Görmesine Dair Sisli Görüşümüz
— Büyük Veri Neden Büyük Bir Yıkım Olabilir
— 1 Milyar ABD Dolarıyla Ne Yapardı
— Tekillik Üzerine Nasıl Konuşmamak Gerekir
— P = NP Olup Olmamasından Daha Çok Neyi Önemsiyor
— Turing Testi Gerçekte Ne Anlama Geliyor

~~~ Hesaplamadan Bahsederken Neden Beyin Metaforları Kullanmayı Bırakmalıyız ~~~

IEEE Spectrum: Yazılarınızdan çıkardığıma göre derin öğrenme, büyük veri, bilgisayar görmesi ve benzeri şeylere dair ortalıkta bir sürü yanlış bilgi olduğuna inanıyorsunuz.

Michael Jordan: Doğrusu ortalıkta her akademik konuya dair bir sürü yanlış bilgi var. Medya insanların okuyacağı konular bulabilmek için elinden geleni yapmaya çalışıyor. Bunlar bazen kaydedilen gerçek başarıların ötesine geçiyor. Özellikle derin öğrenme konusunda, ki bu konu 1980’lerin nöral ağlarının yeniden piyasaya sürülmesidir büyük ölçüde. Nöral ağlar aslında 1960’lardan gelir; görünüşe göre 20 yılda bir bunlarla alakalı yeni bir dalga oluyor. Şimdiki dalganın esas başarı öyküsü evrişimsel nöral ağ, ama bu fikir zaten önceki dalgada da mevcuttu. Ve hem önceki dalgada hem de şimdiki dalgada inatla varolan sorunlardan birisi, insanların bunların arkasında nörobilimle alakalı bir şey olduğuna dair çıkarımlar yapmalarıdır. Buna göre sanki derin öğrenmede, bilginin beyin süreçlerindeki işlenişine, öğrenilişine, karar verme süreçlerine dair, ya da beynin büyük miktarda veriyle nasıl başa çıktığına dair bir anlayıştan istifade edilmektedir. Bu çıkarımlar tamamen ve açıkça yanlıştır.

Spectrum: Bir medya mensubu olarak demin söylediğinize şerh koyuyorum, çünkü akademisyenler de çoğu zaman onlardan bahseden öyküler yazacak insanlara muhtaç oluyorlar.

Michael Jordan: Evet bu bir ortaklık.

Spectrum:
Hep edindiğim bir izlenim, bilgisayar bilimindeki insanlar ne zaman beynin nasıl çalıştığını tarif etseler, nörobilimcilerden asla duymayacağınız korkunç indirgemeci beyanlarda bulunuyorlar. Bunlara beynin “karikatür modelleri” dediniz.

Michael Jordan:
İnsanlara etiket yapıştırmak, bütün bilgisayar bilimcileri şöyle çalışırlar ya da bütün nörobilimciler böyle çalışırlar demek istemem. Ama şurası doğru ki nörobilimdeki derin ilkeler anlaşılana dek onlarca, hatta yüzlerce yıl geçecektir. İlerlemeler nörobilimin en düşük düzeylerinde yapılmakta. Yüksek biliş —nasıl algılarız, nasıl hatırlarız, nasıl edimde bulunuruz— meselelerinde ise nöronların nasıl bilgi sakladıklarına, nasıl hesaplama yaptıklarına, kuralların ne olduğuna, algoritmaların ne olduğuna, temsillerin ne olduğuna ve bu gibi şeylere dair hiçbir fikrimiz yok. Yani akıllı sistemlerin inşasında beyne dair bir anlayışı rehber alabileceğimiz bir çağda değiliz henüz.

Spectrum:
Beynin karikatür modellerini eleştirmenizin yanısıra esasen daha ileri gidiyorsunuz ve “nöral gerçekçilik” fikrini —belirli bir donanım ya da yazılım sisteminin sırf beynin şu veya bu varsayımsal karakteristiğini paylaştığı için daha akıllı olacağı fikrini— tamamen eleştiriyorsunuz. Mesela “benim sistemim beyne benziyor çünkü çok paralel” diyen bilgisayar bilimcileri hakkında ne düşünürsünüz?

Michael Jordan:
Yani bunlar metafordur ve kullanışlı olabilirler. Akışlar ve geçiş hatları çeşitli devre türlerinden çıkmış metaforlardır. Sanırım 1980’lerin başında, bilgisayar bilimi ardışık mimarilerin, saklanmış bir programın ardışık olarak yürütüldüğü von Neumann paradigmasının egemenliğinde olduğundan, bunun neticesi olarak, bu paradigmanın dışına çıkmaya ihtiyaç vardı. Bu yüzden de insanların aradıkları yüksek paralellikte beyin metaforlarıydı. Bu da kullanışlı bir şeydi.

Ama konu evrimleştikçe, ulaşılan çoğu ilerlemenin nöral gerçekçilikten gelmediği görüldü. Derin öğrenmedeki en başarılı algoritma, geri yayılım denilen bir tekniğe dayanır. Elinizde işleyici birimlerden oluşan katmanlar vardır, bu katmanların bitiş yerinde bulunan bir çıktıyı alırsınız, ve sinyali katmanlar üzerinden geriye doğru yayarak bütün parametreleri değiştirirsiniz. Beynin böyle bir şey yapmadığı gün gibi açıktır. Bu adım kesinlikle nöral gerçekçiliğe mesafe koymuş ama belirgin bir ilerlemeye yol açmıştır. Fakat insanlar bu belirli başarı öyküsünü, diğer bütün beyinsi sistem inşa denemeleriyle aynı kefeye koyma eğilimindeler, bu inşa denemeleri başarıdan yana geri yayılımın eline su dökemeyecek olsa bile.

Spectrum:
Nöral gerçekçiliğin başarısızlığı konusunda bir de nöral ağların hiç de nöral olmadıklarına değindiniz.

Michael Jordan:
Derin-öğrenme sistemlerinde spayklar [spike] yoktur, dendritler yoktur. Bunlarda bulunan ikiyönlü sinyaller de beyinde yoktur.

Nöronların nasıl öğrendiğini bilmiyoruz. Acaba öğrenmenin sorumlusu aslında sinaptik ağırlıktaki küçük bir değişiklik midir? Yapay nöral ağlar bunu yapıyor. Beyindeki öğrenmenin nasıl gerçekleştiği hakkında pek az fikrimiz var.

Spectrum:
Mühendislerin yeni tasarladıkları yongaları —bence dili inanılmaz istismar ederek— tarif edişlerini hep okuyorum. Yongalarındaki “nöron” ya da “sinaps”lardan bahsediyorlar. Ama böyle bir şey mümkün değil; nöron dediğimiz, inanılmaz karmaşıklıkta, yaşayan, nefes alan bir hücredir. Biyolojinin dilini kendine maleden bu mühendislerin tarif ettiği yapıların biyolojik sistemlerdeki karmaşıklıkla ne ilgisi olabilir ki?

Michael Jordan:
Doğrusu burada biraz dikkatli olmak isterim. Nöral sözcüğünü kullanmayı sürdüren iki alanı ayırt etmenin önemli olduğunu düşünüyorum.

Bunlardan biri derin öğrenmedir ki burada her “nöron” gerçekten karikatürdür. Nonlineer bir işlemden geçen lineer-ağırlıklı bir toplamdır bu. Herhangi bir elektrik mühendisi bu tür nonlineer sistemleri tanıyacaktır. Buna nöron demek, açıktır ki, olsa olsa, kısa bir gösterimdir. Bu gerçekten karikatürdür. 1950’ler istatistiğinin lojistik regresyon denilen yordamı, nöronlarla hiçbir ilgisi olmasa da, tam olarak aynı küçük mimari parçadır.

Tarif ettiğiniz şeyle alakalı ikinci alan, doğru anlıyorsam, gerçek bir beyin benzetimine ya da en azından gerçek nöral devre sisteminin basitleştirilmiş bir modeline yaklaşmayı hedeflemekte. Benim gördüğüm sorunsa araştırmaların bu sistemin algoritmik olarak neler yapabileceğinin anlaşılmasıyla eşleştirilmemesidir. Görmede olduğu gibi verileri alıp sorunları çözen bir öğrenme sistemiyle eşleştirilmiş değildir. Bu esasında insanların bir gün kullanışlı algoritmalar keşfedeceği umuduna yaslanan küçük bir mimari parçadır. Bu umudun teyit edilmesini gerektiren açık bir sebep de yoktur. Sanıyorum bunun dayanağı, “eğer beyne benzeyen bir şey inşa edersem bu şeyin neler yapabileceği açığa çıkacaktır” gibi bir inançtır.

Spectrum:
Elinizde olsa beynin biyolojisinin hesaplamada model alınmasını yasaklar mıydınız?

Michael Jordan:
Hayır. Bulabildiğiniz her yerden ilham almalısınız. Önceden dediğim gibi, 1980’lerde “hadi ardışık von Neumann paradigmasının dışına çıkıp daha ziyade yüksek paralellikte sistemleri düşünelim” demek gerçekten yararlıydı. Ama içinde bulunduğumuz çağda, beynin ayrıntılı işleyişinin algoritmik süreçlere dair bilgimizi beslemediği bu kadar açıkken, gösterdiğimiz başarılarda beyni kullandığımızı iddia etmek uygunsuzdur diye düşünüyorum. Beynin görsel bilgiyi nasıl işlediğini bilmiyoruz.

~~~ Makine Görmesine Dair Sisli Görüşümüz ~~~

Spectrum: Görme sistemi araştırması üzerine konuşurken hayp [hype] sözcüğünü kullandınız. Son zamanlarda bilgisayarların görme sorununu hallettiğini ve artık insanlar kadar iyi görebildiğini anlatan bir öyküler salgını var gibi görünüyor. Bunlar hakikate yakın bile olabilir mi sizce?

Michael Jordan:
Doğrusu insanlar darmadağın sahnelerle başa çıkabiliyorlar. Muazzam sayıda kategoriyle başa çıkabiliyorlar. Sahneden yapacakları çıkarımlarla başa çıkabiliyorlar: “Bunun üstüne otursam?” “Bir şeyin üstüne bir şey koysam?” Bunlar bugünkü makinelerin yetkinliğinin çok ötesindedir. Derin öğrenme belirli türdeki imge sınıflandırmalarında iyidir. “Hangi nesne bu sahnede?”

Ama hesaplamalı görme sorunu çok büyüktür. Bu sanki elma ağaçtan düştüğünde fiziğin hepsini anlamışız demeye benzer. Evet, yani, kuvvetler ve ivmeye dair bir şeyler daha anladık. Bu önemliydi. Görmede de belirli sorun sınıflarını çözen bir araç şu anda elimizde var. Ama bunun bütün sorunları çözdüğünü söylemek aptalcadır.

Spectrum:
Şu anda görmede ne kadar büyük bir sorun sınıfını çözebiliyoruz, insanların toplamda yapabildikleriyle kıyaslanırsa?

Michael Jordan:
Yüz tanıma için, bunun çözülebilir olduğu bir süredir açıktır. Yüzlerin ötesinde, başka nesne kategorilerinden de bahsedebilirsiniz: “Sahnede bir bardak var.” “Sahnede bir köpek var.” Ama birçok türden farklı nesnelerin aynı sahnede oluşlarını, birbirleriyle ilişkilenme şekillerini, bir kişi veya robotun bu sahneyle etkileşim şekillerini ele almak halen zor bir sorundur. Çözülmekten uzak zor sorunlar vardır ve bunlar çok, çok fazladır.

Spectrum:
İzlenimim o ki, yüz tanıma bile, halen, elinizdeki imgeler çok temizse çalışıyor sadece.

Michael Jordan:
Bunu daha iyi yapmak bir mühendislik sorunudur. Zamanla bunun iyileştiğini görürsünüz. Ama bu “devrimcilik” işleri aşırı zorlamadır.

~~~ Büyük Veri Neden Büyük Bir Yıkım Olabilir ~~~

Spectrum: Şimdi büyük veri meselesine dönebilirsek, anlattığınız şeyler boyunca süren bir temaya göre mevcut büyük veri takıntısında belirli bir ahmak altını öğesi bulunuyor. Örneğin büyük-veri projelerinden çıkan yanlış pozitiflerin salgınlaşacağını ve toplumun bunu deneyimlemek üzere olduğunu tahmin ettiniz.

Michael Jordan:
Büyük miktarlarda veriniz olduğunda hipotezlere yönelik iştahınız da büyüme eğilimindedir. Ve eğer bu verilerin miktarı, istatistiksel sağlamlıklarından daha hızlı büyüyorsa, o zaman çıkarımlarınızın birçoğunun yanlış olması, beyaz gürültü olması muhtemeldir.

Spectrum:
Nasıl yani?

Michael Jordan:
Klasik bir veritabanında, elinizde diyelim ki birkaç bin insan var. Bunları veritabanının satırları olarak düşünün. Sütunlar da bu insanların özellikleri olsun: yaşları, boyları, ağırlıkları, gelirleri, vesaire.

Şimdi, bu sütunların bileşimlerinin sayısı, sütun sayısına göre üstel olarak artar. Yani bir sürü, bir sürü sütununuz varsa —modern veritabanlarında olacağı gibi— o zaman her bir kişiye ait milyonlarca ve milyonlarca vasıfla karşılaşacaksınız.

Şimdi, eğer bu özelliklerin bütün bileşimlerine bakma iznini kendime tanıyacak olursam — Pekin’de yaşıyorsa, ve işe bisikletle gidiyorsa, ve belirli bir işte çalışıyorsa, ve belirli bir yaştaysa — belirli bir hastalığı taşıma ya da benim reklamımı sevme olasılığı nedir? Şimdiyse milyonlarca vasfın bileşimlerine bakıyorum ve bu bileşimlerden de üstel sayıda var; böylece evrendeki atomların sayısı mertebesine ulaşırız.

Dikkate almak istediğim hipotezler bunlar. Verilmiş herhangi bir veritabanında herhangi bir sonucu —sadece şans yoluyla— mükemmelen kestirecek sütunlar bileşimini arıyorum. Kalp krizini kestirecek sütun bileşimlerini arıyorsam eğer, kalp krizi geçiren bütün kişileri kalp krizi geçirmeyen bütün kişilerle karşılaştırsam bile, türlü türlü yalancı sütun bileşimleri bulurum, çünkü bunlardan muazzam sayıda vardır.

Yani milyarlarca maymunun daktilo yazması gibi bir şey bu. Birinden birisi Shakespeare’i yazacaktır.

Spectrum:
Büyük verinin bu yönünün şu anda az mı değer gördüğünü düşünüyorsunuz?

Michael Jordan:
Kesinlikle.

Spectrum:
İnsanların büyük veride vaat ettikleri halde yerine getiremeyeceklerini düşündüğünüz şeyler nelerdir?

Michael Jordan:
Veri analizinde belirli nitelik düzeylerinde çıkarım yapılabildiğini düşünüyorum. Ama bu nitelik düzeylerinin ne olduğu hakkında net olmamız lazım. Yaptığımız kestirimlerin hepsinin etrafında hata çizgileri olmalı. Mevcut makine öğrenmesi literatürünün çoğunda eksik bir şey bu.

Spectrum:
Eğer verilerle çalışan insanlar bu öğüdünüze uymazlarsa ne olacak?

Michael Jordan:
Köprü inşası analojisini kullanmayı seviyorum. Eğer ilkelerim yoksa, gerçek bir bilim olmadan binlerce köprü inşa ettiysem, bunlardan bir sürüsü yıkılacak ve büyük felaketler yaşanacaktır.

Bunun gibi, eğer insanlar verileri kullanırken, veriyle yapabildikleri çıkarımları kullanırken, hata çizgilerini, heterojenliği, gürültülü verileri, örnekleme örüntüsünü dert etmezlerse, yani mühendis ya da istatistikçiyseniz ciddiye almanız gerekecek olan bütün şeyleri dert etmezlerse — o zaman bir sürü kestirim yapılacaktır, ve kimi zaman gerçekten ilginç sorunların çözülmesi şansı da vardır. Ama bazen de felaket kötü kararlar verilir. Aradaki farkı önsel [a priori] olarak bilmeyeceksiniz. Sadece bu çıktıları üreteceksiniz ve umudunuzu yüksek tutacaksınız.

İşte bugün burada bulunuyoruz. Bir sürü insan işe yaramasını umduğu şeyleri inşa ediyor, ki bunlar bazen işe yarıyor da. Bir açıdan bakarsak, bunda yanlış hiçbir şey yoktur; bu keşifseldir. Ama toplumun bütünü buna tahammül edemez; bunların işe yarayacağını ummakla yetinemeyiz. İnşaat mühendisleri, ayakta durma güvencesi verilebilen köprülerin nasıl inşa edildiğini zamanla öğrendi. Yani büyük veriye yönelik gerçek bir mühendislik yaklaşımına ulaşılması, akılcı yanıtlar sunulduğundan emin olunması, hataların olabilirliğinin nicelendiğinden emin olunması, zannediyorum ki onlarca yıl alacaktır.

Spectrum:
Bu hata çizgilerini sağlayacak araçlara şu anda sahip miyiz?

Michael Jordan:
Bu mühendislik bilimini daha ancak toparlıyoruz. İstatistik ve bilgisayar biliminin yüzlerce yıllık çalışmasından gelen birçok fikre sahibiz. Bunları bir araya koymaya, ölçeklenebilir hale getirmeye çalışıyoruz. Birçok hipoteze ait hata oranını belirten ailevari hata [familywise error] denilen niceliklerin denetlenmesine dair bir sürü fikir son 30 yıl içinde çıkmış. Ama bunların birçoğu üzerine hesaplamalı çalışma yapılmamış. Bunların halledilmesinin matematiği zordur, mühendisliği de zordur, zaman alacaktır.

Bir ya da iki yıl değil. Bu işi doğrultmak onlarca yıl alacaktır. Büyük veri işini iyi yapmayı öğreniyoruz halen.

Spectrum:
Büyük veri ve sağlık üzerine yazılanlarda sanki her üç öyküden biri, neredeyse otomatikman elde edeceğimiz harika klinik içgörülerden bahsediyor, sırf herkesten veri toplayarak, özellikle de bulut üzerinde.

Michael Jordan:
Buna konuda tamamen kuşkucu ya da tamamen iyimser olamazsınız. Ortada bir yerlerdedir. Bir verinin analizinden çıkan hipotezlerin hepsi listelenirse, bunların bir kısmı kullanışlı olacaktır. Ama işte bunun hangi kısım olduğunu bilmezsiniz. Yani eğer onlardan birkaç tanesini çekiyorsanız —diyelim ki yulaf kepeği yerseniz mide kanseri olmayacaksınız, veri bunu belirtiyor olsun— bir ihtimal şansınız yaver gidebilir. Bu veri bir destek sağlayabilir.

Ama gerçekten hata çizgileri sağlayacak ve hataları niceleyecek tam-ölçekli mühendislikle istatistiksel bir analiz yapmıyorsanız bu bir kumar oyunudur. Kumarı hiçbir veri olmadan oynamaktan iyidir. O saf bir rulet olurdu. Buysa bir nevi kısmi bir rulettir.

Spectrum:
Tarif ettiğiniz yörüngeyi izlemeyi sürdürürsek büyük-veri alanını ne gibi olumsuz neticeler bekliyor olabilir?

Michael Jordan:
Esas netice bir “büyük-veri kışı” olacaktır. İnsanların yatırım yaptığı ve bir sürü şirketin ciddi analizler sağlamadan büyük vaatler verdiği bu balon, daha sonra patlayacaktır. Kısa süre —iki ila beş yıl— içinde insanlar “Bütün bu büyük-veri olayı geldi ve gitti. Öldü. Yanlıştı.” diyecekler. Bunu tahmin ediyorum. Çok fazla hayp olduğunda bu döngüler böyle olur. Yani gerçek sorunların ne olduğuna dair bir anlayışa dayanmayan, sorunların çözülmesinin onlarca yıl alacağının anlaşılmasına dayanmayan, düzenli ilerleme kaydedecek olsak bile teknik ilerlemede büyük bir sıçrama yapmamış olduğumuzun anlaşılmasına dayanmayan savların neticesi budur. Daha sonraysa veri analizi için vasıtalar bulmanın çok zor olacağı bir dönem olacaktır. Alan ileriye doğru gitmeye devam edecektir, çünkü gerçektir ve ihtiyaç vardır. Ama bu geri tepme çok sayıda önemli projenin canını yakacaktır.

~~~ 1 Milyar ABD Dolarıyla Ne Yapardı ~~~

Spectrum: Buna harcanan para miktarını düşünürsek, sunulan reklamların arkasındaki bilim halen inanılmaz ilkel görünüyor. Saçma Kickstarter projelerini araştırma hobim var, genelde ne kadar akıldışı olduklarını görmek için, aynı şirketin aylarca sunduğu reklamları izlerim.

Michael Jordan:
Yani yine, bu bir spektrum. Bir sistemdeki mühendisliğin ne olduğuna, hangi sahadan bahsettiğimize bağlıdır. Belirli dar sahalarda çok iyiyken, semantiğin çok daha bulanık olduğu daha kapsamlı sahalarda çok kötü olabilir. Ben kişisel olarak Amazon’un kitap ve müzik tavsiye sistemini çok, çok iyi buluyorum. Bunun nedeni büyük miktarlarda veriye sahip olmaları ve sahanın sınırlarının çok belirli olmasıdır. Gömlek ya da ayakkabı gibi sahaların semantiği daha bulanıktır ve daha az veri vardır, bu yüzden çok daha kötüdür.

Halen birçok sorun bulunuyor ama bu sistemleri inşa eden insanlar da çok çalışıyorlar. Bu noktada karıştığımız olay semantik ve insan tercihleridir. Eğer ben bir buzdolabı satın almışsam, bu benim genel olarak buzdolaplarıyla ilgilendiğimi göstermez. Zaten buzdolabımı satın almışımdır ve olasılıkla bunlarla ilgilenmeyi sürdürmem muhtemel değildir. Oysa Taylor Swift’in bir şarkısını satın aldıysam, başka şarkılarını da satın almam muhtemeldir. Şarkıcıların ve ürünlerin ve öğelerin özgül semantiğiyle ilgili bir şey bu. İnsan ilgilerinin geniş spektrumu boyunca bunu doğrultmak, büyük miktarda veriye ve büyük miktarda mühendisliğe gereksinim duyuyor.

Spectrum:
“Kısıtlamasız 1 milyar dolarlık hibeye sahip olsam doğal dil işleme üzerine çalışırdım” dediniz. Google’ın Google Translate’le yaptığı şeylerin ötesinde ne yapardınız?

Michael Jordan:
Eminim Google benim yapacağım her şeyi yapıyordur. Ama Google Translate’in, yani makine çevirisinin, tek dil sorunu olduğunu düşünmüyorum. Başka bir dil sorunu örneği soru yanıtlamasıdır, mesela “Kaliforniya’da bir nehrin yanında olmayan ikinci büyük şehir hangisidir?” Şu anda bu cümleyi Google’a yazarsam kullanışlı bir yanıt almam muhtemel değildir.

Spectrum:
Yani bir milyar dolar karşılığında en azından doğal dil meselesinde genelleştirilmiş bilgi sorununu çözebilirim ve büyük yapay zeka kodamanına —insan gibi düşünen makineye— ulaşabilirim mi diyorsunuz?

Michael Jordan:
Tabi her şeyi konu almasa da ilerlemenize izin veren daha küçük bir problemi kenara koymak istersiniz. Araştırmada yaptığımız şey budur. Özgül bir sahayı alırım. Biz esasen coğrafyadaki soru-yanıtlaması üzerine çalıştık. Bu benim belirli tür ilişkilere, belirli tür verilere odaklanmama izin verir, dünyadaki her şeye değil.

Spectrum:
Yani soru yanıtlamasında gelişim yapabilmek için bunu özgül bir sahayla mı sınırlandırmak lazım?

Michael Jordan:
Ne kadar ilerleme yapabileceğinize dair ampirik bir soru bu. Sahalarda ne kadar verinin müsait olduğuyla ilgilidir. İnsanların bu sahalardaki bilgilerinin bir kısmını yazıya geçirmeye hemen başlamaları için ne kadar ödeme yapabileceğinizle ilgilidir. Ne kadar etiketiniz olduğuyla ilgilidir.

Spectrum:
Bir milyar dolarla bile elimizde kalanın, yine genelleştirilmemiş, yalnızca tek bir sahada çalışan bir sistem olacak olması hayal kırıcı görünüyor.

Michael Jordan:
Her bir teknolojideki evrimleşme tipik olarak böyle olmuştur. Görme üzerine konuşmuştuk. İlk görme sistemleri yüz-tanıma sistemleriydi. Sahaya bağlıydılar. Ama bu saha, bazı ilk ilerlemeleri görmeye başladığımız ve işe yarayacaklarını hissettiğimiz yer olmuştur. Benzeri şekilde konuşmada, ilk ilerlemeler bağlantısız tek sözcükler üzerineydi. Ardından yavaş yavaş tam cümleleri yapabildiğiniz yere gelmeye başladı. Her zaman olan bu türde bir ilerlemedir, sınırlanmış bir şeyden, daha az ve daha az sınırlanmış bir şeye doğru.

Spectrum:
Neden daha iyi soru-yanıtlamasına ihtiyacımız var ki? Google bu haliyle yeterince iyi çalışmıyor mu?

Michael Jordan:
Google’ın tam olarak bunu çalışan çok sağlam bir doğal dil işleme grubu var çünkü belirli türdeki sorgularda çok kötü olduğunun farkındalar. Mesela değil/olmayan sözcüklerinin kullanımında. İnsanlar değil/olmayan sözcüklerini kullanmak istiyorlar. Mesela “Bana bir nehrin yanında olmayan bir şehir ver.” Mevcut Google arama motorunda bu sorgu pek hoş karşılanmıyor.

~~~ Tekillik Üzerine Nasıl Konuşmamak Gerekir ~~~

Spectrum: Şimdi diğer kimi konulara dönersek, Silikon Vadisindeki biriyle konuşuyor olsaydınız ve size “biliyorsun, profesör Jordan, ben hakikaten tekilliğe çok inanıyorum” deseydi, ona dair görüşünüz artar mıydı azalır mıydı?

Michael Jordan:
Şanslıyım ki böyle insanlarla asla karşılaşmıyorum.

Spectrum:
Eh, hadi canım.

Michael Jordan:
Gerçekten karşılaşmıyorum. Mühendis ve matematikçilerden oluşan entelektüel bir kabuk içinde yaşıyorum.

Spectrum:
Ama ya böyle biriyle karşılaşsaydınız, ne yapardınız?

Michael Jordan:
Akademik şapkamı çıkarırdım ve önümüzdeki onlarca yılda neler olacağını düşünen bir insan olarak davranırdım sadece, ve bilim kurgu okuduğumda olduğu gibi eğlenirdim. Yaptığım akademik herhangi bir şeyin bilgisini beslemez bu.

Spectrum:
Peki ama yaptığınız akademik şeylerin bilgisiyle buna dair ne düşünürsünüz?

Michael Jordan:
Anladığıma göre bu akademik bir disiplin değil. Bu daha ziyade, kısmen, toplumun nasıl değiştiğine, bireylerin nasıl değiştiğine dair felsefe, kısmen edebiyat, bilim kurgu gibi, bir teknoloji değişiminin neticelerini enine boyuna düşünmek. Ama bunlar algoritmik fikirler üretmiyor benim bildiğim kadarıyla, çünkü böyle fikirler görmüyorum, teknolojik ilerlemeyi nasıl yapacağımıza dair bilgimizi besleyen bir şey görmüyorum.

~~~ P = NP Olup Olmamasından Daha Çok Neyi Önemsiyor ~~~

Spectrum: P = NP olup olmadığına dair bir tahmininiz var mı? Önemsiyor musunuz?

Michael Jordan:
Polinomyal ve üstel arasındaki farkı genelde fazla dert etmiyorum. Daha çok düşük-dereceli polinomyal —lineer zaman ve lineer uzay— ile ilgileniyorum. P ve NP, algoritmaların polinomyal ve üstel olarak kategorize edilmesiyle ilgilidir, burada polinomyal çözülebilir demektir, üstel ise çözülemez demektir.

P’nin NP’ye muhtemelen eşit olmadığını çoğu kişinin kabul edeceğini düşünüyorum. Bir parça matematik olarak bunu bilmek çok ilginçtir. Ama bu katı ve keskin bir ayrım değildir. Üstel zamanlı algoritmaların birçoğu, biraz da modern bilgisayarların gelişimiyle, belirli sınırlandırılmış sahalarda uygulanabilir olmuştur. Dahası, polinomyal, en büyük sorunların çözümünde yetersiz kalır. Polinomyal, belirli bir lineerüstü oranda —mesela kuadrik ya da kübik— artış olduğu anlamına gelir sadece. Ama esas ihtiyaç duyulan şey, lineer artış olmasıdır. Yani beş veri noktası daha aldığınız zaman, beş tane daha işleme ihtiyaç duyulacak olmasıdır. Hatta lineeraltı —mesela logaritmik— olmasıdır. Logaritmik, 100 yeni veri noktası aldığımda, iki kat büyür; 1000 tane aldığımda, üç kat büyür.

İdeal olan budur. Bu türdeki algoritmaların üzerine odaklanmamız lazımdır. Buysa P ve NP meselesinin çok uzağındadır. P ve NP önemli ve ilginç bir entelektüel sorudur ama üzerine çalıştığımız şeylerin bilgisini fazla beslememektedir.

Spectrum:
Kuantum hesaplaması için aynı soru.

Michael Jordan:
Bütün bu şeylere akademik olarak merak duyuyorum. Bunlar gerçek. Bunlar ilginç. Araştırma alanım üzerinde hiçbir tesirleri yok aslında.

~~~ Turing Testi Gerçekte Ne Anlama Geliyor ~~~

Spectrum: Bir makinenin Turing testini geçtiğini görmeye ömrünüz yetecek mi?

Michael Jordan:
Yeteneklerin yavaş yavaş biriktirileceğini düşünüyorum, konuşma ve görme ve doğal dil gibi sahalar dahil. “İşte şimdi evrende yeni bir zeki varlık bulunuyor” demek isteyeceğimiz bir an muhtemelen hiçbir zaman gelmeyecek. Google gibi sistemlerin halihazırda belirli bir düzeyde yapay zeka sağladığını düşünüyorum.

Spectrum:
Kesinlikle kullanışlılar ama bir insanla asla karıştırılmazlar.

Michael Jordan:
Kesinlikle karıştırılmazlar. Çoğumuz açısından Turing testinde çok açık bir sınır çizgisi bulunduğunu sanmıyorum. Daha ziyade hepimiz zekayı gördüğümüzde tanıyoruz ve etrafımızdaki bütün cihazlarda bu yavaş yavaş ortaya çıkıyor. Tek bir varlıkta bedenlenmesi gerekmiyor. Çevremdeki altyapının önceye göre daha zeki olduğunu fark etmem yeterli. Hepimiz bunu her zaman fark ediyoruz.

Spectrum:
“Zeki” dediğinizde bunu sadece “kullanışlı”nın eş anlamlısı olarak mı kullanıyorsunuz?

Michael Jordan:
Evet. Bizim kuşağımızın şaşırtıcı bulduğu şeyleri —bilgisayarın ihtiyaç ve istek ve arzularımızı tanıyabiliyor oluşunu— çocuklarımız daha az şaşırtıcı bulacaktır, çocuklarımızın çocuklarıysa buna daha az şaşıracaklardır. Çevremizdeki ortamın kendini uyarladığı, kestirimci olduğu, dayanıklı olduğu zaten varsayılacaktır. Ortamınızla doğal dil yoluyla etkileşme yeteneğinizi de içerecektir bu. Bir noktada, ortamınızla doğal bir konuşma sürdürebiliyor olmak sizi şaşırtabilir. Ama zaman geçtikçe, böyle şeylerin daha incelikli, daha dayanıklı, daha kapsamlı olduğunu göreceğiz. Bir noktada “vay be, bunlar ben çocukken çok farklıydı” diyeceğiz. Turing testi alandaki ilk çalışmalara yardım etti, ama sonuçta bu, Kunduz Festivali gibi bir çeşit medya olayı olacaktır, gerçekte önemi olmayan bir şey olacaktır.

Yazar Hakkında: Lee Gomes, eski Wall Street Journal muhabiri, yirmi yılı aşkın süredir Silikon Vadisini konu alıyor.

Türkçesi: Işık Barış Fidaner

Not: Michael Jordan görüşmenin yayınlanmasının ardından yazdığı blog yazısında görüşme yapan Lee Gomes’in yaptığı çarpıtmaları kınadı. Aktaran: Amaç Herdağdelen

Yorum Yap


Not - Bunları KullanabilirsinizHTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>