Yapay zeka, nesnelerin interneti, 3 boyutlu yazıcılar derken otonom araçlara kadar bir çok teknolojik kavram hayatımızın içine yerleşti. Ülkemizin popülist firmaları ve ticari popülizmden beslenen akademisyenleri de olabildiğince ön planda konuşuyor, bir araya geliyor ve hatta STK lar ile hummalı çalışmalar yaparak sürekli bir etkinlik düzenleniyor. Bu çalışmaları yapan ve benim bizzat tanıdığım hiç kimsenin henüz bir robot geliştirdiğini veya literatüre şunu katmış diyebileceğim bir çalışmasına tanık olmadım. Eminim gizlilik projeleri çerçevesinde ülkemiz için çok faydalı çalışmalar yapıyorlardır. Hatta öyle güzel çalışmalar yapılıyor ki, bu çalışmaları gizlemek adına ikili ilişkiler ile bitirilen ihaleler hiç incelemeye tabi tutulmayacak gibi rahatça yada doğrudan teminler hemen bitiveriyor. Gördünüz mü bakın, ülkemde teknoloji anlatmak bu kadar zor. Ama ben özellikle yeni nesiller ve hakikat ile geliştirme yapmak isteyenler için yazıyorum. Okuması da, eleştirmesi de yeni nesillere aittir…
Andrew Ilachinski tarafından 2017 yılının Ocak ayında ayında hazırlanan Robot and Swarm “Sorunlar, Sorular ve Çalışmalar” isimli araştırmasında da görüleceği üzere aslında bir kaç ülke ve az sayıda üniversite dışında, ülkemiz piyasasında ne geliştirmek mümkün görünüyor, ne de geliştirmeye destek olanlar nedense ortalıkta pek görünmüyor. Ülkemde faaliyet gösteren bir çok üniversitenin ufku geniş hoca ve yetenekli öğrencilerin de yeteri kadar ilgi görmemesi ve desteklenmemesi ise hepimizin malumu kanayan bir yara…
2016’da çokça duymaya başladığımız ,kendiliğinden çalışan otomobiller’de yapay zekanın gelişimi, yüksek oranda başarılı dil çevirileri ve büyük veriler gibi başlıklara aşina olduk. Bu bilgilerle eş zamanlı olarak hayatımıza dahil olan fidye yazılımları, botnet ve farklı saldırı türlerinin yükselişine de tanıklık ettik. Üstelik siber suçlular gelişen teknolojiye endeksli olarak kendilerini geliştiriyor ve yeni siber suçlar için hazırlıklar yapıyorlar. Bu tip analizlerin yapılması için insan gücünü tamamlamaya yönelik makinelerin öğrenme türlerini algılamaya çalışan insanlar”Machine Learning” kavramı ile yatıp kalkıyor diyebiliriz. Üstelik 2021 yılına kadar Büyük veri, Siber istihbarat ve analitik harcamalarının 96 milyar dolara ulaşacağı da ön görülüyor.
Ülkemizde yapılan “Siber” başlığı altındaki çalışmaların iki tarafı bulunmaktadır. 1- Kamu 2- Özel Sektör. Özel sektör ve kamunun birbirine bağımlı olduğunu söylemek elbette ki mümkün. Kamu tarafı da özel sektör den arkadaşlar bu yazıyı okuyorlarsa zaten hakikat ile yüzleşeceklerdir. Tek bir örnek verelim ve bu konuyu da kapatalım. Siber güvenlik alanında kullanılan ürünlerin markaları nelerdir? Bulut denilen yapı da dahil olmak üzere sunucular hangi markaların teknolojisidir? %100 yerli diye geliştirilen güvenlik ürünleri hakikaten %100 yerli midir? Sanırım bu sorular Arif olanlar için kafidir.
Machine Learning (ML) (Makine Öğrenme) sınıflandırma tekniklerine ilişkin iki ana tür vardır. “Denetimli Öğrenme ve Denetimsiz Öğrenme” bu iki tür kabul ettikleri veriler yani girdiler ile farklılaştırılmışlardır. Denetimli öğrenme, etkileri farklılaştıran şeyleri öğrenme görevi ile birlikte bir dizi etiketli eğitim verisi ile sağlanan algoritmalara da atıfta bulunur. Örneğin ML, doğrulanmış spam e-postalarını doğrulanmış meşru e-posta ile karşılaştırarak ve hangi “özelliklerin” birinde veya daha fazlasıyla daha sık göründüğünü göz önüne alarak bunu önemli ölçüde geliştirmişti. Kısacası sınıflandırma ML tekniklerinin en önemli uygulamalarından biridir. Bir diğer teknik ise tahmin başlığıdır. Tahmin yapmak adına yapılan çok önemli teknoloji ve araştırmalar da bilinmektedir.
Denetimsiz öğrenme, etiketli eğitim verileri ile sağlanan algoritmalara atıfta bulunur ve kategorileri tek başına çıkarır. Bu işlemin bir insan tarafından DLP (Data Loss Prevention) için veri sınıflandırılması adına (her ne kadar bir tool olsa bile) ne denli zahmetli olduğunu biliyoruz. Bu durumda ML başlığı ile hayatın ne denli kolaylaştığını da ön görebilmekteyiz.
Keşke, siyasi ve politik tüccarları ML ile yeniden güncelliyebilseydik, belki de sürekli tartışma, çekişme ortamı yerine “bak bunu geliştirdim – (Alkış Sesleri), helal adam bunu geliştirmiş (Alkış Sesleri) hakikat ile yeni nesillere destek vermişler helal olsun(Alkış Sesleri) denilebilse. Yine değinmeden geçemeyeceğim, 200+ CEO (Chief Executive Officer)bir araya geldik ve hepsi birbirinden çok değerli diye hakikat karşısında sinirlenen ve başka bir düşünceyi kabul etmeyen Vatansever olduğunu dile getiren kardeşlerimiz ile sanal dünyanın sanal platformu dışında bir kere tokalaşmış ve hakikaten politik gülümseme ve iletişim türlerini görünce hemen uzaklaşmıştım. Son olarak sanal dünyanın, sanal platformu olan ve 200+ üzeri CEO (Chief Executive Officer)’nun bir arada olduğu ve milli teknolojilerden bahsederken Five Eyes’a hizmet eden yabancı bir platform üzerinde konuşmak yerine, en azından kıymetli olabilmeleri için veya kıymet algısının herkes tarafından kabul gören kısmının hakkını verebilmek için lütfen bir tane iş yapın bende alkışlayayım. İş derken, ticari kazanç elde edilen satış ve pazarlama işlerinden bahsetmiyorum. Bilişim Bakanlığı kurulmalı iddiasında olanların ortaya en azından Linkedin benzeri bir platform yada Boston Dynamics ile Akın Soft tarafından geliştirilen robot arası bir bilişim göstergesi çıkartması gerekmez mi? Ben o 200+ CEO yu tanımıyorum tabi. Ama Çok daha fazla CEO‘nun beni tanıdığını ve benimle çalışabilmek için geçerli olan birimin para olmadığını da çok iyi bildiklerinden eminim. Ancak ben halen daha Vatan, Millet, Bilişim, Teknoloji gibi kavramların hakkını verebilen pek kimseyi göremedim. Gördüklerim yada bildiklerim de geliştirmekten fırsat bulup vitrine çıkmak pek istemiyorlar.
Gelelim Machine Learning konumuza….
Bir ML aracı oluşturmak için gerekli olan adımlar farklılık gösterebilir ancak genellikle aşağıdaki şekilde devam eder:
1- Veri Toplama- Akışa dayalı ve gerçek zamanlı verilere (örneğin bitcoin borsasına dayalı alım-satım kararına) dayanan ML algoritmalarını çalıştırmak ve hatta oluşturmak bile mümkün. Teknikler çoğu zaman verileri önceden derleme, verileri önceden toplama ve depolanan verileri kullanarak bir model oluşturma üzerinedir.
2- Veri Temizleme- Ham veriler genellikle ML amaçları için kullanılmaz. Eksik yada tutarsız veri kullanımı olabilir. (örn: “Batı, “batı” “W”, hepsi aynı anlamı içerebilir) ve sayısal olmayan sayısal verilere sahip diğer pek çok olası sorun olabilir.Bu adımla, birden fazla veri kaynağının, kullanılabilir tek bir kaynakla birleştirmeyi sağlamaktadır. Temizleme işlemi zaman alan ve sürekli yenilenen bir işlemdir. Geliştiricilerin iyi bildiği gibi, bir sorunu çözmek genellikle başka bir sorunun tespit edilmesine de katkı sağlar.
3-Özellik Mühendisliği– Tüm veriler kullanıma hazır olduktan sonra, yukarıda açıklandığı gibi veriden maksimum bilginin elde edilmesinin vaktinin geldiği andır. Bu işlem genellikle ML algoritması oluşturmadan önce gerçekleşmektedir.
4- Model Oluşturma/ Model Doğrulama– Bu adımlar dizisinde, modelin oluşturulmasını ve etiketlenmemiş veriler üzerinde testleri içerir. elbette ki test sırasında istatistiksel verileri göz önünde tutmalıyız. Aksi halde Denetimli ML ile çalışırken, modelin eğitim verisine aşırı yük getirilebilir. Bu riski en aza indirgemek adına kullanılması gereken istatistiksel teknikler vardır.
5- Dağıtım / İzleme- Genel olarak ve özellikle ağ trafiği durumunda , geçmiş gözlemlerin gelecekteki etkinliklerle eşleşmesi zorunlu değildir. Bu nedenle dağıtımdan sonra bile modeller izlenir ve yüksek performans sağlamak için bu adım tekrar tekrar uygulanır.
Evet Machine Learning üzerine bir şeyler yazdık. Peki biz ne zaman İnsan Öğrenme üzerine konuşacak ve geliştirdiğimiz teknolojileri alay konusu olmaktan çıkarıp, insanlık tarihinde edindiği başarılar ile bu günlere gelmemize referans olanlara layık olabilecek miyiz?
Dipnot: Boğaziçi Üniversitesi Robotik Kulübü, ODTÜ Robotik Kulübü, Sakarya Üniversitesi Robotik Kulübü ve KTÜ (Karadeniz Teknik Üniversitesi) Robotik Kulüpleri başta olmak üzere tüm yeni nesil geliştiricilere selam olsun. Bir an evvel Asalet, hakikat gibi kavramların genlerinde barındıran gençlerin iş hayatına atılarak hak ettiğimiz ve görmek istediğimiz milli bilince sahip bir yapay zekayı insanlığa kazandırmalıdır düşüncesindeyim.