RİSK YÖNETİMİNDE GÖRSEL TEKNİKLER : K. MERIH

VERİ ANALİZİNDE VE RİSK YÖNETİMİNDE GÖRSEL TEKNİKLER ÇAĞI (Kutlu MERİH ile Söyleşi)

C umhur C. KÜÇÜKÖZMEN     @ckkucukozmen

Geçtiğimiz haftalarda Fatma Çınar’la yaptığımız söyleşide enformatik dünyası ile ilgili güncel gelişmeler konusundaki mistiği büyük ölçüde aydınlığa kavuşturmaya çalışmıştık. Bir nevi devam niteliği taşıyan bu söyleşide ise nasıl toplandığı nasıl saklandığı ve nasıl servis edildiğinden bağımsız olarak bilgi yine bildiğimiz bilgi ve yapılan iş bildiğiniz bilgi işlem konusunu farklı boyutta ele alacağız. Konuğumuz Doç. Dr. Kutlu Merih.

Cumhur KÜÇÜKÖZMEN: Hocam bu konu yani enformatik konusu gündeminize nasıl girdi?

Ben enformatik dünyasına 1960’larda kollu Facit hesap makinesi ve logaritma cetvelleri kullanarak girdim. Bilgisayar ile altmışlı yılların sonunda tanıştım. Öğrendiğim kullandığım daha sonra demode olan ve unuttuğum programlama dilleri onları aştı. 100K hafızası olan bir IBM 1130 bizim için bir bilim kurgu aracı idi. 1980’lerde ilk PC’mizi edindiğimizde ona fabrika çıkışlı bir otomobil fiyatı ödemiştik. Diski bile yoktu. 10MB, 20MB diskler bizim için rüya ürünler idi. Bir kuruluşa 80 MB diski olan bir PC kurduğumuzda ne kadar şanslı olduklarına gıpta etmiştim. Günümüzdeki durumu ise biliyorsunuz söylemeye bile gerek yok. GB, TB ve daha ötesi çocuk oyuncağı oldu. Peki, bu gücü ve kapasiteyi bilgi işlem için kullanabiliyor muyuz? Ne yazık ki buna evet diyemiyorum. Bu güç müzik, video şu bu gibi uygulamalarla israf ediliyor. Bilgi işleme yansıması ise görsel olarak daha etkileyici grafikler yapabilmenin ötesine geçemedi. Buna batıda veri görselleştirme (data visualisation) diyorlar allayıp pullayıp pazarlıyorlar.

CK: Veriyi bilgiye dönüştürme günümüzde hangi düzeyde?

1970’lerde de günümüzde de enformatiğin temel problemi veriyi bilgiye dönüştürmek ve stratejik karar girdisi haline getirmektir. Günümüzün gelişmiş teknolojisi ile daha hızlı ve etkili yapılabilmesi işin özünü değiştirmiyor.Veriyi bilgiye dönüştürme süreç ise 70’li yıllardan fazla ilerde değil. Nedeni de basit veriyi bilgiye dönüştürme süreçleri ve teknolojisi (datamining) hala ileri düzeyde matematik, istatistik ve enformatik uzmanlığı gerektiriyor. Bu da herkesin harcı değil. Böylece veriyi bilgiye dönüştürme süreci hala elit bir azınlığın tekelinde bu da veri analistleri ile karar vericiler arasında bir iletişim kopukluğuna, hatta bozukluğuna neden oluyor. Enformatik çağın öncesinden kaynaklanan eğitimimiz ve yönetim kültürümüz kaliteli bir karar verme sürecinin ileri düzeyde matematik ve enformatik beceriler gerektirdiği konusunu bize dayatıyor.


CK: Yeni yaklaşımların gecikmesinin esas nedeni nedir?

Bunu yanıtlamak için günümüz gerçeğini görmek gerekiyor. Kapsamlı bir konu ancak ben sadece temel eğitimi yüksek matematik, istatistik ve Yönetim Bilimi olan bir uzman olarak matematik ve istatistiğin günümüzdeki devasa veri kütlelerinin değerlendirilmesinde son derece yetersiz olduklarını vurgulamakla yetineyim. Matematik ve istatistik yapıları gereği az sayıdaki değişkeni yansıtan az sayıdaki veriyi analiz etmek için geliştirildi. Geçek dünya ise nümerik, kategorik, lojik çok sayıda değişkenin devasa boyutlardaki veri kütlelerini üretiyor. Eğer ne yaptığını bilen bilinçli bir veri analisti iseniz bu veri kütleleri ile matematik ve istatistiğin başa çıkmayacağını hemen görebilirsiniz. Günümüz uygulamaları veriyi toplama, depolama ve iletişimi üzerine yoğunlaşmış. Bu veri kütlesinden ne gibi yorumlar çıkarılabileceği yukarda değindiğimiz uzmanlık gereksinmeleri yüzünden biraz gölgede kalmış.

CK: Peki Hocam siz bu anlayışa nasıl geldiniz.

Ben emekli olsam da akademik çalışmalarım devam ediyor. Ben 1968 İstanbul Üniversitesi Fen Fakültesi mezunuyum ve1960 sonlarından beri enformatik dünyasındayım. Delikli kartlar ile program çalıştırmak sürecinde eğitilerek geldim. Enformatiğin hem teorisinde hem de pratiğinde çalışma olanaklarım oldu. 1970 başlarında PL/1 dili ile İngiltere de Enerji sistemlerinin simülasyonu ve LP programlarını yazabiliyordum. O zaman başka bir şehirdeki 100K hafızası olan ana bilgisayara programları yükleyip sonuçları heyecanla beklerdik. SPSS paketinin de olanaklarından yaralanırdık. Şimdi ise bilgisayarları gücünü, hızını ve yazılımları biliyorsunuz. Yaptığım projelerden birini örnek vereyim: Temel kaynak hastane otomasyonu ve R yazılımı: Uzun yıllar MIS (bilgi yönetim sistemleri) dersleri verdim ama daha da önemlisi on yılı aşkın bir süre Hastane Otomasyonu yazılımı geliştirip bu projeleri fiilen yönettim. Bu da bana mutfağın sorunları konusunda son derecede değerli bilgiler sağladı.

CK: Bu durumda günümüz enformatik teknolojisi bu yaklaşıma cevap verebiliyor diyebilir miyiz?

Günümüzde bu sorunla başa çıkabilecek enformatik teknolojiler ve yazılımlar mevcut fakat hem uzmanlar hem de yöneticiler bunları kullanabilecek şekilde yetiştirilmediler. Günümüzün yönetici ve uzman elitleri enformatik çağı öncesi bir profesyonel eğitime sahipler. Bu da onları hep konvansiyonel-analitik düşünmeye ve konvansiyonel-analitik çözümler aramaya zorluyor. Ben bu noktada şimdi neler yapılabileceği üzerinde durmak istiyorum. Günümüzde etkili bir veri analizi için kullanabileceğimiz tekniklere ve yazılımlara göz atarsak burada bir eksik olmadığını görüyoruz. Benim kanım, enformatik dünyası günümüzdeki uygulamalardan on yıl ilerde buna karşılık yönetici elit bunu kullanabilecek eğitim ve bilince sahip değil. Internet bu konuda son derece etkili ve gelişmiş, ortalık adeta açık kaynak yazılım kaynıyor ama üniversitelerin bile bunları kullanmakta yetersiz kaldıklarını hayretle görüyoruz.

CK: Grafik-Datamining dediğiniz yani grafik-Veri Madenciliği yaklaşımının üstünlüğü nereden kaynaklanıyor?

Bu yazılımların katkısı çözümleri grafik olarak gösterebilme yeteneklerinden kaynaklanıyor ve bu grafikler ileri düzeyde kapsamlı, ayrıntılı ve görsel olarak da etkileyici. Bugünün yazılım teknolojisi bu tür grafiklemeyi ileri düzeyde sağlıyor. Benim gençliğimde bir resim bin kelimeden etkilidir derlerdi şimdi bunun gerçek olduğunu görüyoruz. Bu grafikleri yorumlamak ileri düzeyde analitik beceriler gerektirmiyor. Konuyla ve sektörle ilgili ve makul seviyede profesyonel bilgisi olan herkes bu tür grafikleri üretme ve elde ettiği sonuçlardan analiz yapabilme yeteneğine sahip oluyor. Böylece büyük veri veya herhangi bir veri setiyle ilgili sorun, uygun grafiklerin üretilebilmesine dönüşüyor.

CK: Bu yaklaşımın ne ayrıcalığı ya da ne gibi avantajları var?

Bu yaklaşıma konsantre olanların stratejik yönetimde bir adım önde olacağını düşünüyoruz. Bu bağlamda önerdiğimiz “grafik data mining” yani “grafikleme yoluyla veri madenciliği” yaklaşımı bu sorunun çözümü için ileri düzeyde, her sektöre ve her profesyonel yeteneğe uygun kolaylıklar getiriyor. Ayrıca data mining uygulamaları alanında dünyada ilk defa grafik tabanlı bir analiz ve yorumlama tekniği gündeme getirmiş oluyoruz. Bu yazılım teknolojileri aynı veri seti için sınırsız alternatif ve grafik yapma olanakları sağlıyor. Grafik data mining bunlar arasında enformasyon sağlayabilecek olanları tasarımlamak ve yorumlamak becerileri gerektiriyor. Böylelikle veri analizi uzman bir elit azınlığın tekelinden çıkarak profesyonel bilgisi yeterli her analistin yapabileceği bir uğraş haline gelecek.

CK: Dünyada ilk defa gündeme getirdiğinizi söylediğiniz bu tekniğin üstünlüğü ve etkinliği nereden kaynaklanıyor?

Evet, inanması güç gelebilir ama geliştirdiğimiz teknik dünyada ilk kez uygulanan bir teknik. Bu yaklaşımın üstünlüğü ve etkinliği öncelikle veriye veri olarak yaklaşmakla başlıyor. Bunun anlamı verilerin de kimlikleri kişilikleri, huyları alışkanlıkları ve organik yapılarının olduğunu kabul etmek. Enformatik dünyası bir normlar ve standartlar dünyasıdır. Bunu gözden kaçırırsanız çok ciddi hatalar yaparsınız. Bu veriler yazılımların kabul edeceği şekilde tanımlanmalı ve formatlanmalıdır. Örneğin SQL dili tarih verisini “YYYY-AA-GG” formatında tanır. Eğer sizin verileriniz güncel “GG/AA/YYYY”  formatında ise ve böyle milyonlarca satırınız varsa ciddi bir sorununuz da var demektir. Tarihleri sistem böyle girdi diyerek kabullenirseniz ilerde veri analistlerinin başına büyük dertler açıyorsunuzdur.  Diğer bir örnek bildiğiniz Excel tabloları ondalık ayracı olarak virgül binlik ayracı olarak nokta kullanır. Eğer siz verilerinizi Excel dosyalarına nokta ondalıklı olarak girdi iseniz Excel bu sütunu sayı değil karakter kabul eder. Ve bu sorunu biçimlendirme ile çözemezsiniz. Yine binlerce satırınız varsa uğraşacağınız bir derdiniz de var anlamına gelir. Gerçi bunlar yine basit gibi görünen sorunlar ve anlaşılabilirlik açısından verdim bu örnekleri. Toparlarsam veri analizinin temel bileşeni iler teknoloji değil olaya bir veri analisti disiplini ile yaklaşmaktır. Eğer bunu yapmıyorsanız ileri teknolojiyi de kullanamaz işe yaramıyor diye suçlarsınız.

CK: Bu yaklaşım stratejik süreçlerde neden önemli?

Önceki söyleşinizde Fatma Çınar Hanım bu yaklaşımın nasıl uygulanacağı konusunda ayrıntılı bilgi vermiş, ben de neden etkili olacağı konusuna açıklık getireyim. Matematik ve istatistik verileri homojen kabul eder. Yeni veri dediğiniz şey aynı karakterde bir sayı veya sembol kütlesidir. Gerçek dünyada ise durum böyle değildir. Veri kütleleri çok karakterli ve organik bir yapıdadır. Diyelim ki bir kardiyoloji veri kütleniz var. Hastanız Kadın/Erkek, Evli/Bekâr, Sigara İçer/İçmez, İçki İçer/İçmez, Tansiyon Yüksek/Düşük vb olabilir. Burada bir kalp krizini etkileyebilecek ne kadar çok faktör (yüzlerin ötesinde) olabileceğini görebiliyoruz. Gerçekte hangi faktörün etkilediği ve ne kadar etkilediği sorusunun yanıt ise veri kütlesinin içindeki bir gizli bilgidir. Matematik ve İstatistik bu faktörlerin etkisini yansıtabilmekte yeterli değildir. Veri madenciliği teknikleri ise ileri düzeyde matematik ve istatistik bilgisi gerektirir. Yani analizi yapmak da çıkan sonucu yorumlamak da güçtür. Ama bu veri kütlesini bu faktörlerin etkisini yansıtan çok boyutlu grafikler haline getirirseniz ki bunu çok etkili yapabilen yazılımlar var, matematik/istatistik devre dışı kalır ve bir kardiyoloji uzmanı faktörlerin etkisini gözleri ile görür. Bu modeli işletmecilik, finans uygulamalarında da rahatlıkla kullanabilirsiniz.

CK: Bu niye ilk?

Bunun basit bir nedeni var, kapitalist sistemin kuralları önce eldeki aktiflerden verim almayı gerektiriyor. Enformatik dünyası da önce verilerin bilinen grafik formatlarında ama daha süslü püslü ve etkileyici bir şekilde sunulmasına ve pazarlanmasına öncelik veriyor. Veri görselleştirmek verileri içindeki gizli bilgiyi açığa çıkartmak değil görsel olarak etkileyici grafikler sunmak ve bundan rant toplamak olarak anlaşılıyor. Bizim yaklaşımımız bundan farklı. Biz doğrudan grafikler aracılığı ile datamining yapmayı ve grafiklerin veri setlerindeki gizli bilgilerin grafikler yardımı ile açıklamayı amaçlıyoruz. Google’da “Grafik Datamining” araması yapıldığında sadece bizleri görürsünüz.

CK: Bunu yeterince tanıtmayı başarabiliyor musunuz?

Biz başarabildiğimizi düşünüyoruz. Bu konuyu açıklamak için çok iyi bildiğiniz gibi Fatma Hanım ve sizinle birlikte çok sayıda bilimsel ve profesyonel toplantıya katıldık. Uygulamalarımızı gösterdik. Dinleyenler “ne kadar ilginç, ne kadar ileri düzeyde, adeta günümüzden on yıl ilerde ” şeklinde tepkiler verdiler ancak ardından dönüp yine bildiklerini uygulamaya devam ettiler. Bilgi ve uzmanlık profesyonellerin sermayesi artık işe yaramıyor, alışkanlıklar da kolay terk edilmiyor ve neticede mevcut tekniklerin demode olduğunu kabul etmek istemiyorlar.

CK: Anlattıklarınıza bakılırsa bu yaklaşım Risk Yönetiminde de yeni bir anlayışa geçişin işaretlerini veriyor, öyle mi?

Grafik Dataminig tekniğinin en çok Risk Yönetiminde işe yarayacağını düşünüyoruz. Bunu çok sayıda uygulama ile test ettik. Master tezleri ile destekledik. Konvansiyonel Matematik/İstatistik teknikler riski sayısallaştırıyor ve sayısallaşmış risk üzerinden hedge (risklere karşı korunma) teknikleri geliştiriliyor. Buradaki sayısallaştırma genellikle tek boyutlu zaman serileri ile yapılabiliyor ve bu riski etkileyen sayısal olmayan faktörleri göz ardı ediyor. İki boyutlu (x,y) grafikleri histogramlar ve pay grafikleri en az ve en yetersiz enformasyon sağlayan görsel araçlardır. Ama analitik-kartezyen eğitim sistemi bizleri bunları anlamaya ve yorumlamaya koşullandırmıştır. Size iki tane histogram göstersem ve hangisi daha asimetrik diye sorsam söyleyemezsiniz. İki pasta grafiğin hangisi daha fazla dağınık diye sorsam yine söyleyemezsiniz. Hâlbuki bu sorular risk yönetiminde önemli. Bunlar elle yapılması kolay ama enformatik verimleri düşük araçlardır. Veri görselleştirmede adeta bir sanat eseri gibi şeyler çıkarıyoruz ortaya.

 

Açıklayayım dilerseniz:

Riskin Kemanları: Veri analizinde ve Risk Yönetiminde en fazla enformasyon sağlayan grafiklerin alıştığımız tipten konvansiyonel grafiklerden farklı olduğunu keşfettik. Bunların başında Keman (violin) grafikleri geliyor. Bunlar iki boyutlu histogramlar gibi örneğin Kredi/Temerrüt verilerine uygularsanız iki boyutlu uzayda keman şeklindeki bölgeler halinde riskin nerelerde yoğunlaştığını görebiliyorsunuz. Eğer bu grafikleri faktörlere göre yapıyorsanız riski hangi faktörün daha çok etkilediğini de görebiliyorsunuz. Bu grafiklerin yapımında yoğun matematik var ama sizin bunu bilmeniz gerekmiyor. Cep telefonunun birçok fonksiyonunun nasıl çalıştığını bilmenizin gerekmediği gibi.

Mantar, şişe ve Çömlek: Keman grafiklerin diğer bir özelliği de şekillerinin Risk konusunda ilginç bilgiler sağlaması. Eğer grafik mantar şeklinde ise bu temerrüdün yüksek montanlarda ve geniş bir kredi dilimi için yoğunlaştığı, şişe şeklinde ise düşük montanlarda ve dar kredi dilimleri için gözlendiği ve çömlek şeklinde ise ortalarda dağıldığı anlamına geliyor. Grafiğe bir kere bu anlayışla baktığınızda Riskin davranışı hakkında da matematik tekniklerin vermeyeceği bilgilere sahip oluyorsunuz. Bunun dışında Heatmap, Radar Map, Matrix Map gibi ilginç grafik tipleri de var ama sanırım hepsini burada anlatmamı istemeyeceksiniz.

 

CK: Grafik Datamining Yaklaşımına nasıl geldiniz?

Bu Grafik Datamining konusu Beykent Üniversitesinde verdiğim “Karar Teknik Sistemleri” ve “Finans Matematiği” dersleri etrafında gelişti. Bu derslerde R yazılımını sınıfta yoğun bir şekilde kullandık ve 60-70.000 satırlık veri setleri üzerinde sınıfta analizler yapabildik. R yazılımı ücretsiz açık kaynak ve kolayca kurulup kolayca çalışıyor. Çok sayıda öğrencime bankacılık ve finans sisteminde R kullanımı konusunda eğittim. Birçoğu ile de Master tez çalışmaları yaptık. Ekibimle çalışmalarımız halen sürmekte ve şu an gündemde olan uygulamaları üretmekte. Ben program yazmaktan hâlâ vazgeçmedim ve JAVA dilini de öğrenek CORTEX Dashboard Yönetim ve Organizasyon yazılımını geliştirdim. Aslında programcılıkta önemli olan kullandığınız dil değil algoritmaları kullanmaktaki becerinizdir. Bunu da bir kere öğrendikten sonra unutmuyorsunuz ve dil fark etmiyor. Sadece biraz zaman gerekiyor. Merak edenler için bu konular riskonomi.com, @Riskonomi, @Riskonometri ve @Cortex Dashboard sitelerinde var.

CK: Uygulamada sorunlarınız vardır diye düşünüyorum, bunları ve çözümlerini paylaşmak ister misiniz?

Grafik Data-Mining’de karşılaşılan en büyük sorun bu kavramın ve anlayışın çok yeni olması ve büyük veri kavramının gölgesinde hayat buldurulmaya çalışılması. Bu model sibernetik dünyanın CEO’ları ve CIO’ları  arasındaki makası daraltan bilgi teknolojileri (IT) dünyasının karmaşık kavram ve süreçlerini basite indirgeyen ve verinin karmaşık yapısını yorumlanabilir hale getiren bir model. İnteraktif ve yalın görseller aracılığı ile veri bankalarının karmaşıklığını yok eden bir yaklaşımla stratejik karar verme pozisyonuyla “IT for CEO argümanının iş dünyasında oldukça etki yaratacağını düşünüyoruz.  Yöneticilerin bilgisayar bilimleri ve enformatik gibi alanları artık yöneticiliğin temel yapı taşları olarak görmesi gerektiğine inanıyoruz. Çünkü günümüz dünyasında“performansın zaman metriği değişti, aynı zamanda da performans düzeyi de arttı”. Dolayısıyla gerçek zamanlı bir analizden söz ediyorsak yöneticilerin firmanın yarattığı gerçek değerlerin ölçülmesine ve görselleştirilmesine olanak sağlayacak Grafik Data Mining tekniğine yoğunlaşmaları ve benimsemeleri işlerini kolaylaştıracaktır. Bu bağlamda günümüz iş modelinin temel sorunu bence “analitik dünyanın ölü diyagramlarına itibar ediliyor olmasıdır”. Yaşayan çok boyutlu işletmeleri kâğıt üzerindeki iki boyutlu ölü diyagramlara indirgemenin faydadan çok zarara yol açtığını düşünüyoruz.

Son olarak şunu söylemek isterim, ülkemizde hatta dünyada sayıları çok fazla olmayan veri bilimcileri yetiştirebilmek ve onları geleceğin yöneticileri olarak konumlandırmak çok önemli bir girişim ve sizin gibi hocalara, üniversitelere çok iş düşüyor bu bağlamda.

CK: Hocam değerli vaktinizi ayırdığınız için çok teşekkür ederiz.

Ben de bu fırsatı verdiği için Ekonomik Çözüm Gazetesi’ne ve size teşekkür ederim.

Kutlu Merih:

1945 İzmir Karşıyaka doğumludur. 1999 yılında İ.Ü. İşletme Fakültesi’nden emekli olmuştur. İlgi ve uzmanlık alanları Yönetim Mühendisliği (OR)-Ekonometri-Enformatiktir. En Son Beykent Üniv. Yüksek Lisans Programında Karar Teknikleri ve Finansal Matematik Dersleri vermiştir. Hastane Otomasyonu, Kompleksite ve Yapay Zeka konularında yoğun çalımlarını halen sürdürmektedir. Tuğrul AKŞAR ile birlikte 2006 yılında Futbol Ekonomisi(808 sf), 2008 yılında da Futbol Yönetimi (697 sf) kitabını yazmıştır. Bahçeşehir Üniversitesi’nde bir süre Spor Yönetimi üzerine dersler vermiş olan Kutlu Merih finansal sektörde risk algılaması ve ölçülmesine ilişkin akademik çalışmalarına devam etmekte ve alanında ilk defa yayınlanan özgün Riskonomi dergisinin ve www.riskomi.com internet sitesinin editörlüğünü yapmaktadır. Halen Grafik Dataminig ile Veri Görselleştirme konularında JAVA ve R dilleri ile yazılım geliştirmektedir.

 

Edit this entry»

Comments are closed.