Son 5 yıldır, her konferansta Büyük Veri (Big Data) ile ilgili konuşmalar dinledik. Hakkında çok sayıda yazı yazıldığını da gördük. Herkes büyük veri analizini temel alan işler yapmak istiyor. Bu konuda hayallerimiz çok büyük ama bana emeklemeden koşmaya çalışıyormuşuz gibi geliyor. Veri analizini tam olarak kavrayamadan büyük veriyi analiz etmeye çalışıyoruz ve bu da biraz moda olanın peşinden gidip eforumuzu boşa sarf etmek anlamına geliyor.

Peki nereden başlamak lazım? Bu sorunun cevabı olması adına, veri analizi esnasında en sık yapılan hataları ve çözümlerini bu yazımda toplamak istedim.

Elma ile Armudu Karşılaştırmayı Bırakın

Belki bu adım bir çok kişi için anlamsız gelebilir, ancak neredeyse her gün birbiri ile hiç ilgisi olmayan rakamların kıyaslandığı raporlar geçiyor elime. Bu raporlar şirketlerin her kademesinden çok sayıda kişinin okuduğu, üzerine stratejiler ürettiği raporlar ama ne yazık ki içinde çelişkili çok sayıda ifade yer alıyor. Bu raporları gördüğümde, bir çok raporun sadece janjanlı sunumlar hazırlamak için kullanıldığını düşünmeden edemiyorum. Konuyu abarttığımı düşünenler olabilir belki ama aşağıdaki grafiğin benzerlerinden o kadar fazla gördüm ki.

Bu grafiğin yer aldığı raporu yıllarca almış, “Fiyat konusundaki şikayetler bu grafiğin neresinde?” sorusunu sormamış ancak “Biz Big Data ile proje yapıyoruz” benzeri cümleler kullanabilen kişileri görünce işe küçük veriden başlamak gerektiği konusunda emin oluyorum.

Beyninizin Oyunlarına Kapılmayın

Veri analizinde en büyük yanılgılardan biri verinin bize sunduğu sonuç üzerine hemen kesin kanıya varmak. Bazen beynimiz hızlı düşünür ve anlık bir karar verir. O an verinin ortaya koyduğu sonucun kendi düşündüğü ile aynı olduğu yanılgısına kapılır, ancak her zaman beynimiz doğru sonucu vermez. Daniel Kahneman, Hızlı ve Yavaş Düşünme adlı kitabında, bir veri ile karşılaştığımızda hızlı düşünmenin bize sunduğu tuzakları çok güzel örneklerle ele almış. Daniel Kahneman’a göre beynimizde 1. Sistem ve 2. Sistem olmak üzere karar vermemizi sağlayan 2 sistem var. 1. Sistem’in görevi sezgisel kararları almak iken 2. Sistem’in görevi ise 1. Sistem’i denetlemek, 1. Sistem’in kararlarının bazılarının doğrudan eyleme geçmesini sağlamak, bazılarını ise baskılamak ya da değiştirmek. 1. Sistem hızlı kararlarda rol oynar. Örneğin; aşağıda basit bir bilmece var. Sezgilerinize kulak vererek, hızlıca çözmeye çalışın.

  • Bir beysbol sopası ile bir topun fiyatı 1 dolar 10 cent.
  • Sopa toptan 1 dolar daha pahalı.
  • Topun fiyatı ne kadar?

Linkedin’de bile aşağıdaki gibi bulmacalardan çok sayıda görüyoruz. Bu bulmacalar da bizim 1. Sistem’imizi hedef alıyor.

Hızlı düşünme ve karar alma

Bu kadar basit konularda bile 1. Sistem ipleri eline alıp bize yanlış kararlar verdirebiliyorsa, çok daha karmaşık konularda beynimizin bize sunduğu sonuca güvenebilir miyiz?

Daniel Kahneman 2. Sistem’in aktif olarak çalıştırıldığı durumlarda 1. Sistem’in daha fazla hata yapabileceğini söylüyor. Bunu da Christopher Chabris ve Daniel Simons‘ın “Görünmez Goril” deneyi ile örneklendiriyor. Deneye göre, alanda basketbol oynayan 2 takım vardır. Takımlardan birinin oyuncuları beyaz giyerken diğerleri ise siyah giyer. Deneklere ise beyaz takımın kendi arasında kaç kez paslaştıkları sorulur. Denekler deney esnasında beyaz takıma odaklanıp pasları sayarlar ve deneyin sonunda doğru sonucu söylerler, ancak denekler paslaşma esnasında alana giren siyah gorili farketmezler. 2. Sistem pasları saymaya o kadar odaklanır ki, 1. Sistem’i de diğer tüm verilere kapatır.

Eğer biz de 2. Sistem’imizi tamamen meşgul tutuyorsak, veri önümüze kocaman bir goril de getirse beynimiz bunu reddedebilir. O nedenle veri analiz ederken yavaş düşünmeyi öğrenmeliyiz. Veri analizi, bizi meşgul eden çok sayıda görevin arasında sıkıştırılacak bir konu değil ne yazık ki. Dar vakitlerde analizler hazırlamak zorunda kaldığımızda, ilk akla gelen sonucu, gözümüze en güzel görünen grafiği alıp sunumumuza koyuyoruz ve hayatımıza devam ediyoruz.

Verinin Kaynağından Emin Olun

Veri analizinin en önemli noktası verinin doğruluğudur. Eğer yanlış veri üzerinde çalışıyorsanız uyguladığınız analiz yöntemlerinin ne kadar iyi olduğunun hiç bir önemi kalmaz. O nedenle öncelikle verinin eksiksiz olduğundan emin olmalısınız. Eğer eksik olan, elde etmenizin imkansız olduğu bir veri seti varsa, bu eksikliğin analizinizi ne kadar değiştireceği üzerinde de analizler yapmanız gerekecek. Aksi halde veri analizinizden elde ettiğiniz sonuçları iş süreçlerinizde kullanmanız oldukça riskli olacak.Eksik veri ihtimalinin dışında, verinizin doğruluğundan da emin olmanız gerekli. Bu da en az eksik veri kadar süreçlerinizi etkileyecek bir konu. Yanlış veri ile çıktığınız yolda, doğru sonuca ulaşmanız imkansız.

Problem ya da İhtiyacı Doğru Tanımlayın

Doğru soruları sormak çoğu zaman çözümü bulmaktan daha büyük önem taşır. Büyük verinin moda olmasının etkisi ile birlikte çoğu firma büyük veri ile projeler yapmayı hedefler hale geldi ancak projeye yanlış açıdan yaklaşan çok sayıda ekiple karşılaşıyorum. Elinizde büyük bir veri varsa, veriye sorular sormadan o veriden analizler üretmek ancak çok tatlı bir hayal olabilir. Ben veri üzerinden kurulan, sınırları ve amacı netleştirilmemiş hayalleri, aklımızdan bir sayı tutup karşımızdaki insanın tahmin etmesini istemeye benzetiyorum. Örneğin aşağıdaki 2 soru arasında oldukça büyük farklar var;

  1. Sosyal medyada sağlık sektörü ile ilgili neler konuşuluyor?
  2. Son 1 yıl içerisinde, tüketicilerin ilaç kullanımına karşı bakış açısında aşağıdaki kırılımlar baz alınarak hangi detaylar gözlemlenir?
  • Tüketiciler hangi ağrılarda ağrı kesiciye başvuruyor?
  • Antibiyotikler hangi koşullarda kullanılıyor?
  • Tüketicilerin vitamin takviyesi hakkındaki düşünceleri neler?
  • Tüketiciler ilaçlar dışında alternatif tıptan destek alıyor mu?

Bu sorular elbette çoğaltılabilir. 1. maddedeki soru ile de veri analiz edilebilir ancak veri analizi esnasında evrendeki bütün sorulara yanıt bulunamayacağından muhtemelen çıkan sonuçlar sizin ihtiyacınız olan sonuçlar olmayacak. 2. soruda ise verinin içinden nelerin analiz edileceği netleştirildiğinden, analiz sonrasında elde edilen sonuçlar doğrudan iş süreçlerinde kullanılabilir halde olacak.

Yanlış Metriğe Odaklanmayın

Bazen, Görünmez Goril olayında olduğu gibi körleşmeye başlarız. Gözümüzün önünde durun sonucu göremeyiz ya da yanlış bir sonuca odaklanırız. Büyük veri ile ilgilenirken ya da uzun süreler analiz yaparken bu oldukça olası. Önemli olan, bağlantılı analizlerde bu hatayı farkedince geriye dönüp temeldeki hatayı ve bağlantılı analizlerini düzenlemek. İlk yaptığınız analizi ekiplerle paylaşmış olabilirsiniz ve daha önce paylaştığınız analizin hatalı olduğunu söylemenin sizin için kötü sonuçlar doğuracağını düşünebilirsiniz. Ancak hatalı analize bağlantılı olarak yeni analizler yaptıkça hata çığ gibi büyür. O nedenle hata farkedildiği anda düzeltilmeli ve kayıp minimuma indirilmelidir.

Büyük Veriyi Küçük Veri Setleri Haline Getirin

Büyük veri kulağa çok heyecan verici gelse de bu veriyi analiz etmek için önce küçük veri setleri elde etmek gerekli. Bu sayede analiz edilebilir veri elde edilir ve süreç devam ettirilebilir. Bu küçük veri setlerini oluşturmada da en önemli etken İhtiyacı Doğru Tanımlama’da da bahsettiğim gibi doğru soruları sormak. Aslında sizin soracağınız her soru bir küçük veri olacak. O küçük verileri analiz ettiğinizde de büyük verinin içinden sorularınızın cevaplarını teker teker almış olacaksınız.

Verinizi Farklı Kaynaklarla Besleyin

Analiz edeceğiniz veriyi tek bir yerden elde etmek zorunda değilsiniz. En az büyük veri kadar sık duyduğumuz bir diğer kavram da 360° Pazarlama. Bu kavramı duyunca akla tüm pazarlama, reklam faaliyetlerinin, CRM ve müşteri iletişimi süreçlerinin birbiri ile bağlantılı ilerlemesi geliyor. Bu durumda aslında müşteri iletişiminin CRM’i, CRM’in dijital pazarlamayı etkileyerek hepsinin bir bütün halinde yükselmesi oldukça önemli. Hepsinin aynı dili konuşması, ortak amaçlara hizmet etmesi gerekli. Ancak bir çok firmada hala bu süreçler ayrı ayrı analiz ediliyor. Bu analizler ortak bir paydada buluşmadığından birbirleriyle etkileşimleri de ölçülemiyor. Örneğin: Mayıs ayı için online sipariş süreçlerinizin analizini yapıyorsunuz ve departmanlara göre aşağıdaki sonuçları elde ettiniz:

  • Sosyal Medya: Sipariş teslimatları ile ilgili şikayetlerin ciddi oranda arttığını gözlemlediniz.
  • Çağrı Merkezi: Sipariş iptalleri ile ilgili şikayetlerde artış gözlemlediniz.
  • CRM: Sipariş iptallerinde ciddi oranda düşüş olduğu sonucu ortaya çıktı.

Bu analizlere her departman ayrı ayrı bakar ve çıkarımlar yaparsa herkes farklı bir yönde kulaç atacak. Oysa ki, muhtemel senaryo şu olabilir: Sipariş yoğunluğu nedeniyle sevkiyatta sorun yaşanır. Siparişi teslim edilmeyen kullanıcılar sosyal medyada şikayetlerini dile getirir. Sonuç alamayınca Çağrı Merkezi’ni arayarak siparişlerini iptal etmek ister. Ancak Çağrı Merkezi teslimat aşamasında olan siparişlerin iptal edilemeyeceği yanıtını verir. Dolayısıyla siparişler teslim edilmediği sürece sipariş iptali de olmaz.Sorunun kaynağını tespit edip doğru aksiyonları almak için, farklı açılardan bakmak, farklı verileri bir araya getirip bütünleşik bir analiz gerçekleştirmek çok önemli.

Veriyi Görselleştirmek İçin Doğru Grafikleri Seçin

Görselleştirme veriyi vezir de eder rezil de. Veriniz doğru olsa da yanlış grafikle gösterdiğinizde tamamen yanlış sonuçlar ortaya koyabilir. Bir veri görselleştirme esnasında maniple de edilebilir. Böylece, eğer analizi okuyan kişi dikkatli biri değil ise, bilginin istediğiniz şekilde anlaşılmasını da sağlayabilirsiniz. Örneğin bir dijital kampanya düzenlediniz ve bu kampanyanın sosyal medya yansımalarını ölçmek istiyorsunuz. Aşağıda yer alan 4 grafiği inceleyin lütfen. İlk grafik kampanyanın sosyal medyada ne kadar konuşulduğunu gösteriyor. Diğer grafikler olmadan, sadece ilk grafiğe bakarak bu kampanyaya başarılı desek doğru olur mu?

Veri Görselleştirme
Veri Analizi
Detaylı Veri İnceleme
Veri Analizi Yöntemi
Veriyi Analiz Ederken Dış Etkenleri Gözardı Etmeyin

Veri analizini etkileyen çok sayıda dış etken vardır. Bu etkenleri gözardı etmek, analiz sonrasında uygulanan stratejilerde beklenmeyen sonuçlar ortaya koyabilir. Veri analizinde en çok kullanılan yöntemlerden biri olan, farklı dönemlerle karşılaştırma, ilgili dönemlerdeki koşullardan etkilenebilir. Örneğin; her yıl sosyal medyada yaptığınız sevgililer günü kampanyasını aynı bakış açısı ile ölçmek doğru olmayacaktır. Her yıl için, kampanya döneminde, sosyal medya kullanıcılarını meşgul eden gündemleri de göz önünde bulundurmak gerekir. Çok başarılı bir kampanya, aynı gün duyurulan bir futbolcu transfer haberi nedeniyle geçmiş yıllara göre çok daha az konuşulmuş olabilir. Salt data sayısına bakarsak 1. Sistem’imiz bize bu tarz bir kampanyayı bir daha yapmamamız gerektiğini söyleyecektir. Bu noktada 2. Sistem ile düşünüp, benzer kampanya kurgularına farklı zamanlarda şans vermek gerekebilir.

Bu maddelere dikkat ettiğinizde veriye dayalı işler yapmanızın önünde pek de bir engel kalmıyor. Bu adımlarla veri analizine başladıktan sonra, her yaptığınız analiz size yeni bir şey öğretecek ve böylece hem verinizi biraz daha büyütebilecek hem de analiz metodlarınızı geliştirebileceksiniz.