Büyük veri ve yapay zekâ 21. Yüzyılın en büyük problemlerinden biri olan, iklim değişikliği sorununu çözmemizde bize yardımcı olabilir. Ancak gün geçtikçe daha net şekilde görülüyor ki; veri toplama ve depolama da problemin bir parçası olabilir. Avrupa Birliği’ndeki veri merkezlerinin harcadığı enerjinin, 2030’da toplam elektrik ihtiyacının %3,21’ine ulaşması mümkün görünüyor. Avrupa başta olmak üzere tüm dünyada sayılarının önümüzdeki 5 sene içinde %100 üzerinde artmasının beklendiği veri merkezleri, artan enerji maliyetleri ve ESG düzenlemeleri kapsamında artan şeffaflık gereklilikleri de göz önünde bulundurulduğunda, iklim değişikliği sadece makro değil mikro-ekonomik düzeyde de giderek daha önemli bir problem haline geliyor. 2010 yılında 2 Zetabayt seviyesinde ortaya çıkan global yıllık veri rakamının, 2022 yılında 97 Zetabayta çıktığı görülmektedir. 2025 yılında neredeyse günümüzün 2 katı, yani 180 Zetabayta çıkması beklenen yıllık data üretimi sebebiyle, üst düzey yöneticilerin veri yönetimi tercihleri üzerine tekrar düşünmesi gerekiyor.
İklim değişikliğiyle mücadele kapsamında geçtiğimiz yıllarda pek çok ülkede çevre düzenlemeleri hayata geçirildi. Paris İklim anlaşması, AB Yeşil Mutabakatı, COP 27 Konferansı ile dünyada sera gazı emisyonlarının azaltılmasına yönelik adımlar atıldı. Avrupa Birliği ülkeleri Yeşil Mutabakat ile karbon emisyonlarını 2030 yılına kadar yüzde 55 azaltmayı, 2050 yılına kadar ise karbon nötr ilk kıta olmayı hedefliyor. Bu kapsamda, şirketlerin üretimlerini emisyon kısıtlamalarının daha az olduğu ülkelere kaydırmalarının önüne geçmek amacıyla, Sınırda Karbon Düzenlemesi (SKDM) hayata geçirildi. Bu düzenleme kapsamında hayata geçirilen dünyanın ilk uluslararası Emisyon Ticaret Sistemi (ETS), AB sınırları dışında üretilen; çimento demir-çelik, alüminyum, gübre gibi yoğun emisyona sahip sektörlerde Avrupa Birliği’ne ihraç edilen ürünlerin karbon maliyetleri oranında fiyatlandırılması anlamına geliyor.
AB pazarının korunması, ihracatının yüzde 40’ından fazlasını AB ülkelerine gerçekleştiren Türkiye açısından yüksek önem arz ediyor. Bu kapsamda, Çevre, Şehircilik ve İklim Değişikliği Bakanlığı tarafından 2022 yılında yayımlanan Türkiye’nin ilk İklim Şurası’nın Sonuç Bildirgesi, iklim değişikliğiyle mücadelede önümüzdeki 100 yıl için bir yol haritası niteliğinde. 2053 Net Sıfır Emisyon ve Yeşil Kalkınma hedefi doğrultusunda kısa, orta ve uzun vadeli planların altyapısını oluşturan Sonuç Bildirgesine göre, Avrupa Birliği tarafından hayata geçirilen Sınırda Karbon Düzenlemesi Mekanizması (SKDM) takvimine uygun olarak, Emisyon Ticaret Sistemi (ETS) ülkemizde 2024 yılından itibaren aşamalar halinde 5’er yıllık dönemler şeklinde uygulanacak. Çifte karbon fiyatlandırmalarından kaçınmak amacıyla, Emisyon Ticaret Sistemi (ETS) uygulamaları kapsamında, mevcut vergilerin yeniden değerlendirilerek karbon vergisine dönüştürülmesi için ulusal koşullara uygun yol haritasının ise 2025 yılına kadar oluşturulması planlanıyor.
Siz ve/veya ekibiniz bugün kaç e-posta yazdı? Posta kutunuzda biriken, kayıt altında tutmak zorunda olduğunuz e-postalarınızın sayısı ne kadar? Yüklü eklerin gönderilip alınmak zorunda olduğu bir e-posta silsilesine mi sahipsiniz? Bu basit sorulara yanıtınız, özellikle departman, şirket ve hatta ülke bazında toplanıp analiz edildiğinde, birçok bilgiyi su yüzüne çıkarıyor. Verilen yanıtlardan toplanabilen olası bir bilgi, siz ve/veya ekibinizin yalnızca e-posta göndererek bir günde ürettiğiniz CO2e gramıdır. Yapılan araştırmalar, standart bir e-postanın günde 5-10 gram kadar CO2e’ye denk geldiğini gösteriyor. Bu e-postaya büyük dosyalar eklediğinizde, bu sayı anında ikiye veya üçe katlanıyor. Verilerin toplanması, gönderilmesi ve özellikle kaydedilmesi emisyon üretiyor ve çevreye verilen zararı artırıyor. Özellikle finans, sigorta, hizmet sektörlerinde bulunan şirketler için bu rakamlardaki kişi başı ortalamaların, diğer sektörlere göre daha yüksek olduğunu görüyoruz. Büyük veriyi analiz etmeye çalışan ve bireysel müşterisinin alışkanlıklarını analiz etmeyi, hizmet kalitesini artırmak için kullanan perakende ve hızlı tüketim sektörlerinde bu durumun daha da artmaya başladığını gözlemliyoruz. Bu durum günümüzde verilerin çoğunu barındıran ve muazzam bir büyümenin yaşandığı bulut bilişim için de geçerli. Veri merkezlerinin çevresel etkilerine odaklanarak bulut bilişimi “yeşil” hale getirmeye çalışan, ilk adımlarını atan bazı girişimler mevcut. Yine de yeşil veri hedefine ulaşmak için aşılması gereken bazı engeller var; üstelik bu hedef sadece veri merkezi seviyesinde ele alınırsa ulaşılmaz hale geliyor.
Geçmişte şirketler (özellikle büyük teknoloji şirketleri) bulabildikleri kadar veriyi topluyordu. Konuyu daha anlaşılır kılmak için; uzun zamandır halınızda aradığınız, ayağınıza saplanan tek bir iğnenin peşinde olmanıza rağmen, eldeki tüm bilgileri toplayan devasa bir elektrik süpürgesi hayal edelim. Açıkça görülüyor ki gelecekte ayağınıza saplanan ikinci bir iğne olup olmayacağını asla bilemezsiniz (bunu iş bağlamında düşünecek olursak, böyle bir iğne çözülmesi gereken bir sorun veya önemli bir analiz için ihtiyaç duyacağınız bilgi olabilir). Her zamankinden daha düşük depolama ve bilişim maliyetleri sayesinde, geniş kapsamlı veri toplama ve depolama geçmişte mantıklıydı; ancak artık bu durum değişiyor.
Tüm veriyi ayırt etmeden toplama stratejisinin hesaba katılması gereken başlıca iki olumsuz yan etkisi var
SNR (Sinyal/Gürültü Oranı)- Veri analistleri ve şirketler artık kendilerine sağlanan büyük miktardaki verinin içindeki ilgili faydalı bilgileri, yani sinyali tespit edemiyor. Şirketler veriyle fiilen çalışabilmekten daha çok, veri işleme depolama ve elde tutmanın yasal yükümlülüklerine nasıl uyum sağlayabileceklerinin derdine düşmüş durumdalar. İşlenmesi gereken yüksek hacimli veri, yüksek derecede eğitimli profesyonellerden oluşan insan kaynağının zamanını buna ayırmasını gerektiriyor. Mevcut durumda bu profesyonelleri işgücü pazarında bulmak sadece zor değil aynı zamanda da pahalı. Bu sorun için olası çözümlerden birisi, şüphesiz bilgisayar/yazılım tabanlı teknoloji kullanmak olur. Piyasada halihazırda birçok büyük veri aracı bulunuyor; ancak bu araçlar, kayda değer bir etki yaratmadan yüksek maliyetler oluşması riskini taşıyor. İyi bilinen ve başarılı veri araçlarının bile devasa veri havuzundan uygun sonuçları filtreleyebilmek için zamana ve doğru girdi değişkenlerine ihtiyacı var. Bu süreç aynı zamanda enerji gerektiriyor. Bu da CO2e emisyonuna neden oluyor ve şirkete maliyet yüklüyor. Ayrıca, araçların veriden nedensellikleri değil, korelasyonları tanımlama riski de bulunuyor. En kötü senaryoda, nedenselliği olmayan ve hipotezi test edilmeyen verilerden çıkarılan sonuçlar, şirkete zarar verecek kararlara bile yol açabilir.
Verileri yanlış yorumlamanın bir örneği, perakende satış yapan mağazaların düzeni olabilir. Toplanan verilerin son analizinde, müşterilerin daha geniş mağazalarda daha çok zaman geçirdiği ve daha fazla plansız ürün alımı yaptığını hayal edelim. Böylece hem müşteri başına hem de perakende alanın metrekaresi başına daha fazla satış hacmi elde ediliyor. Böylece, diğer faktörleri göz önünde bulundurmadan, satış açısından daha geniş alanı bulunan mağazaların daha çekici olduğu sonucuna ulaşılabilir. Kontrollü deney veya hipoteze dayalı testler olmadan, şehir içinde dahi daha geniş alanlı yeni mağazalar inşa etme kararı alınabilir. Ancak bu ilişkinin nedenselliği olup olmadığını bulmak zordur. Nedeni kırsal alanlardaki müşterilerin haftalık alışveriş yaptıkları için mağazada daha fazla alışveriş yapması ve daha fazla mesafe katetmesi de olabilir. Bunun yanı sıra müşteriler farklı demografik faktörler nedeniyle de plansız alışveriş yapmaya eğimli olabilirler. Toplanmış veriyi kullanır ve aynı mantığı şehir mağazalarına da uygularsanız, varılan sonucun doğru olmadığı ortaya çıkabilir.
Sera gazı emisyonları- Büyük miktarlarda veri toplamak ve depolamak çok fazla enerji gerektirir ve bu durum şirketin ekolojik ayak izini olumsuz etkiler. Giderek daha fazla şirketin proaktif bir şekilde iklim değişikliğini ele aldığı olumlu bir eğilim gözlemliyoruz. Bu şirketlere, bulut sistemlerini “yeşil” olarak pazarlayan büyük bulut bilişim hizmetleri sağlayıcıları da (e.g., Google Cloud, Microsoft Azure, AWS ve hatta Tencent) dahil. Pazarlama faaliyetleri arasında PUE (güç kullanımının verimliliği) ve karbon dengeleme (özellikle ABD’de) gibi KPG’leri yayınlamak da bulunuyor. Şirketlerin veri toplama, kullanma ve depolama şekillerini değiştirmesi, CO2e emisyonlarını azaltmada ve karbon hedeflerine ulaşmada kayda değer etki yaratabilir. İhtiyaç duyulmayan büyük miktarda verinin toplanması, şirketlere maliyet yaratıyor (ör. elektrik giderleri) ve değer üretmiyor.
Kaynak: Çevre, Şehircilik ve İklim Değişikliği Bakanlığı, İklim Şûrası 2022
Akıllı telefonların hayatımıza girmesi ile birlikte, sadece cep telefonlarımızı şarj etmek için, toplam yıllık enerji tüketimimizin %0,4 mertebesinde arttığı günümüzde, bir araştırmaya göre, ülkemizde sayıları 75’in üzerine çıkmış olan büyük veri merkezlerimizin enerji tüketimleri giderek artıyor. İşlenen verinin artması, istatistiki ve regülasyonel verilerin saklanması zorunluluğu da, verilerin boyutunu her geçen gün logaritmik olarak artırıyor. Üzerinde düşünülmesi gereken soru, hangi bilginin toplanıp depolanacağına nasıl karar verileceği olmalı. Bu veri sorununun basit bir çözümü, belirli bir zaman diliminde, sadece kullanacağınız verileri toplamak, kullanılmayacağı kesinleşen verilerin de silinmesini sağlamaktır. Ancak bu çözüm kısıtlı bir kapsamda işe yarar çünkü kullanım durumları zamanla değişir. İki yıl geçtikten sonra, daha önce toplanmış eksik veriler proje maliyetlerini ve sürelerini önemli ölçüde artırabilir. Bize göre, şirketlerin özellikle karbonsuzlaşmaya odaklanırken veri yönetimini iyileştirmesine yardımcı olabilecek üç adım bulunuyor.
Geleceği planlayın
Ülkemizde, sadece Fintech ekosisteminin dahi yıllık ortalama büyüme oranının %14’ler mertebesinde gerçekleştiği günümüzde, şirketler yarının kullanım durumlarını bugünden düşünmeli. Elbette bunu söylemek gerçekleştirmekten daha kolay; ancak sürekli değişen dünyamızda çok uzak zamanlı tarihsel veriyi tutmanın sadece belirli durumlarda işe yarayacağını unutmamakta fayda var. Hangi konularda hangi verilere ihtiyaç duyulacağını çoktan planlamış olabilirsiniz. Ancak üzerinde düşünmeden veri toplama tuzağından kaçınmalı ve en alakalı veriye odaklanmalısınız.
Verileri sıcak ve soğuk olarak bölün
Soğuk/pasif veriyi saklama kararı düşünüp taşınarak verilmelidir ve bu doğrudan ve her zaman ulaşılabilir olması gerekmeyen bilgiye yöneliktir. Dolayısıyla bunun az önce bahsettiğimiz kullanım durumu planlamasına dahil edilmiş olması gerekir. Daha uzun planlama süresi olan ve sıkı teslim tarihleri bulunmayan projeler için ihtiyaç duyulan veriler bu şekilde, soğuk olarak saklanabilir. Depolama hizmet sağlayıcılarının mevcut teklifleri, soğuk depolamanın sıcak depolamaya göre, düşük enerji tüketimi nedeniyle yarısı kadar maliyeti olduğunu gösteriyor. .
Çevik veri yönetimi uygulayın
Elbette bir kere planlayarak verileri farklı kategorilere ayırmak yeterli değil. İlgili veriyi tespit ederek bu verilerin ayrıntı düzeyini belirlemek üzere yinelemeli süreçler uygulamak başarıya giden yoldur. Budanan ağaç daha hızlı büyür prensibiyle, çevik veri yönetiminin de yeniden değerlendirme ve enerji verimliliğini garanti altına almak için şirketlerde uygulanması gerekir.
Odaklı veri toplama, analiz etme ve depolama eğilimini takip etmemek yüksek verimsizliğe, kullanışsız analizlere, pahalı veri depolamaya ve çevre üzerinde olumsuz etkiye neden olacaktır. Kanıtlanmış metodolojimizi kullanarak şirketiniz veri depolama maliyetlerinden %10-20 tasarruf sağlayacak ve karbon ayak izini önemli ölçüde azaltacaktır.
Bu makaleye Yusuf Bulut, Mehmet Özenbaş ve Michael Zeitelberger da katkıda bulunmuştur.