Facebook, Uber, Google, Apple ve Amazon gibi büyük teknoloji devleri kişisel ve sosyal etkileşimlerimize her geçen gün büyük miktarda veri toplamak için kullandıkları gerçeği artık sır olmaktan çıktı. Öyleyse, verilerin toplandığı ve hızlı bir şekilde paylaşıldığı bir dünyada gizlilik nasıl korunmalıdır ? Bu soruya cevap olan diferansiyel gizlilik ve mahremiyet modelini sizlere anlatmaya çalışacağım. Diferansiyel gizlilik ve mahremiyet, kişisel verileri geleneksel yöntemlerden çok daha iyi koruyabildiğini iddia ettikleri yeni bir siber güvenlik yaklaşım modelidir. Temel aldığı matematik yaklaşık 11 yıl önce geliştirilmiştir ve yöntem son yıllarda Apple, Google ve Uber tarafından benimsenmiştir.
Diferansiyel gizlilik, teknoloji şirketlerinin bireysel kullanıcıların mahremiyetini ve gizliliğini korurken, kullanıcı alışkanlıkları hakkındaki bilgileri toplayıp paylaşmasına olanak tanır. Örneğin, hastaların HIV test sonuçlarının izlediğini ve kayıt altına alındığını varsayalım. HIV test sonucu yaptıran kişilerin sonuçlarının pozitif mi, negatif mi olduğunu bu sayede takip edebilirsiniz. Diferansiyel gizlilik ve mahremiyet modeli ile, her HIV testi yaptıran kişilerin bilgilerini paylaşmak yerine, zaman içinde toplanan toplam verilerin sonuçlarını kullanıcılarla paylaşabilirsiniz. Sonuçları görüntüleyen kişiler, kimlerin HIV testi yaptırdığını bilmesine gerek kalmadan toplam verilerin sonuçlarını görebilir. (Örneğimizde 1000 kişiden 10 kişi HIV test sonucu pozitif, 990 kişinin negatif olduğunu varsayalım)
Artık dünyanın birçok ülkesinde, teknoloji şirketlerinin kullanıcı verilerini nasıl topladığı ve paylaştığı konusunda katı politikalar uygulanmaktadır. Kurallara uymayan şirketler büyük para cezalarıyla karşı karşıya kalıyor. Belçika mahkemesi 2018 yılının başlarında Facebook’un harici web sitelerinde kullanıcıların göz atma alışkanlıklarına dair veri toplamayı durdurmalarını ya da günde 250.000 Euro’luk para cezası almasını ödemesini talep etmiştir.
Pek çok şirket, özellikle de farklı ülkelerde faaliyet gösteren çok uluslu şirketler için, müşteri verilerinin toplanması ve kullanılması söz konusu olduğunda dikkate alınması gereken hassas bir konudur. Bununla beraber, büyük teknoloji şirketlerin kullanıcı verilerine ihtiyacı vardır, böylece kişiselleştirilmiş öneriler ile kullanıcılara fayda sağlayacak yüksek kaliteli hizmetler sağlamayı hedeflerler. Diğer yandan, çok fazla kullanıcı verisi toplarsa veya diğerler firmalara bu verileri aktarmaya çalışırsa, suçlamalarla karşı karşıya kalacaklardır.
Kriptografi gibi geleneksel gizliliği koruyan araçlar bu ikilemi çözemez, çünkü teknoloji şirketlerinin verilere erişmesini engeller. Anonimleştirme, verilerin değerini azaltır ve alışkanlıklarınızın ne olduğunu bilinmiyorsa, bir algoritma size kişiselleştirilmiş öneriler sunamaz.
HIV testi örneğimizle konuyu anlamaya devam edelim. HIV testine katılanların kimliklerini biliyorsanız, ancak kimin HIV virüsü taşıdığını bilmiyorsanız, gizliliğin korunduğunu düşünebilirsiniz. Ama bu durum hiçte düşündüğünüz gibi olmayabilir. Verilerinizi görüntüleyen birisinin, A kişisinin HIV virüsü taşıyıp taşımadığını belirlemek istediğini varsayalım. Teste katılan diğer 999 kişi hakkında arka plan bilgisi elde edildiğinde, bu durumda 990 kişinin test sonucunun negatif ve 9 kişinin sonucunun pozitif olduğunu bize söyler. Bu nedenle, veritabanında 1000’inci kişi, A kişisinin test sonucu pozitif çıkan 10’uncu kişi olduğu sonucuna varabilir.
Bu tür bir saldırı, farklılaştırılmış bir saldırı olarak adlandırılır ve birisinin ne kadar arka plan bilgisine sahip olduğunu kontrol edemediğiniz için, bunları savunmak oldukça zordur. Diferansiyel gizlilik ve mahremiyet bu tür saldırılara karşı savunma yapmayı amaçlamaktadır. Diferansiyel gizlilik ve mahremiyet modeli, bir kişinin bir veri kümesindeki 1000 kişiden 999’u hakkında tam bilgi sahibi olsa bile, nihai kişi hakkındaki bilgileri yine de çıkaramayacağını garanti eder.
Bunu gerçekleştirmek için yapılacak olan toplu elde edilen verilere rastgele gürültü eklemektir. Apple’ın rastgele gürültüyü nasıl eklediği ile ilgili makaleye bu linkten erişebilirsiniz. HIV test sonuçları örneğinde olduğu gibi, test sonucu pozitif çıkanların sayısı 10 tam sayısı yerine 9 veya 11 olduğunu söyleyebiliriz. Yanlış verilen sayı ile A kişisinin gizliliğini korunabilir, fakat bu modelde çok az bir etkisi olacaktır.
Diferansiyel Gizlilik ve Mahremiyetin mucidi Cynthia Dwork, farklı mahremiyet şartlarına ulaşmak için ne kadar gürültünün yeterli olduğuna dair harika matematik kanıtlar önermiştir, konuyla ilgili makalenin paylaştığım linkten erişebilirsiniz.
Diferansiyel Gizlilik ve Mahremiyet, tavsiye sistemlerinden lokasyon bazlı servislere ve sosyal ağlara kadar her şey için uygulanabilir. Apple; iPhone, iPad ve Mac gibi cihazlardan anonim kullanım bilgileri toplamak için diferansiyel gizlilik ve mahremiyet kullanır. Diferansiyel gizlilik ve mahremiyet aynı zamanda Amazonun kişiselleştirilmiş alışveriş tercihlerinize erişmesine izin verirken, geçmiş satın alma listeniz hakkında hassas bilgileri gizler. Facebook, bir ülkenin gizlilik politikalarını ihlal etmeden, hedefli reklamlara yönelik davranış verilerini toplamak için kullanır. Birçok büyük şirket ve firma tarafından diferansiyel gizlilik ve mahremiyet modelinin önümüzdeki günlerde daha çok yaygınlaşacağını ve kullanılacağını düşünüyorum.