Twitter'daki Arkadaşlarınız Size Anonimliğinizi Nasıl Verebilir?

İnternette gezinirken, çevrimiçi reklamverenler takip ediyor hemen hemen ziyaret ettiğiniz her site, alışkanlıklarınız ve tercihleriniz hakkında bilgi edinme cesaretini toplamak. Bir haber sitesini ziyaret ettiğinizde, basketbol, ​​opera ve gizemli romanların hayranı olduğunuzu görebilir ve buna göre zevklerinize uygun reklamlar seçebilir.

Reklamverenler bu bilgileri oldukça kişiselleştirilmiş deneyimler oluşturmak için kullanırlar, ancak genellikle kim olduğunuzu tam olarak bilmezler. Kimliğinizin kendisini değil, yalnızca dijital izinizi gözlemlerler ve bu nedenle bir dereceye kadar anonimlik elde ettiğinizi hissedebilirsiniz.

Ancak, bir makalede ben coauthored Ansh Shukla, Sharad Goel ve Arvind Narayanan ile birlikte, bu anonim web tarama kayıtlarının aslında gerçek dünya kimlikleriyle geri bağlanabileceğini gösteriyoruz.

Yaklaşımımızı test etmek için inşa ettik Bir web sitesi insanların bu araştırmanın amaçları doğrultusunda tarama geçmişini bağışlayabilecekleri. Daha sonra, sadece halka açık verileri kullanarak geçmişlerini Twitter profillerine bağlayıp bağlayamayacağımızı görmeye çalıştık. Deanonymize etmeye çalıştığımız kişilerin yüzde yetmiş ikisi arama sonuçlarında en iyi aday olarak doğru bir şekilde tanımlandı ve yüzde 81 en iyi 15 adayları arasındaydı.

privacy2 2 8Deanonymization web sitesinin ekran görüntüleri.

Bu, bildiğimiz kadarıyla, yüz milyonlarca olası Twitter kullanıcısının doğru kullanıcısını seçtiği için bugüne kadar yapılan en geniş çapta bir hizmetten çıkarma eylemidir. Ek olarak, bizim yöntemimiz yalnızca bir kişinin sosyal medyada görünmekte olan bağlantıları tıklatmasını gerektirir, herhangi bir içerik yayınlamamasını gerektirir - bu nedenle internette paylaştığı şeylere dikkat eden kişiler bile bu saldırıya açıktır.


kendi kendine abone olma grafiği


Nasıl çalışır

Yüksek düzeyde, yaklaşımımız basit bir gözlem üzerine kuruludur. Her insan, okuldan, iş yerinden ve hayatlarının çeşitli aşamalarından aile ve arkadaşlardan oluşan oldukça farklı bir sosyal ağa sahiptir. Sonuç olarak, Facebook ve Twitter beslemelerinizdeki bağlantılar kümesi oldukça belirgindir. Bu bağlantılara tıklamak, tarama geçmişinizde bir hikaye işareti bırakır.

Bir bireyin ziyaret ettiği web sayfaları kümesine bakarak, benzer sosyal medya yayınlarını seçebildik ve bu web tarama geçmişini büyük olasılıkla oluşturan adayların bir listesini çıkardık. Bu şekilde, bir kişinin gerçek dünya kimliğini, hiç bir sosyal medya sitesinde yayınlanmayan bağlantılar da dahil olmak üzere, ziyaret ettikleri neredeyse tüm bağlantılara bağlayabiliriz.

Bu stratejiyi uygulamak iki temel zorluğu içeriyor. İlki teoriktir: Belirli bir sosyal medya yayınının belirli bir web tarama geçmişine ne kadar benzer olduğunu nasıl ölçersiniz? Basit bir yol, tarama geçmişinde, feed'de de görünen bağlantıların kesirini ölçmektir. Bu pratikte oldukça iyi çalışır, ancak daha büyük bağlantılar için daha fazla bağlantı içerdiğinden büyük yayınlar için benzerliği göz ardı eder. Bunun yerine alternatif bir yaklaşım benimsiyoruz. Stilize edilmiş, olasılıklı bir web tarama davranışı modeli sunuyoruz ve daha sonra bir kullanıcının bu sosyal medya yayınına sahip olmasının gözlenen tarama geçmişini yaratma olasılığını hesaplıyoruz. Daha sonra en muhtemel sosyal medya yayınını seçiyoruz.

İkinci zorluk, en benzer yayınları gerçek zamanlı olarak tanımlamayı içerir. Burada Twitter'a gidiyoruz, çünkü Twitter yayınları (Facebook'un aksine) genel olarak herkese açık. Bununla birlikte, yayınlar herkese açık olsa da, Twitter'da sorgularımızı çalıştırabileceğimiz yerel bir Twitter kopyası oluşturamayız. Bunun yerine, arama alanını önemli ölçüde azaltmak için bir dizi teknik uyguluyoruz. Daha sonra, gelecek vaat eden adayların yayınlarını oluşturmak için önbellekleme tekniklerini isteğe bağlı ağ taramalarıyla birleştiriyoruz. Azalan bu aday setinde, nihai sonuçları üretmek için benzerlik önlemimizi uyguluyoruz. Göz atma geçmişi göz önüne alındığında, bu sürecin tamamını 60 saniye içinde gerçekleştirebiliriz.

Bizim yöntemimiz Twitter'ı daha aktif olarak gezen kişiler için daha doğru. 100 veya daha fazla Twitter bağlantısını tıklayan katılımcıların yüzde doksanı kimlikleriyle eşleştirilebilir.

Birçok şirket, katılımcının rızası olmadan bile böyle bir saldırı gerçekleştirmek için izleme kaynaklarına sahiptir. Deneme katılımcılarımızın her birini yalnızca belirli izleme şirketlerinin görebildiği göz atma geçmişlerini kullanarak (ancak bu sayfalarda izleyicilere sahip olduklarından) eşitsizleştirmeye çalıştık. Birkaç şirketin katılımcıları doğru bir şekilde tanımlamak için kaynakları olduğunu gördük.

gizlilik 2 8Diğer dekanonyizasyon çalışmaları

Diğer birçok çalışma, hassas verileri açmak için halka açık ayak izlerini kullandı.

Belki de bu hatlar boyunca en ünlü çalışma tarafından yapıldı Latanya Sweeney 2002’taki Harvard Üniversitesi’nde Bunu keşfetti Amerikalıların 87 yüzde benzersiz tanımlanabilir ZIP kodlarının, cinsiyetlerinin ve doğum tarihlerinin bir birleşimine dayanarak. Bu üç özellik, hem kamuoyu seçmen kayıt verilerinde (20 ABD doları için satın aldığı) hem de adsız tıbbi verilerde (insanlar verilerin anonim olduğunu düşündüğü için geniş çapta dağıtılmıştır) mevcuttu. Bu veri kaynaklarını birleştirerek, Massachusetts valisinin tıbbi kayıtlarını buldu.

2006 olarak, Netflix bir yarışma düzenledi Film önerilerinin kalitesini artırmak için. Anonim bir insan kitlesinin film notlarından oluşan bir veri seti yayınladılar ve tavsiye algoritmalarını yüzde 1 oranında artırabilecek olan takıma 10 milyon dolar teklif ettiler. Bilgisayar bilimcileri Arvind Narayanan ve Vitaly Shmatikov insanların izledikleri filmlerin çok farklı olduğunu ve veri kümesindeki insanların çoğunun, filmlerinin küçük bir alt kümesine dayanarak benzersiz bir şekilde tanımlanabildiğini fark ettiler. Başka bir deyişle, Netflix film seçimlerine ve IMDB incelemelerine dayanarak, araştırmacılar Netflix kullanıcılarının gerçekte kim olduklarını belirleyebildiler.

Sosyal medyanın yükselişiyle, gittikçe daha fazla insan zararsız görünen bilgileri paylaşıyor, ancak aslında birçok kişisel bilgiyi ortaya koyuyor. Öncülüğünde yapılan bir çalışma Michal Kosinski Cambridge Üniversitesi’nde Facebook’un insanların beğenisini tahmin etmesinde kullanılmış cinsel yönelim, politik görüşler ve kişilik özellikleri.

Liderliğindeki başka bir takım Gilbert Wondracek Viyana Teknoloji Üniversitesi’nde, Xing’in sosyal ağında hangi grupların yer aldığını belirleyen ve kim olduklarını bulmak için kullandı - bir parçası olduğunuz gruplar genellikle benzersiz bir şekilde tanımlanmaya yettiğinden sen.

Ne yapabilirsin

İnterneti kullanmayı ya da kamusal hayata katılmayı bırakmadığınız sürece, bu saldırıların çoğu, savunmak için zor.

İnterneti kullanmayı bıraksanız bile, şirketler yine de veri toplayabilir. Arkadaşlarınızın birçoğu telefon rehberini Facebook'a yüklüyse ve numaranız tüm kişi listelerinde bulunuyorsa, hizmetlerini kullanmasanız bile Facebook sizinle ilgili tahminlerde bulunabilir.

Bizimki gibi deanonymizing algoritmalarına karşı savunmanın en iyi yolu, anonim tarama verilerinize erişimi olan kişilerin sayısını sınırlamaktır. Gibi tarayıcı uzantıları Ghostery üçüncü taraf izleyicilerini engelle. Bu, ziyaret etmekte olduğunuz web sitesi onları ziyaret ettiğinizi bilse bile, sayfalarında reklam gösteren reklam şirketleri, tarama verilerinizi toplayamayacak ve birden fazla sitede toplayamayacak.

Bir web yöneticisiyseniz, kullanıcılarını kullanarak sitenize göz atmalarını sağlayarak kullanıcılarınızı korumaya yardımcı olabilirsiniz. HTTPS. HTTP kullanarak göz atma, saldırganların ağ trafiğini koklayarak göz atma geçmişinizi almalarına olanak tanır; bu, bu saldırıyı gerçekleştirmelerini sağlar. Birçok web sitesi zaten HTTPS'ye geçti; Deanonymization deneyimizi bir ağ trafiği algılayıcısının bakış açısıyla tekrarladığımızda, katılımcıların yalnızca yüzde XN'si deanonyize edilebilir.

Bununla birlikte, kendinizi genel anlamıyla deanonyizasyon saldırılarına karşı korumak için yapabileceğiniz çok az şey vardır ve belki de en iyi eylem yolu, beklentilerini ayarlamaktır. Bu dijital çağda hiçbir şey özel değildir.

Yazar hakkında

Jessica Su, Ph.D. Stanford'da öğrenci Stanford Üniversitesi

Bu yazı orijinalinde Konuşma. Okumak Orijinal makale.

İlgili Kitaplar

at InnerSelf Pazarı ve Amazon