Twitter Bilim Adamlarına İnsan Mutluluğu ve Sağlığı Üzerine Bir Pencere Verdi

10'in halka açıklanmasından bu yana Twitter, arkadaşlar arasında sosyal bir ağ platformu, akıllı telefon kullanıcıları için bir anlık mesajlaşma servisi ve şirketler ve politikacılar için bir tanıtım aracı olarak kullanılıyor.

Fakat aynı zamanda, insanların gibi karmaşık sosyal sistemler içinde nasıl hissettiğini ve nasıl çalıştığını incelemek isteyen araştırmacılar ve bilim adamları için paha biçilmez bir veri kaynağı oldu.

Tweet'leri analiz ederek, kontrollü laboratuar deneyleri dışında milyonlarca insanın “vahşi doğada” sosyal etkileşimlerini gözlemledik ve topladık.

İzleme için araçlar geliştirmemizi sağladı. büyük toplulukların kolektif duyguları, bul Amerika Birleşik Devletleri'ndeki en mutlu yerler ve çok daha fazlası.

Peki Twitter tam olarak nasıl hesaplamalı sosyal bilimciler için bu kadar eşsiz bir kaynak haline geldi? Ve ne keşfetmemize izin verdi?


kendi kendine abone olma grafiği


Twitter'ın araştırmacılara en büyük hediyesi

Temmuz 15, 2006, Twittr (daha sonra bilindiği gibi) alenen başlattı “arkadaş gruplarının SMS ile etrafındaki rastgele düşünceleri atlamasına yardımcı olan bir mobil servis” olarak ücretsiz 140 karakterli grup metinleri gönderme yeteneği, platformu kullanmaya birçok erken evlat edinme (kendim dahil) getirdi.

Zamanla, kullanıcı sayısı patladı: 20'taki 2009 milyondan, bugün 200'te ve 2012 milyonda 310 milyona. Doğrudan arkadaşlarla iletişim kurmak yerine, kullanıcılar takipçilerine nasıl hissettiklerini söyler, haberlere olumlu veya olumsuz cevap verir veya şakaları patlatırlar.

Araştırmacılar için Twitter'ın en büyük hediyesi büyük miktarlarda açık veri sağlanması olmuştur. Twitter, araştırmacıların belirli tweet türleri (örneğin, belirli kelimeler içeren tweet'ler) ve ayrıca kullanıcılar hakkında bilgi almak için Twitter'ı sorgulamalarını sağlayan Uygulama Programlama Arabirimleri (API) adı verilen bir şey aracılığıyla veri örnekleri sağlayan ilk büyük sosyal ağlardan biriydi. .

Bu, bu verileri kullanan araştırma projelerinin patlamasına neden oldu. Bugün, bir Google Araştırmacısı “Twitter” araması, “Facebook” için beş milyona kıyasla altı milyon hit üretiyor. Facebook'ta kabaca olduğu düşünüldüğünde, fark özellikle dikkat çekici. Twitter'dan beş kat daha fazla kullanıcı (ve iki yaş büyük).

Twitter'ın cömert veri politikası, hiç kuşkusuz, ana akım medya tarafından ilginç bilimsel araştırmalar yapıldığı için, şirket için mükemmel ücretsiz tanıtımlara yol açtı.

Mutluluğu ve sağlığı çalışmak

Geleneksel nüfus sayımı verilerinin toplanması yavaş ve pahalıdır; Twitter gibi açık veri beslemeleri, büyük popülasyonlardaki değişiklikleri görmek için gerçek zamanlı bir pencere sağlama potansiyeline sahiptir.

Vermont Üniversitesi Hesaplamalı Hikaye Laboratuvarı 2006'ta kuruldu ve uygulamalı matematik, sosyoloji ve fizik arasındaki sorunları inceler. 2008'ten bu yana, Story Lab, tüm kamu tweet'lerinin gerçek zamanlı olarak yüzde 10'inin rastgele bir XNUMX örneğini yayınlayan bir API olan Twitter'ın “Gardenhose” feed'i aracılığıyla milyarlarca tweet topladı.

Hesaplamalı Hikaye Laboratuvarı'nda üç yıl geçirdim ve bu verileri kullanan birçok ilginç araştırmanın parçası olduğum için şanslıydım. Mesela biz bir hedonometer Bu, Twittersphere’in mutluluğunu gerçek zamanlı olarak ölçer. Akıllı telefonlardan gönderilen coğrafi konumlu tweet'lere odaklanarak, harita Amerika Birleşik Devletleri'ndeki en mutlu yerler. Belki de şaşırtıcı olmayan bir şekilde, bulduk Hawaii'nin en mutlu devleti olması ve en çok büyüyen Napa kenti 2013 için. 

13 milyonun haritası, ABD'nin 2013'ten gelen tweet'lerini belirledi, mutluluğu ile renklendiriyor, kırmızıyı gösterir, mutluluğu gösterir ve mutluluğu gösterir. PLOS ONE, Yazar sağladı13 milyonun haritası, ABD'nin 2013'ten gelen tweet'lerini belirledi, mutluluğu ile renklendiriyor, kırmızıyı gösterir, mutluluğu gösterir ve mutluluğu gösterir. PLoS ONE, Yazar sağladı.Bu çalışmaların daha derin uygulamaları vardı: Twitter kelimesi kullanımının demografik verilerle ilişkilendirilmesi, kentlerdeki sosyoekonomik kalıpları anlamamıza yardımcı oldu. Örneğin, kelime kullanımını obezite gibi sağlık faktörleriyle bağdaştırabiliriz. lexicocalorimeter Sosyal medya yayınlarının “kalori içeriğini” ölçmek. Yüksek kalorili gıdalardan bahseden belirli bir bölgeden tweetler, o bölgenin “kalori içeriğini” arttırırken, egzersiz faaliyetlerinden bahseden tweetler metriğimizi azalttı. Bu basit önlemi bulduk diğer sağlık ve iyilik ölçütleri ile bağıntılıdır. Başka bir deyişle, tweets bize belirli bir zamanda, bir şehir veya bölgenin genel sağlığının bir görüntüsünü verebildi.

Twitter verilerinin zenginliğini kullanarak, İnsanların günlük hareket kalıplarını daha önce görülmemiş ayrıntılarla görme. İnsan hareketlilik kalıplarını anlamak, sırayla, hastalık modellemesini dönüştürme ve yeni alanını açma kapasitesine sahiptir. dijital epidemiyoloji.

Diğer çalışmalarda, Twitter'da evde kalanlardan daha fazla mutluluk ifade edip etmediklerini (cevap: yaparlar) ve mutlu bireyler bir sosyal ağda birbirine bağlı kalmaya meyilli (yine yaparlar). Aslında, pozitifliği dilin kendi içine yapılmış gibi görünüyor, yani bizim olumsuz sözlerden daha olumlu sözlerimiz var. Bu sadece Twitter'da değil, birçok farklı medyada (örneğin, kitaplar, filmler ve gazeteler) ve dillerde geçerli değildi.

Bu çalışmalar - ve dünyanın dört bir yanından onlar gibi binlerce insan - sadece Twitter sayesinde mümkün oldu.

Gelecek 10 yıl

Öyleyse, gelecek 10 yıllarında Twitter'dan ne öğrenmeyi bekleyebiliriz?

Halen en heyecan verici çalışmalardan bazıları, hastalık salgınları gibi popülasyon düzeyindeki olayları tahmin etmek için sosyal medya verilerinin matematiksel modellerle birleştirilmesini içeriyor. Araştırmacılar, grip bilgisini tahmin etmek için Twitter verileriyle hastalık modellerini artırmada bazı başarılar elde ettiler. FluOutlook Northeastern Üniversitesi ve Bilimsel Değişim Enstitüsü tarafından geliştirilen bir platform.

Yine de, bazı zorluklar devam etmektedir. Sosyal medya verileri çok düşük bir “sinyal-gürültü oranı” ndan muzdariptir. Başka bir deyişle, belirli bir çalışmaya ilişkin tweetler genellikle ilgisiz “gürültü” ile boğulur.

Bu nedenle, neyin “dublaj” olduğunun bilincinde olmalıyız.büyük veri kocaları“Yeni yöntemler geliştirirken ve sonuçlarımızdan emin değilken. Bununla bağlantılı olarak, bu verilerden yorumlanabilir “cam kutu” tahminleri üretme amacı olmalıdır (algoritmanın gizlenip gizlenmediği “kara kutu” tahminlerinin aksine).

Sosyal medya verileri çoğunlukla (oldukça) küçük olduğu için eleştirilmektedir, temsilci olmayan örnek daha geniş nüfusun Araştırmacılar için en büyük zorluklardan biri, istatistiksel modellerde bu tür çarpık verilerin nasıl hesaplanacağını bulmaktır. Süre her yıl daha fazla insan sosyal medya kullanıyor, bu verilerdeki önyargıları anlamaya çalışmalıyız. Örneğin, veriler hala daha yaşlı nüfus pahasına genç bireyleri abartmaya meyillidir.

Sadece daha iyi önyargı düzeltme yöntemleri geliştirdikten sonra araştırmacılar, tweet'lerden tam olarak emin tahminlerde bulunabilecekler.

Yazar hakkında

Lewis Mitchell, Uygulamalı Matematik Öğretmeni, University of Adelaide

Bu yazı orijinalinde Konuşma. Okumak Orijinal makale.

İlgili Kitaplar

at InnerSelf Pazarı ve Amazon