Korelasyon ve Nedensellik Arasındaki Karışıklıkların Giderilmesi 

İşte size farkında olmayabileceğiniz tarihi bir haberleşme. 1860 ve 1940 yılları arasında, New England'da yaşayan Metodist bakanların sayısı arttıkça, Boston'a ithal edilen Küba romunun miktarı da arttı - ve ikisi de oldukça benzer bir şekilde arttı. Dolayısıyla, Metodist bakanlar o zamanlar çok fazla rom almış olmalılar!

Aslında hayır, bu çıkarılacak aptalca bir sonuç. Gerçekte olan şey, her iki miktarın da (Metodist bakanlar ve Küba romu) nüfus artışı gibi diğer faktörler tarafından yukarı doğru itilmesidir.

Bu yanlış sonuca ulaşırken çok yaygın olan hatayı yaptık: Nedensellik ile kafa karıştırıcı korelasyon.

Fark ne?

İki miktarın olduğu söyleniyor korelasyon  her ikisi de birlikte artıyor ve azalıyorsa ("pozitif korelasyon") veya biri artarken diğeri azalıyorsa veya tam tersi ("negatif korelasyon").

Korelasyon, istatistiksel ölçümlerle kolayca tespit edilir. Pearson korelasyon katsayısıBu, iki miktarın birbirine ne kadar sıkı bir şekilde kilitlendiğini gösterir; -1 (mükemmel şekilde negatif korelasyon) ile 0 (hiç korelasyon yok) ve 1'e (mükemmel pozitif korelasyon) kadar değişir.


kendi kendine abone olma grafiği


 nedensellik1tylervigen.com

Ancak iki niceliğin birbiriyle ilişkili olması mutlaka birinin doğrudan ilişkili olduğu anlamına gelmez. neden olan diğeri değişecek. Bağlılık nedenselliği ifade etmeztıpkı bulutlu havanın yağış anlamına gelmemesi gibi, tersi doğru olsa da.

Eğer iki miktar birbiriyle ilişkiliyse, o zaman gerçek bir neden-sonuç ilişkisi olabilir (yağmur seviyeleri ve şemsiye satışları gibi), ancak başka değişkenler de her ikisini de etkiliyor olabilir (örneğin, korsan sayıları ve küresel ısınma) veya belki de sadece bir tesadüftür (örneğin ABD peynir tüketimi ve çarşaf başına boğulma).

Nedensellik mevcut olsa bile nedeni sonuçla karıştırmamaya dikkat etmeliyiz, aksi takdirde örneğin ısıtıcıların kullanımının artmasının havanın soğumasına neden olduğu sonucuna varabiliriz.

Sebep-sonuç ilişkisi kurmak için istatistiklerin ötesine geçmemiz ve ayrı deliller (bilimsel veya tarihsel nitelikte) ve mantıksal akıl yürütme aramamız gerekir. Korelasyon bizi ilk etapta böyle bir kanıt aramaya sevk edebilir, ancak hiçbir şekilde kendi başına bir kanıt değildir.

İnce Sorunlar

Yukarıdaki örnekler açıkça saçma olmasına rağmen, korelasyon, gerçek dünyada hemen belli olmayan şekillerde nedensellik ile sıklıkla karıştırılmaktadır. İstatistikleri okurken ve yorumlarken, verilerin ve istatistiklerin tam olarak ne anlama geldiğini ve daha da önemlisi ne olduklarını anlamaya büyük özen gösterilmelidir. değil ima ediyor.

 nedensellik2

Verilerin yorumlanmasında dikkatli olunması gerektiğine dair güncel bir örnek, bu yılın başlarında çığır açıcı bir gelişme etrafında yaşanan heyecandır. yerçekimi dalgalarının tespiti – yapılmış gibi görünen bir duyuru zamanından önce, verileri etkileyen tüm değişkenler hesaba katılmadan önce.

Ne yazık ki istatistikleri, olasılıkları ve riskleri analiz etmek, bizim bünyemizde yer alan bir beceri seti değildir. insan sezgisive böylece yoldan saptırılmak çok kolaydır. Bütün kitaplar İstatistiklerin yanlış yorumlanabileceği (veya yanıltmak için kullanılabileceği) incelikli yollar üzerine yazılmıştır. Tedbirinizi korumanıza yardımcı olmak için, bilmeniz gereken bazı yaygın kaygan istatistiksel problemler şunlardır:

1) Bazen iki grubun eşit şartlar altında doğrudan karşılaştırılamadığı Sağlıklı Çalışan Etkisi.

Bir grup ofis çalışanının sağlığını bir grup astronotun sağlığıyla karşılaştıran varsayımsal bir çalışmayı düşünün. Eğer çalışma ikisi arasında önemli bir fark göstermiyorsa (sağlık ile çalışma ortamı arasında bir ilişki yoksa), uzayda yaşamanın ve çalışmanın astronotlar için uzun vadeli sağlık riskleri taşımadığı sonucuna mı varacağız?

HAYIR! Gruplar aynı temelde değil: Astronot birlikleri, sağlıklı adaylar bulmak için başvuru sahiplerini tarıyor ve bu adaylar daha sonra "mikro yerçekiminde" yaşamanın etkileriyle proaktif bir şekilde mücadele etmek için kapsamlı bir fitness rejimini sürdürüyorlar.

Bu nedenle ortalama olarak onların ofis çalışanlarından çok daha sağlıklı olmalarını bekleriz ve eğer öyle değilse haklı olarak endişelenmeliyiz.

2) Sınıflandırma ve Aşama Geçiş Etkisi – insanları gruplar arasında karıştırmanın istatistiksel sonuçlar üzerinde dramatik etkileri olabilir.

Bu aynı zamanda Will Rogers ABD'li komedyenin şu espriyi yapmasının ardından:

Okie'ler Oklahoma'dan ayrılıp Kaliforniya'ya taşındıklarında her iki eyalette de ortalama zeka seviyesini yükselttiler.

Örneklemek gerekirse, büyük bir arkadaş grubunu "kısa" bir grup ve "uzun" bir gruba ayırdığınızı hayal edin (belki de onları bir fotoğraf için düzenlemek amacıyla). Bunu yaptıktan sonra, her iki grubun ortalama boyunu aynı anda yükseltmek şaşırtıcı derecede kolaydır.

"Uzun" gruptaki en kısa kişiden "kısa" gruba geçmesini isteyin. "Uzun" grup en kısa üyesini kaybeder ve böylece ortalama boyları artar; ancak "kısa" grup şu ana kadarki en uzun üyesini kazanır ve dolayısıyla ortalama boy da artar.

Bunun, yeni bir tedaviyi test ederken hastaların sıklıkla "sağlıklı" veya "sağlıksız" gruplara ayrıldığı tıbbi çalışmalarda önemli etkileri vardır. Tanı yöntemleri iyileşirse, çok az sağlıksız olan bazı hastalar yeniden sınıflandırılabilir; bu da tedavinin ne kadar etkili (veya etkisiz) olduğuna bakılmaksızın her iki grubun sağlık sonuçlarının iyileşmesine yol açabilir.

 nedensellik3Veriler arasından seçim yapmak yanlış sonuçlara yol açabilir. Şüpheciler, veriler gerçekten uzun vadeli ısınmayı (yeşil) gösterdiğinde, soğuma dönemini (mavi) görüyorlar. şüphecilikbilim.com 

3) Veri madenciliği – çok miktarda veri mevcut olduğunda, istenilen sonucu desteklemek için küçük parçalar isteğe göre seçilebilir.

Bu kötü bir istatistiksel uygulamadır, ancak kasıtlı olarak yapılırsa Orijinal, eksiksiz veri seti hakkında bilgi olmadan fark edilmesi zor olabilir.

Örneğin, küresel ısınma verilerinin iki yorumunu gösteren yukarıdaki grafiği düşünün. Veya florür; küçük miktarlarda tarihteki en etkili koruyucu ilaçlardan biridir, ancak yalnızca toksik miktarlarda florür dikkate alındığında olumlu etki tamamen ortadan kalkar.

Benzer nedenlerden dolayı, belirli bir istatistiksel deneye ilişkin prosedürlerin deney başlamadan önce sabitlenmesi ve deney bitene kadar değişmeden kalması önemlidir.

4) Kümelenme – tamamen rastgele verilerde bile beklenebilecek bir durumdur.

Kanser veya Multipl skleroz gibi belirli bir hastalığın nasıl ortaya çıktığını inceleyen tıbbi bir çalışmayı düşünün. coğrafi olarak dağıtılmış. Eğer hastalık rastgele ortaya çıkarsa (ve çevrenin hiçbir etkisi yoksa), doğal olarak çok sayıda hasta kümesi görmeyi bekleriz. Eğer hastalar tamamen eşit bir şekilde dağılırsa, dağılım gerçekten de son derece rastgele olacaktır!

Dolayısıyla tek bir kümenin veya birkaç küçük vaka kümesinin varlığı tamamen normaldir. Bu alandaki bir şeyin hastalığa neden olabileceğini anlamak için ne kadar kümelemenin gerekli olduğunu belirlemek için gelişmiş istatistiksel yöntemlere ihtiyaç vardır.

Ne yazık ki herhangi bir küme, hatta önemsiz bile olsa, kolay (ve ilk bakışta ilgi çekici) bir haber başlığına dönüşebilir.

 nedensellik4

Diğer güçlü araçlar gibi istatistiksel analiz de çok dikkatli kullanılmalıdır ve özellikle iki niceliğin ilişkili olduğu gerçeğine dayanarak sonuçlar çıkarırken her zaman dikkatli olunmalıdır.

Bunun yerine, neden-sonuç ilişkisini savunmak için her zaman ayrı kanıtlar üzerinde ısrarcı olmalıyız ve bu kanıtlar tek bir istatistiksel sayı biçiminde olmayacaktır.

Belirli genler ve genler arasında görünüşte zorlayıcı korelasyonlar var. şizofreni veya arasında yüksek yağlı diyet ve kalp hastalıklarının çok şüpheli bir metodolojiye dayandığı ortaya çıkabilir.

Belki de tür olarak bu sorunlarla baş etmeye bilişsel olarak yeterince hazır değiliz. Kanadalı eğitimci olarak Kieran Egan kitabına koy Baştan Yanlış Anlamak:

Kötü haber şu ki, evrimimiz bizi küçük, istikrarlı, avcı-toplayıcı toplumlarda yaşayacak şekilde donattı. Biz Pleistosen insanlarıyız, ancak dil bilen beyinlerimiz, içinde yaşamamız için devasa, çok kültürlü, teknolojik olarak gelişmiş ve hızla değişen toplumlar yarattı.

Sonuç olarak, anlamı şans eseri görme ve korelasyon ile nedenselliği karıştırma eğilimine sürekli olarak direnmeliyiz.Konuşma

Bu yazı orijinalinde Konuşma
Oku Orijinal makale.


Yazarlar Hakkında

borwein jonathanJonathan Borwein (Jon), Newcastle Üniversitesi'nde Ödüllü Matematik Profesörüdür. Newcastle Üniversitesi'nde ödüllü matematik profesörü ve Bilgisayar Destekli Araştırma Matematiği ve Uygulamaları Merkezi'nin (CARMA) Direktörüdür. Carnegie-Melon, Dalhousie, Simon Fraser ve Waterloo Üniversitelerinde çalıştı ve bilgisayar alanında iki Kanada Araştırma Başkanlığı yaptı.

gül michaelMichael Rose, Newcastle Üniversitesi Matematik ve Fizik Bilimleri Fakültesi'nde Doktora Adayıdır. Avustralya'daki Newcastle Üniversitesi'nde Laureate Prof. Jon Borwein'in danışmanlığında matematik doktora öğrencisidir. Şu anda beyin sinaps dağılımlarının modellenmesinde fraktal matematiğin uygulanmasına yönelik araştırmalara yardımcı olmaktadır.

Açıklama bildirimi: Yazarlar bu makaleden yararlanabilecek herhangi bir şirket veya kuruluş için çalışmaz, danışmanlık yapmaz, hisse sahibi değildir veya fon almamaktadır. Ayrıca ilgili hiçbir bağlantıları yoktur.


Önerilen Kitap:

Para, Seks, Savaş, Karma: Budist Devrimi İçin Notlar
David R. Loy tarafından.

Para, Seks, Savaş, Karma: David R. Loy'dan Budist Devrimi İçin Notlar.David Loy, Budist dünya görüşünün en güçlü taraftarlarından biri haline geldi ve başka hiç kimsenin modern dünyanın sosyopolitik manzarasını dönüştürme yeteneğini açıklamadığını açıkladı. İçinde Para, Seks, Savaş, KarmaO, açıkça yanlış anlaşılan Budist zımbaları - karmanın çalışması, özün doğası, hem bireysel hem de toplumsal düzeylerde sorunların nedenleri - ve bizim asla "kollektif" anlayışımızın ardındaki gerçek nedenlerin keskin ve hatta şok edici biçimde net sunumlarını sunar. , "zaman, para, seks, güvenlik ... hatta savaş. David'in "Budist Devrimi" hayatımıza, gezegenimize, dilimizi, kültürümüzü ve hatta maneviyatımızı sarsan kolektif sanrılara yaklaşma biçimimizdeki radikal bir değişiklikten başka bir şey değildir.

Daha fazla bilgi ve / veya bu kitabı Amazon'da sipariş etmek için buraya tıklayın.