çevrimiçi yalan 6 29

Hayatta emin olabileceğiniz üç şey var: ölüm, vergiler - ve yalan söyleme. İkincisi, İngiltere’nin yakın tarihli Brexit referandumu’nda numara arasında Kampanyadan çık rehin daha fazla arıyorum sevmek porkie turta katı gerçeklerden daha.

Ancak internet reklamcılığı, vize başvuruları ve akademik makalelerden politik bloglara, sigorta taleplerine ve buluşma profillerine, dijital yalanları anlatabileceğimiz sayısız yer var. Öyleyse, bu çevrimiçi fiberleri tespit etmek nasıl mümkün olabilir? Eh, Westminster Üniversitesi'nden Stephan Ludwig, City Üniversitesi Londra Cass İşletme Okulu'ndan Ko de Ruyter, Louvain Katolik Üniversitesi'nden Mike Friedman ve sizinki gerçekten dijital bir yalan dedektörü geliştirdi - ve bir çok internet hakikatini açığa çıkarabilir. .

Yeni araştırmamızdadoğru olduğu bilinenlerle yalan olarak tanımlanmış onbinlerce e-postayı karşılaştırmak için dilbilimsel ipuçlarını kullandık. Ve bu karşılaştırmadan, aldatmayı tespit edebilen bir metin analitik algoritması geliştirdik. Üç seviyede çalışır.

1. Kelime kullanımı

Anahtar kelime aramaları, çok miktarda dijital veriyle uğraşırken makul bir yaklaşım olabilir. Böylece, ilk önce iki belge kümesi arasındaki kelime kullanımındaki farkları ortaya çıkardık. Bu farklılıklar, yalan içerebilecek metni belirler. Genellikle yalan söyleyen bireylerin, ben, sen ve o gibi daha az kişisel zamirleri ve parlak, korkusuz ve yüce gibi daha fazla sıfat kullandıklarını gördük. Ayrıca, ben, benim, benim gibi daha az birinci şahıs tekil zamirleri, başa çıkma sözleriyle (kazanacağınız, kahramanınızla) yapabileceğiniz gibi, tutarsa ​​olması gereken gibi tutarsızlık sözleriyle kullanırlar. , kazanmak).

Daha az sayıda şahıs zamiri, bir yazarın kendilerini sözcüklerinden ayrıştırma girişimini gösterirken, daha fazla sıfat kullanmak, gereksiz açıklamaların telaşı ile yalandan uzaklaşma girişimidir. Tutarsızlık sözleriyle birleştirilmiş daha az birinci şahıs tekil zamir, inceliksizlik ve pozitif bir özdeşlik imajı gösterirken, başarı sözleriyle birlikte daha fazla ikinci şahıs zamiri, alıcıları daha yasaklama girişiminde bulunduğunu gösterir. Bu nedenle, bu arama terimleri kombinasyonlarını algoritmamıza dahil ettik.


kendi kendine abone olma grafiği


2. Yapı incelemesi

Çözümün bir diğer kısmı da, neden, çünkü, bil ve yap - gibi bilişsel süreç kelimelerinin varyansının analizinde yatıyordu ve yapı kelimeleri ile yalanlar arasındaki ilişkiyi belirledik.

Yalancılar, gerçek bellekten aldatıcı e-postalar oluşturamazlar, böylece algılamayı önlemek için kendiliğindenliği önlerler. Bu, yalancıların genel olarak gerçeği söyleyen insanlardan daha bilişsel süreç kelimeleri kullandığı anlamına gelmez, ancak bu sözcükleri daha tutarlı bir şekilde içerir. Örneğin, her cümleyi bir sonrakine bağlamaya meyillidirler - “bunun böyle olduğunu biliyoruz, çünkü durum böyle olmalı”. Algoritmamız, işlem kelimelerinin iletişimde kullanılmasını algılar.

3. E-posta yaklaşımı

Ayrıca, bir e-posta göndereninin, başkalarıyla bir dizi e-posta alışverişinde bulunurken dil stilini nasıl değiştirdiğini de inceledik. Çalışmanın bu kısmı, değişim gerçekleştikçe, gönderenin alıcının kullandığı işlev kelimelerini kullanma eğiliminde olduğunu ortaya koydu.

İşlev sözcükleri, bir cümlenin anlamını - örneğin, a, am - sözdizimine veya yapısına katkıda bulunan sözcüklerdir. Ve gönderenler, mesajlarının dil stilini alıcınınki ile eşleşecek şekilde revize ettiler. Sonuç olarak, algoritmamız bu eşleşmeyi tanımlar ve toplar.

Heyecan verici uygulamalar

Tüketici bekçileri bu teknolojiyi şüpheli nitelikteki reklamlara “muhtemelen yalan söyleyen” bir puan vermek için kullanabilirler. Güvenlik şirketleri ve ulusal sınır güçleri, algoritmayı vize başvuruları ve iniş kartları gibi belgeleri değerlendirmek, erişim ve giriş kurallarına ve düzenlemelerine uyumu daha iyi izlemek için kullanabilirler. Yüksek öğrenim sınavı komitelerinin sekreterleri ve akademik dergilerin editörleri, öğrenci tezlerini ve intihal için akademik makaleleri otomatik olarak kontrol etmek için prova araçlarını geliştirebilirler.

Aslında, potansiyel uygulamalar devam ediyor. Politik bloglar, sosyal medya etkileşimlerini metin anomalileri için başarılı bir şekilde izleyebilir, tarihleme ve inceleme siteleri kullanıcılar tarafından gönderilen mesajları "muhtemelen yalan söyleme" puanlarına göre sınıflandırabilir. Sigorta şirketleri talep denetimi için zamanlarını ve kaynaklarını daha iyi kullanabilirler. Muhasebeciler, vergi danışmanları ve adli tıp uzmanları, mali tabloları ve vergi taleplerini inceleyebilir ve aldatıcı sigara tabancalarını algoritmamız aracılığıyla bulabilirler.

İnsanlar aldatma bilinçli bir şekilde algılamada şaşırtıcı derecede kötü. Aslında, Bir yalan tespit edildiğinde insan doğruluğu sadece% 54, şanstan daha iyi değil. Bu arada, dijital yalan dedektörümüz% 70 doğrudur. Bilgisayarlı içerikte gerçekleştiği her yerde ve teknoloji geliştikçe dolandırıcılıkla mücadele etmek için işe koyulabilir, Pinokyo uyarıları tamamen otomatik olabilir ve doğruluğu daha da artacaktır. Pinokyo'nun burnunun refleks olarak sahte olduğu gibi, dijital yalan dedektörümüz de öyle. Lifler dikkat eder.

Yazar hakkında

KonuşmaTom van Laer, Pazarlama, Öğretim Üyesi, City University London

Bu yazı orijinalinde Konuşma. Okumak Orijinal makale.

İlgili Kitaplar

at InnerSelf Pazarı ve Amazon