Bilgisayarlar Biyologların Yaşamın Sırlarını Çatlamasına Nasıl Yardımcı Olur?

Üç milyar dolar uzunluğundaki insan genomu sıralandıktan sonra, yeni bir “omik”Biyolojik araştırma dönemi. Bilim adamları şimdi çeşitli organizmaların genomlarını (tüm genleri) veya proteomlerini (tüm proteinleri) dizmek için yarışıyor - ve bu süreçte büyük miktarda veri derliyor.

Örneğin, bir bilim adamı, bir virüs virüsü enfeksiyonunda hangi insan genlerinin etkilendiğini ortaya çıkarmak için DNA sıralaması gibi “omikler” araçlarını kullanabilir. Ancak insan genomunun toplamda en az 25,000 genine sahip olması nedeniyle, bu kadar basit bir senaryoda bile değiştirilen genlerin sayısı potansiyel olarak binlerce olabilir.

Genleri ve proteinleri sıralamak ve tanımlamak onlara bir isim ve yer vermesine rağmen, bize ne yaptıklarını söylemez. Bu genlerin, proteinlerin ve aradaki bütün şeyler farklı biyolojik süreçlerde etkileşime girer.

Günümüzde, temel deneyler bile büyük veriler üretmektedir ve en büyük zorluklardan biri ilgili sonuçları arka plandaki gürültülerden ayırmaktır. Bilgisayarlar bu veri dağının üstesinden gelmemize yardım ediyor; ancak bilimsel hipotezleri ortaya çıkarmamıza ve yeni biyolojik süreçleri açıklamamıza yardımcı olarak bundan daha da ileri gidebilirler. Veri bilimi, özünde, en son biyolojik araştırmaları mümkün kılmaktadır.

Kurtarma Bilgisayarları

Bilgisayarlar, kitlesel veri setlerini idare etmek için eşsiz bir şekilde kalifiyedir çünkü analiz için gerekli tüm önemli koşulları aynı anda takip edebilirler.


kendi kendine abone olma grafiği


Onlar rağmen insan hatalarını yansıtabilir programlandılar, bilgisayarlar verimli bir şekilde büyük miktarda veri ile başa çıkabiliyor ve insan araştırmacılar gibi tanıdık gelmiyor.

Bilgisayarlara, deneysel veri setlerinde belirli kalıpları aramaları da öğretilebilir - ilk önce 1950'lerde, özellikle de matematikçiler tarafından önerilen bir makine öğrenmesi kavramı. Alan Turing. Daha sonra veri setlerinden kalıpları öğrenen bir algoritmadan daha önce hiç karşılaşmadığı yeni verilere dayanarak tahminler yapması istenebilir.

Makine öğrenimi biyolojik araştırmalarda devrim yarattı, çünkü artık büyük veri setlerini kullanabilir ve bilgisayarlardan temel biyolojiyi anlamalarına yardımcı olabiliriz.

Beyin İşlemlerini Simüle Ederek Düşünecek Bilgisayarları Eğitin

Yapay bir sinir ağı (YSA) adı verilen ilginç bir tür makine öğrenimini kendi laboratuvarımızda kullandık. Beyinler, sinirsel kablolardan elektrik darbeleri göndererek iletişim kuran birbirine bağlı nöron ağlarıdır. Benzer şekilde, bir YSA bilgisayarda diğer nöronların sinyallerine cevap olarak açılıp kapanırken bir nöron ağını taklit eder.

Gerçek nöronların işlemlerini taklit eden algoritmalar uygulayarak, ağın birçok sorunu çözmeyi öğrenmesini sağlayabiliriz. Google şimdi ünlü için güçlü bir YSA kullanır Derin Rüya projesi bilgisayarların sınıflandırdığı ve hatta görüntüleri oluşturabileceği yer.

Grubumuz, bağışıklık sistemini hedefliyor. Kanser için yeni tedaviler bulmak. Bağışıklık hücrelerimizin vücudumuza yabancı bir şey olup olmadığına karar vermek için kullandıkları kısa yüzey protein kodlarını incelemek için ANN hesaplama modellerini kullandık. Bağışıklık hücrelerimizin (T hücreleri gibi) normal / öz ve anormal / yabancı hücreler arasında nasıl farklılaştığını daha iyi anlarsak, daha iyi aşılar ve tedaviler tasarlayabiliriz.

Araştırmacılar tarafından yıllarca tanımlanmış binlerce protein kodunun halka açık kataloglarını araştırdık. Bu büyük veri setini ikiye ayırdık: sağlıklı insan hücrelerinden türetilmiş normal self-protein kodları ve virüslerden, tümörlerden ve bakterilerden türetilen anormal protein kodları. Sonra laboratuvarımızda geliştirilen yapay bir sinir ağına döndük.

Protein kodlarını YSA içine girdikten sonra, algoritma tanımlayabildi temel farklılıklar normal ve anormal protein kodları arasında. İnsanların bu tür biyolojik olayları takip etmeleri zor olacaktır - büyük veri setinde tam anlamıyla analiz etmeleri gereken binlerce protein kodu vardır. Bu karmaşık sorunları çözmek ve yeni biyolojiyi tanımlamak için bir makine gerekiyor.

Makine Öğrenimi Üzerinden Öngörüler

Makine öğreniminin biyolojideki en önemli uygulaması büyük verilere dayalı tahminlerde bulunmasında faydasıdır. Bilgisayar tabanlı tahminler büyük verileri anlamlandırabilir, hipotezleri test edebilir ve değerli zaman ve kaynakları koruyabilir.

Örneğin, T-hücresi biyolojisi alanımızda, hangi virüs protein kodlarının hedef alınacağının bilinmesi aşı ve tedavilerin geliştirilmesinde kritik öneme sahiptir. Ancak, herhangi bir virüsten o kadar çok bireysel protein kodu vardır ki, her birini deneysel olarak test etmek çok pahalı ve zordur.

Bunun yerine, yapay sinir ağını, makineye iki tip protein kodunun tüm önemli biyokimyasal özelliklerini - normal ve anormal olarak - öğrenmeleri için yardımcı olmak üzere eğittik. Sonra, modelden hangi yeni viral protein kodlarının “anormal” kategoriye benzer olduğunu ve T hücreleri ve dolayısıyla bağışıklık sistemi tarafından görülebileceğini “tahmin etmesini” istedik. ANN modelini daha önce hiç çalışılmayan farklı virüs proteinleri üzerinde test ettik.

Tabii ki, öğretmeni memnun etmek isteyen gayretli bir öğrenci gibi, sinir ağı bu virüsün içindeki T hücresi aktive edici protein kodlarının çoğunu doğru bir şekilde tanımlayabildi. Ayrıca, YSA'nın tahminlerinin doğruluğunu onaylamak için işaretlenen protein kodlarını deneysel olarak test ettik. Bu sinir ağı modelini kullanarak, bir bilim adamı, hızlıca tahmin etmek Tüm önemli kısa protein kodları zararlı bir virüsten kodlanır ve bunları tek tek tahmin etmek ve test etmek yerine bir tedavi veya aşı geliştirmek için test eder.

Akıllıca Makine Öğrenimini Uygulamaya Alma

Sürekli rafine etme sayesinde büyük veri bilimi ve makine öğrenmesi her türlü bilimsel araştırma için giderek daha vazgeçilmez hale geliyor. Biyoloji konusunda eğitim almak ve tahmin etmek için bilgisayarları kullanma olanakları neredeyse sonsuzdur. Hangi biyobelirteç kombinasyonunun bir hastalığın tespitinde en iyisi olduğunu bulmak bazı hastalar belirli bir kanser tedavisinden yararlanır, bilgisayar kullanarak büyük veri setlerinin madenciliği araştırma için değerli bir yol haline geldi.

Tabii ki, sınırlamalar var. Büyük veri bilimindeki en büyük sorun verilerin kendisidir. -Omics çalışmaları ile elde edilen verilerin başlaması hatalıysa ya da ayakkabılı bilime dayanıyorsa, makineler kötü veriler konusunda eğitilecektir - zayıf tahminler. Öğrenci sadece öğretmen kadar iyidir.

Çünkü bilgisayarlar duygusal değildir (henüz), hiç kimse olmasa bile, tekrar ortaya çıkma, kötü veriye ve yeniden üretilemeyen bilime rağmen, kalıp arayışı içinde olabilirler.

Ve bazı araştırmacılar bilgisayarların geliştirilmesi konusunda endişelerini dile getirdiler. siyah veri kutuları Adına uyguladıkları manipülasyonları ve donanımları açıkça anlamayan bilim adamları için.

Bu sorunlara rağmen, büyük verilerin ve makinelerin yararları, onları bilimsel araştırmalarda değerli ortaklar yapmaya devam edecektir. Aklımızdaki uyarılarla, biyolojiyi bir makinenin gözünden anlamaya özeliz.

Yazar hakkındaKonuşma

Sri Krishna, Doktora Adayı, Biyolojik Tasarım, Biyolojik ve Sağlık Sistemleri Mühendisliği Fakültesi, Arizona Eyalet Üniversitesi ve Diego Chowell, Uygulamalı Matematik Doktora Öğrencisi, Arizona Eyalet Üniversitesi

Bu yazı orijinalinde Konuşma. Okumak Orijinal makale.


İlgili Kitap:

at InnerSelf Pazarı ve Amazon