Günümüzde uygulandığı şekliyle yapay zekânın ana işlevi verilerden insan süpervizyonu olmadan bilgi çıkarmaktır. Yapay zekânın herhangi bir alanda etki yapabilmesi için o alanda veri toplama, depolama ve işleme kapasitesinin yüksek olması gerekmektedir. İlaç keşfi, yaklaşık son 30 yıldır robotik, son 20 yıldır genetik sekanslama, ve gene bu sürelerde görüntüleme alanlarında olan gelişmeler sayesinde veri anlamında bir devrim yaşamıştır. Bunların gene aynı sürede veri işleme kapasitesindeki ciddi artışla birleşimi sonucunda, ilaç keşfinde yapay zekânın yapabileceği önemli değişikliklerin olduğu ancak bunların henüz tam olarak uygulamaya yansımadığı bir dönem içerisindeyiz. Önümüzdeki yıllarda, kısa ve orta vadede, bu potansiyelin ciddi değişiklikler dizisi üreteceği ve bunun verimlilikte büyük bir artış yaratacağını öngörüyorum.

Yapay Zekânın Hammaddesi Olarak Veri

“Yapay zekâ” tanımı en üst seviyede iki farklı şekilde yapılmalıdır: ‘geniş’ ve ‘dar’ yapay zekâ. ‘Geniş’ yapay zekâ, farklı alanlarda uygulanabilecek ve genel anlamda problem çözebilme yeteneği icra eden bir yapay zekâ ifade etmektedir. Günümüzde böyle bir yapay zekâ hala bilim kurgu niteliğindedir. ‘Dar’ yapay zekâ, sadece belirli bir amaç için tasarlanmış ve o amacın gereksinimlerinin dışında herhangi bir alanda kullanılması mümkün olmayan bir yapay zekâdır. Bu, günümüz dünyasında önemli değişimlerin kaynağı olan ve son yıllarda ciddi ilerlemenin kaydedildiği bir bilim alanıdır.

‘Dar’ ve ‘geniş’ yapay zekâ arasındaki farkı izah için bir doktorun rutinini düşünelim: evinden çıkıp arabasına yürümesi, o arabayı işyerine sürmesi, yolda radyoda yabancı dilde radyo dinlemesi, ve ameliyathaneye girip ameliyat yapması esnasında doktorun gösterdiği her fonksiyonu sadece tek bir zekâ sağlamaktadır. Günümüzdeki yapay zekâ teknolojileri ise bir robotun yürümesi için gerekli hareket planlaması, dil çevirisi, görüntü işleme, araba sürme gibi her alt fonksiyon için apayrı bir yapay zekâ programı yazılması ve eğitilmesini gerektirmektedir. Bu işlevlerden birini yapan, örneğin dil çeviren, bir yapay zekâ programının aynı zamanda araba sürme gibi bir işlevi yerine getirmesi mümkün değildir. Her ‘dar’ yapay zekâ programı, en özünde, belirli ve sabit bir şekilde girilen verilerin gene belirli ve sabit bir sonuca ulaşılacak şekilde işlenmesinden ibarettir. Dolayısıyla günümüzde var olduğu şekliyle yapay zekâ, veri işleme yoluyla bilgisayarların otomatik şekilde bazı kurallar öğrenmesi ile kısıtlıdır. Bu dar yapı günümüzdeki yapay zeka teknolojilerinin fonksiyon gösterebilmesi için veri şarttır. Bu farkındalık, The Economist dergisinin “Dünyanın en değerli kaynağı artık petrol değil, veridir” diye Türkçemize çevrilebilecek bir başlık atmasına yol açmıştır (1). Bu sebeple herhangi bir alanda yapay zekânın etkisini konuşabilmek için önce o alanda verilerin toplanabilmesi, depolanabilmesi ve işlenebilmesi için gerekli altyapıyı analiz etmek gerekir.

İlaç Keşfinde Veri

Geçtiğimiz otuz yıl içerisinde robotik, sekanslama ve görüntüleme alanlarında ilerlemeler ilaç keşfi için faydalı veri toplanmasında devrim niteliğinde ilerlemeler sağlamıştır. İlaç keşfinde yapay zekânın yaptığı ve yapabileceği etkiyi anlamak için, öncelikle bu alanlardaki ilerlemeleri anlamak gerekir. Robotik teknolojilerdeki ilerlemeler çok yüksek sayıda deneylerin kontrollü ve tekrarlanabilir icrasını sağlamıştır. Sıvı işleme, iletim, kontrol ve benzeri alanlarda geliştirilen robotlar, yüksek sayıda kuyucuk içeren deney tabaklarında hızlı ve paralel biçimde yüzlerce deneyin (örneğin 384 kuyucuklu bir tabak içerisinde) icrasını mümkün kılmıştır. Bu teknolojinin uygulandığı en temel alan ilaç taramasıdır. Milyonlarca ilaç adayı kimyasal molekülün herhangi bir deney düzeneği üzerinde taranması en az on yıldır rutin bir işlem haline dönüşmüştür (2). Bu teknolojinin yüksek miktarda sermaye gerektirmesi büyük hacimli özel şirketler ve uzmanlaşmış akademik laboratuvarlar dışında yayılmasını engellemiş olsa da, PubChem veya ChEMBL gibi halka açık veri tabanlarında ciddi miktarda veri bulunmaktadır (3,4).

Sekanslama teknolojilerinde son otuz yıl içerisinde çok yüksek hızda bir gelişme yaşanmıştır. 1990’ların başında çok yavaş ve pahalı olan bu süreç, 2021’de astronomik derecede ucuzlamış ve kolaylaşmıştır. Mevzubahis alanlardaki ilerlemelerin birbirlerini desteklediğinin bir örneği olarak, robotik alanındaki gelişmeler sekanslanacak örnek hazırlanmasında ciddi ilerlemeler sağlamıştır. Bu sayede son beş yıl içerisinde tek hücreli sekanslama çalışmalarını rutin hale getiren robotik cihazlar yaygın kullanıma girmiştir. Bütün bunların sonucu olarak hem sağlıklı dokularda (5) hem de hastalıklı dokularda (6) büyük miktarlarda örnek sekanslanmıştır. Bu organize çalışmaların yanı sıra, birçok tıbbi araştırma kurumunda sekanslama makinesi alınması veya kullanılması sonucunda Gene Expression Omnibus (7) gibi büyük veritabanlarında çok sayıda farklı araştırmacıdan gelen veriler toplanmıştır. Dolayısıyla gelinen noktada gerek genomik, gerek transkriptomik, gerekse epigenetik alanda çok geniş miktarda veriyi halka açık şekilde bulmak mümkün olmuştur.

Görüntüleme alanındaki teknolojilerin biyomedikal amaçla kullanımını artıran ve kolaylaştıran ciddi gelşmeler son 30-40 yıl içerisinde meydana gelmiştir. Bu alandaki önemli gelişmelerden biri, yeşil floresan protein (green fluorescent protein; GFP) ve benzeri florsean ışıma yapan biyomoleküllerin keşfi sayesinde hedef seçilen herhangi bir proteinin hücre içerisindeki doğal ortamında görüntülenebilmesi olmuştur. Belirli bir hedefi yüksek seçicilikle tanıyan antikorların florsean moleküllerle işaretlenmesi, bilime benzer şekilde önemli bir kapasite kazandırmıştır. Biyolojik örneklerin görüntülenebilmesi amacına özel şekilde tasarlanmış GE InCell 6000 gibi canlı hücre çemberi olan robotik mikroskopların geliştirilmesi ile uzun zamanlı dinamik süreçlerin gözlemlenmesi kapasitesi elde edilmiştir. Bütün bunların birleşimi sayesinde günümüzde Allen Institute for Cell Science’ın sunduğu 31,987 üç boyutlu hücre görüntüsü (8) gibi yüksek miktarda veri sağlayan kaynaklar oluşmuştur (9).

Bunların hepsi bir arada ele alındığında, biyomedikal alanda ciddi miktarlarda veri toplanması için gerekli teknolojik altyapının son otuz yıl içerisinde vücut bulduğu görülmektedir. Ancak dikkatli okuyucunun fark edeceği bir zayıflık, bunların hepsinin birbirinden bağımsız olmasıdır. Hücre veya doku görüntüleyen ekipler çoğunlukla sadece görüntü toplama ve işleme ile ilgilenmekte, ve örneğin sekanslama verisi toplayan projeler ile çok kesişim göstermemektedir. Günümüzde bu farklı teknolojilerin her birisi ayrı bir alan olarak görülmekte, bu şekilde veri toplanmakta ve birkaç ön çalışma haricinde, çoğunlukla izole şekilde analiz edilmektedir.

İlaç Keşfinde Yapay Zekâ Uygulamaları

Günümüzde ilaç keşfinde yapay zekâ uygulamaları çok farklı alanda ayrı ve dağınık şekilde gerçekleşmektedir. Çoğunlukla yapay zekâ birleştirici ve farklı alandaki verileri ortak biçimde işleyen bir fonksiyon göstermemektedir. Bunun yerine, farklı alanlarda farklı amaçla toplanan verilerin incelenmesi için o alan ve veriye özgü ayrı uygulamalar çoğunluktadır. Örneğin transkriptomik verinin analizi için spesifik amaçla yazılmış çok sayıda makale, görüntü işlemesi için ise ayrıca yazılmış çok miktarda makale bulunmaktadır. Ancak transkriptomik veri ile uzamsal veriyi birleşik şekilde analiz eden çok az çalışma bulunmaktadır. Bu sebeple, yapay zekânın ilaç keşfi üzerindeki mevcut uygulamalarını konuşmak için her alanı ayrı ayrı ele almak gerekecektir.

Sekanslama verilerinin yapay zekâ ile işlenmesinin ilaç keşfine yapacağı katkıların en önde gelenlerinden biri hastalıkların tedavisi için ilaç taramalarına hedef seçilecek proteinlerin belirlenmesidir. Yüksek sayıda sağlıklı ve hasta insanın farklı -omik verilerinin toplanması ve depolanmasıyla çok farklı hastalık alanlarında uygulama olanakları açılmıştır. Örneğin kanserde yapılan genetik sekanslamalar ve hücre durumunu belirleyen RNA dizilemeleri verileri, yapay zekâ kullanılarak analiz edilip kanserde normale göre değişen özellikler belirlenebilir ve bunlar ilaç keşfi için hedef alınabilir. Enfeksiyon hastalıklarında yapay zekâ kullanılarak yeni patojenlerin hangi proteinlerinin terapötik amaçlı hedef alınmasının en yüksek başarı ihtimali vereceği belirlenebilir. Dejeneratif hastalıklarda gene hangi yolakların ve/veya hangi regülatörlerin hatalı çalıştığı belirlenip bunların giderilmesi için gerekli hedefler seçilebilir. Bu örnekler çoğaltılabileceği gibi, zamanla daha da yeni kullanım alanları gelişecektir.

Robotik tarama teknolojilerinin ürettiği en büyük fırsatlardan biri yapay zekâ kullanarak etken ilaç tahmini yapılmasının zeminini hazırlamaktır. Kanser üzerinden örneklendirmek gerekirse, geçtiğimiz on yılda gittikçe artan sayıda kanser hücre hattı üzerinde yapılan ilaç taramaları yapılmıştır. 2010’da 311 (10) hücre hattı ve 19 ilaçla yapılan taramalar, 2013’te 242 hücre hattı ve 354 kimyasal (11) ve 2016’da yaklaşık bin hücre hattı ve 265 kimyasala çıkmıştır (12). Bu çalışmalar, üzerinde tarama yapılan hücre hatlarının genetik ve transkriptomik karakterizasyonu ile birleştirildiğinde, hangi hücre hattına hangi ilacın verilmesi gerektiği tahminini yapacak yapay zekâ modellerinin zeminini hazırlamıştır (13). Giderek kapsamı ve sayısı artan taramaların diğer biyomedikal alanlarda da yapılması sonucunda kanserle örneklendirdiğimiz bu uygulamanın farklı alanlara da yayılması beklenir.

Yapay zekânın görüntü işleme alt alanındaki ilerlemelerin ilaç keşfinde uyandırdığı büyük etkilerden biri hücrelerin ilaç tedavisi altında durumlarında oluşan değişiklik görüntülerinin analizi noktasında gerçekleşmiştir. İlaç keşfinde sıkça kullanılan bir metot farklı ilaçlarla tedavi edilen hücrelerin görüntülenmesi suretiyle ilaçların etkisinin belirlenmesidir (14). ‘Yüksek içerikli’ diye adlandırılan bu deney tipinde sadece bir ilacın etkisini karakterize etmek için bile çok sayıda doz ve tekrarda deney yapılması, her deney kuyucuğundan da farklı noktalarda görüntü alınması gerekmektedir. Tek bir deneyde bile kolaylıkla on binlerce görüntü alınabilmektedir. Bu miktarda verinin otomatik şekilde incelenmesi için yapay zekâ kullanmak bir zorunluluktur.

Son yıllarda gittikçe artan kalitede görüntüleme verilerinin ilaç keşfinde yapay zekâya açtığı yeni bir yol da daha önce bilinmeyen yolakların keşfedilmesidir. Örneğin melanoma hücrelerinin kanser ilaçlarına direnç göstermesinin mekanizmalarından birisinin hücrelerin ilaç tedavisi altında fiziksel özelliklerinde meydana gelen değişikliklerin sinyalleme yolaklarını etkilemesi olduğu yakın zamanda keşfedilmiştir (15). Son zamanlarda geliştirilen yapay zekâ modelleri, raportör kullanmadan hücre görüntüsündeki biyomolekülleri konumlayabilmektedir (16). Bu tarz yöntemlerin gelişmesi ve yaygınlaşmasıyla, melanoma üzerinden örneklendirdiğimiz gibi daha nice farklı ve bilinmeyen yolağın keşfinin önü açılacaktır. Bu yolakların bilinmesi ilaç keşfinde yeni hedefler ve stratejiler geliştirilmesi için çok değerli olacaktır.

Gerçekleştirilmeyi Bekleyen Potansiyel

Yapay zekânın ilaç keşfinde etki göstermesi için gerekli veri altyapısı ve hacmi vardır ancak hala mevcut uygulamalar çoğunlukla belli tek bir tipte veri üzerinde odaklanmaktadır. Farklı veri cinslerinin entegre biçimde analiz edildiği projeler henüz tam anlamıyla vücut bulmamıştır. Bu, mevzubahis veri havuzlarının nispeten yeni olduğu bir dünyada anlaşılabilir bir başlangıç döneminin işaretidir. Ancak zaman geçtikçe yapay zekânın potansiyelinin tam olarak gerçekleşmesi için entegratif analizler geliştirilmesi şarttır.

İlaç keşfine yapay zekânın yapabileceği en büyük katkı ise henüz literatürde mevcudiyeti olmayan, ancak yapay zekâ sayesinde kurulabilecek olan ilaç keşif süreçleri icat edilmesidir. Burada insanlık tarihindeki daha önce yaşanmış büyük teknolojik atılımları örnek vermek gerekir (17). 1870’ler ve sonrasında, yani endüstri devrimi nispeten yeni iken, fabrikalar genelde buhar gücü kullanılarak tek bir büyük kolun çevrilmesi ve bütün makinaların bu koldan güç alması üzerine tasarlanmıştı. Elektrik ilk yayılmaya başladığında bu kolu çevirmek için buhar yerine elektrik kullanılmış, ancak bunun ciddi bir verimlilik kazandırmadığı görülmüştü. Ancak 1920’lerde elektriğin kolaylıkla farklı yerlere gücü dağıtabilme özelliği sayesinde tek bir kolun çevrilmesi etrafında değil, üretim süreci etrafında tasarlanmış seri üretim bantları fabrika tasarımlarının merkezine oturtulunca elektrik gerçek verimini kanıtlayabildi. Bu öyle bir verim artışı sağladı ki, 1920’lerde Amerika, tarihinin en büyük ekonomik büyüme süreçlerinden birini yaşadı. Nitekim kişisel bilgisayarlar da 1980 veya 1990’larda mevcut olmasına rağmen, gündelik hayata bilişimin ciddi bir şekilde katkı yapabilmesi 2000’lerin sonu ve 2010’larda akıllı telefon formatında dijital cihazların yayılmasıyla gerçekleşti. 2000’lerin ortasında en değerli şirketler petrol şirketleri iken, bugün en değerli şirketler teknoloji şirketleri oldu. Dolayısıyla, tarihsel süreçlerden görüyoruz ki devrimsel nitelikte bir teknolojinin icadı ile etkisini göstermesi arasında bir süreç vardır. Bu süreç, yeni teknolojinin merkezde olduğu ve bu teknolojinin yokluğunda mümkün olmayan yeni modellerin geliştirilmesi sürecidir. Şahsi kanaatime göre yapay zekânın ilaç keşfine etkisi için de aynı durum söz konusudur: ancak yapay zekâ kullanarak yapay zekânın yokluğunda mümkün olmayacak ilaç keşif süreçleri tasarlanması ile bu yeni teknoloji tam etkisini gösterecektir. İlaç keşfinde yapay zekâ çalışmak için çok heyecan verici bir dönemde yaşıyoruz.

Kaynaklar

1) The Economist. The World’s Most Valuable Resource is No Longer Oil, 2017. https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data (Erişim Tarihi: 04.03.2021)

2) Macarron R, Banks MN, Bojanic D, Burns DJ, Cirovic DA, Garyantes T, et al. Impact of High-Throughput Screening in Biomedical Research. Nat Rev Drug Discov. 2011 Mar;10(3):188–95.

3) Kim S, Chen J, Cheng T, Gindulyte A, He J, He S, et al. PubChem in 2021: New Data Content and Improved Web Interfaces. Nucleic Acids Res. 2021 Jan 8;49(D1):D1388–95.

4) Mendez D, Gaulton A, Bento AP, Chambers J, De Veij M, Félix E, et al. ChEMBL: Towards Direct Deposition of Bioassay Data. Nucleic Acids Res. 2019 Jan 8;47(D1):D930–40.

5) GTEx Consortium. The Genotype-Tissue Expression (GTEx) Project. Nat Genet. 2013 Jun;45(6):580–5.

6) National Cancer Institute. The Cancer Genome Atlas Program, 2018. https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga (Erişim Tarihi: 04.03.2021)

7) Barrett T, Wilhite SE, Ledoux P, Evangelista C, Kim IF, Tomashevsky M, et al. NCBI GEO: Archive for Functional Genomics Data Sets–Update. Nucleic Acids Res. 2013 Jan;41:D991–5.

8) Allen Institute for Cell Science, Data Downloading. https://www.allencell.org/data-downloading.html (Erişim Tarihi: 04.03.2021)

9) Roberts B, Haupt A, Tucker A, Grancharova T, Arakaki J, Fuqua MA, et al. Systematic Gene Tagging Using CRISPR/Cas9 in Human Stem Cells to Illuminate Cell Organization. MBoC. 2017 Oct 15;28(21):2854–74.

10) Greshock J, Bachman KE, Degenhardt YY, Jing J, Wen YH, Eastman S, et al. Molecular Target Class is Predictive of in Vitro Response Profile. Cancer Res. 2010 May 1;70(9):3677–86.

11) Basu A, Bodycombe NE, Cheah JH, Price EV, Liu K, Schaefer GI, et al. An Interactive Resource to Identify Cancer Genetic and Lineage Dependencies Targeted by Small Molecules. Cell. 2013 Aug 29;154(5):1151–61.

12) Iorio F, Knijnenburg TA, Vis DJ, Bignell GR, Menden MP, Schubert M, et al. A Landscape of Pharmacogenomic Interactions in Cancer. Cell. 2016 Jul 28;166(3):740–54.

13) Ali M, Aittokallio T. Machine Learning and Feature Selection for Drug Response Prediction in Precision Oncology Applications. Biophys Rev. 2019 Feb;11(1):31–9.

14) Murali VS, Chang B-J, Fiolka R, Danuser G, Cobanoglu MC, Welf ES. An Image-Based Assay to Quantify Changes in Proliferation and Viability upon Drug Treatment in 3D microenvironments. BMC Cancer. 2019 May 28;19(1):502.

15) Mohan AS, Dean KM, Isogai T, Kasitinon SY, Murali VS, Roudot P, et al. Enhanced Dendritic Actin Network Formation in Extended Lamellipodia Drives Proliferation in Growth-Challenged Rac1P29S Melanoma Cells. Dev Cell. 2019 May 6;49(3):444–60.e9.

16) Ounkomol C, Seshamani S, Maleckar MM, Collman F, Johnson GR. Label-Free Prediction of Three-Dimensional Fluorescence Images from Transmitted-Light Microscopy. 2018 Sep 17; https://doi.org/10.1038/s41592-018-0111-2 (Erişim Tarihi: 04.03.2021)

17) David PA. The Dynamo and the Computer: An Historical Perspective on the Modern Productivity Paradox. Am Econ Rev. 1990;80(2):355-61.

SD (Sağlık Düşüncesi ve Tıp Kültürü) Dergisi Mart, Nisan, Mayıs 2021 tarihli 58. sayıda sayfa 24-27’de yayımlanmıştır.