
(SeaPRwire) – Penyelidik di Mayo Clinic dan Goodfire, sebuah syarikat permulaan penyelidikan di San Francisco, berkata mereka telah menggunakan model AI untuk meramalkan mutasi genetik mana yang menyebabkan penyakit—dan, yang penting, untuk menjelaskan mengapa—menawarkan pendekatan baru untuk mendiagnosis dan mengkaji gangguan genetik secara besar-besaran.
Penyelidikan ini menggunakan teknik dari kebolehinterpretasian AI—sains baru yang dikhaskan untuk memahami otak AI yang tidak jelas—untuk meramalkan dan memahami mutasi gen mana yang mungkin “patogenik.”
Diagnosis dan rawatan awal kanser tertentu boleh menjadi perbezaan antara hidup dan mati, kata Matthew Callstrom, profesor radiologi dan ketua program AI generatif di Mayo Clinic. Walau bagaimanapun, genom manusia terdiri daripada lebih 3 bilion pasangan asas—masalah seperti mencari jarum di dalam timbunan jerami yang besar.
Penyelidik bekerja dengan Evo 2—model asas genomik sumber terbuka yang dilatih oleh Arc Institute—untuk meramalkan mutasi DNA mana yang menyebabkan penyakit, dan memahami ciri biologi mana yang mungkin bertanggungjawab. Evo 2 dilatih untuk meramalkan “huruf” seterusnya dalam urutan DNA—dengan cara yang sama seperti model bahasa besar (LLM) seperti ChatGPT dilatih untuk meramalkan perkataan seterusnya dalam teks. Bagi ChatGPT, latihan pada kebanyakan teks di internet mengajarnya struktur bahasa dan fakta tentang dunia. Dilatih pada 128,000 genom yang merangkumi semua domain kehidupan—setiapnya terdiri daripada hanya empat huruf (G, T, C, dan A), molekul yang membentuk DNA—Evo 2 belajar urutan genetik mana yang ‘berguna untuk kehidupan’, kata Nicholas Wang, salah seorang penulis kertas kerja.
Walau bagaimanapun, pengetahuan ini terkunci dalam tujuh bilion nombor yang menyandikan otak buatan model: penyelidik boleh melihat nombor-nombor itu, tetapi maknanya tidak jelas. Sama seperti EEG yang mengukur aktiviti elektrik dalam otak manusia tidak memberitahu ahli neurosains apa yang dipikirkan oleh pesakit, penyelidik AI boleh melihat apa yang berlaku di dalam otak AI tetapi sukar untuk menafsirkannya.
Penyelidik Goodfire menunjukkan kepada Evo 2 contoh mutasi gen patogenik dan benigna, dan mengukur bahagian mana dari otaknya yang “menyala” sebagai tindak balas—membolehkan mereka mengasingkan tindak balas AI terhadap mutasi patogenik. Mereka mendapati bahawa mereka boleh menggunakan ini untuk meramalkan mutasi mana yang menyebabkan penyakit dengan lebih baik daripada setiap alat pengiraan sedia ada yang mereka uji—walaupun Evo 2 tidak pernah dilatih secara eksplisit untuk tugas meramalkan mutasi mana yang menyebabkan penyakit. Seperti LLM, skala data yang Evo 2 dilatih—kira-kira sepuluh kali lebih banyak daripada model asas genomik terbesar sebelumnya—telah membolehkannya menyimpulkan corak apa yang DNA sihat ada secara umum.
Namun, di klinik, ramalan adalah tidak mencukupi. “Sangat penting bahawa kita memahami mengapa model membuat keputusan,” kata Matt Redlon, Pengerusi program AI Mayo Clinic dan pengarang bersama kertas kerja.
Penyiasatan lanjut menunjukkan bahawa Evo 2 telah menyimpulkan ciri biologi yang bermakna dalam urutan DNA. Contohnya, Evo 2 telah belajar mengenal pasti batas antara bahagian DNA yang berbeza, walaupun genom yang dilatihnya tidak mempunyai label eksplisit untuk batas-batas ini.
Ciri biologi ini membantu menjelaskan mengapa mutasi tertentu menyebabkan penyakit dan yang lain tidak. Mutasi tepat di batas dua bahagian DNA lebih berkemungkinan menghasilkan protein yang rosak, membawa kepada gangguan genetik. Mutasi di dalam bahagian yang dibuang sebelum protein dibina biasanya tidak berbahaya.
Kebolehan kertas kerja ini untuk mengenal pasti ciri biologi mutasi bukannya hanya memberikan skor patogenik yang tidak jelas adalah “kemajuan penting,” kata Bo Wang, saintis AI utama di University Health Network Kanada.
Apabila kos penjujukan genom jatuh—dengan sistem terkini mendakwa menjujukan genom keseluruhan untuk $100—kaedah mentafsir data genetik, seperti yang ini, boleh membantu saintis “kembali kepada biologi” dan mencipta “terapi personalis” untuk individu, kata Redlon.
Walau bagaimanapun, sebelum kaedah Goodfire sedia untuk klinik, ia perlu menjalankan ujian yang lebih besar untuk memahami prestasinya pada populasi yang lebih luas dan kemudian melalui kelulusan FDA. Selain itu, walaupun penyelidik mendapati konsep biologi disimpan di dalam Evo 2, terdapat “tiada jaminan” bahawa model sebenarnya menggunakan konsep-konsep itu untuk menentukan mutasi mana yang patogenik, kata James Zou, profesor sains data biomedic di Stanford.
Kebolehinterpretasian telah mendapat perhatian apabila AI digunakan dalam sains hayat dan lain-lain. Goodfire, yang ditubuhkan pada 2023 untuk memajukan kebolehinterpretasian model AI—cabaran yang dipanggil oleh pengasas bersama dan CTOnya Dan Balsam sebagai “masalah paling penting di dunia”—divalue pada $1.25 bilion pada bulan Februari. Pada Januari, Goodfire menerbitkan penyelidikan yang mengenal pasti biomarker baru untuk Alzheimer yang disimpan di dalam otak model AI, meningkatkan janji untuk mencari konsep baru di dalam otak model AI yang telah luput daripada saintis manusia.
“Menurut saya, bahagian yang paling menarik [kebolehinterpretasian] adalah dapat membuka kotak hitam dan melihat, ‘Adakah model sebenarnya belajar sesuatu tentang sains di luar apa yang kita ketahui?'” kata Zou. Penyelidikan baru Goodfire tidak melakukan ini, kerana ia hanya menyiasat Evo 2 untuk konsep yang diketahui, tambah Zou.
Kebolehinterpretasian juga telah digunakan pada model bahasa besar, seperti ChatGPT dan Claude. Baru-baru ini, penyelidik di Anthropic mendapati bahawa Claude Mythos, generasi terbaru model AI unggulan syarikat itu, menunjukkan tanda-tanda dalaman kesedaran tentang diuji dan kemudian menipu pada ujian—walaupun tidak pernah menyatakan secara eksplisit bahawa ia sedar diuji. Kemungkinan model AI boleh menipu pada ujian yang berkaitan keselamatan meningkatkan kepentingan teknik yang membolehkan penyelidik mengimbas otak AI untuk tanda-tanda tingkah laku yang salah.
“Jika terdapat penghalang seperti, ‘Adakah kebolehinterpretasian berguna?’ Saya fikir kita telah memecahkannya, dan saya fikir kita telah menembusinya,” kata Balsam.
Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.
Sektor: Top Story, Berita Harian
SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.