تکنوتیس-مدل محاسباتی جدید دانشگاه «امآیتی» میتواند با دقت بیشتری به پیشبینی ساختار آنتیبادی بپردازد و به پژوهشگران کمک کند تا بتوانند داروهای مبتنی بر آنتیبادی را برای انواع بیماریهای عفونی ارائه دهند.
پژوهشگران با کمک مدلهای هوش مصنوعی معروف به مدلهای زبانی بزرگ، پیشرفت زیادی را در توانایی خود برای پیشبینی ساختار پروتئین از روی توالی آن داشتهاند اما این رویکرد درباره آنتیبادیها چندان موفق نبوده که تا حدی به دلیل تغییرپذیری زیاد این نوع پروتئین است.
به نقل از امآیتی نیوز، دانشگاه «امآیتی»(MIT) برای غلبه بر این محدودیت، یک روش محاسباتی ابداع کردهاند که به مدلهای زبانی بزرگ امکان میدهد تا ساختار آنتیبادی را با دقت بیشتری پیشبینی کنند. نتیجه کار آنها میتواند پژوهشگران را قادر سازد تا میلیونها آنتیبادی احتمالی را به منظور شناسایی آنتیبادیهای مورد نیاز برای درمان کروناویروس و سایر بیماریهای عفونی بررسی کنند.
«بانی برگر»(Bonnie Berger) از پژوهشگران این پروژه گفت: این روش به ما امکان میدهد تا چند سوزن را در انبار کاه پیدا کنیم. اگر بتوانیم به شرکتهای دارویی کمک کنیم تا از انجام دادن آزمایشهای بالینی با داروهای اشتباه جلوگیری کنند، صرفهجویی قابل توجهی را در هزینهها خواهیم داشت.
این روش که بر مدلسازی نواحی متغیر آنتیبادیها تمرکز دارد، پتانسیل خود را برای تحلیل کل مجموعههای آنتیبادی بهدستآمده از افراد گوناگون نشان میدهد.
پروتئینها از زنجیرههای بلند آمینواسیدها تشکیل شدهاند که میتوانند به تعداد زیادی از ساختارهای احتمالی تبدیل شوند. در سالهای اخیر، پیشبینی این ساختارها با استفاده از برنامههای هوش مصنوعی مانند «آلفافولد»(AlphaFold) بسیار آسانتر شده است. بسیاری از این برنامهها مانند «ایاسامفولد»(ESMFold) و «امگافولد»(OmegaFold) مبتنی بر مدلهای زبانی بزرگ هستند که در ابتدا برای تحلیل حجم زیادی از متن توسعه یافتند و به پیشبینی کلمه بعدی در یک دنباله کمک میکنند. همین رویکرد میتواند با یادگیری اینکه کدام ساختارهای پروتئینی احتمالا از الگوهای متفاوت آمینواسید تشکیل میشوند، برای توالیهای پروتئینی کارساز باشد.
این روش همیشه درباره آنتیبادیها به ویژه در بخشی از آنتیبادی که به عنوان ناحیه «بیشمتغیر» شناخته میشود، کارآیی ندارد. آنتیبادیها معمولا ساختار Y شکل دارند و نواحی بیشمتغیر در نوک Y قرار گرفتهاند که در آنجا پروتئینهای بیرونی موسوم به «آنتیژن» را شناسایی میکنند و به آنها متصل میشوند. قسمت پایین Y، پشتیبانی ساختاری را فراهم میآورد و به آنتیبادیها برای تعامل با سلولهای ایمنی کمک میکند.
مناطق بیشمتغیر معمولا حاوی کمتر از ۴۰ آمینواسید هستند. تخمین زده شده است که سیستم ایمنی انسان میتواند با تغییر دادن توالی این آمینواسیدها تا یک کوینتیلیون آنتیبادی متفاوت تولید کند تا اطمینان حاصل شود که بدن میتواند به طیف گستردهای از آنتیژنهای احتمالی پاسخ دهد. این توالیها از نظر تکاملی مانند سایر توالیهای پروتئینی محدود نیستند. بنابراین، یادگیری نحوه پیشبینی دقیق ساختار آنها برای مدلهای زبانی بزرگ دشوار است.
«روهیت سینگ»(Rohit Singh) از پژوهشگران این پروژه گفت: بخشی از دلیل اینکه مدلهای زبانی میتوانند ساختار پروتئین را به خوبی پیشبینی کنند این است که تکامل، این توالیها را به روشهایی محدود میکند که مدل قادر به رمزگشایی معنای آنها باشد. این کار شبیه به یادگیری قواعد دستور زبان با نگاه کردن به کلمات یک جمله است که به شما امکان میدهد تا معنی آن را بفهمید.
پژوهشگران برای مدلسازی نواحی بیشمتغیر، دو ماژول ایجاد کردند که براساس مدلهای زبانی پروتئین موجود ساخته شدهاند. یکی از این ماژولها روی توالیهای بیشمتغیر به دستآمده از ساختار حدود ۳۰۰۰ آنتیبادی موجود در «بانک دادههای پروتئین»(PDB) آموزش داده شد که به آن امکان داد تا یاد بگیرد کدام توالیها به ایجاد ساختارهای مشابه تمایل دارند. ماژول دیگر روی دادههایی آموزش داده شد که حدود ۳۷۰۰ توالی آنتیبادی را با شدت اتصال آنها به سه آنتیژن متفاوت مرتبط میکند.
مدل محاسباتی حاصل که «AbMap» نام گرفت، میتواند ساختار آنتیبادی و قدرت اتصال آن را براساس توالی آمینواسید آنها پیشبینی کند. پژوهشگران برای نشان دادن کارآیی این مدل، از آن برای پیشبینی ساختار آنتیبادیهایی استفاده کردند که به شدت پروتئین کروناویروس را خنثی میکنند.
به گفته پژوهشگران، شناسایی گزینههای خوب در اوایل فرآیند توسعه میتواند به شرکتهای دارویی کمک کند تا از صرف هزینههای زیاد برای آزمایش گزینههایی که ممکن است با شکست مواجه شوند، اجتناب کنند.
این پژوهش در مجله «PNAS» به چاپ رسید.
منبع : ایسنا