تم منح جائزة لاسكر للأبحاث الطبية الأساسية لهذا العام إلى ديميس هاسابيس وجون جامبر لمساهمتهما في إنشاء نظام الذكاء الاصطناعي AlphaFold الذي يتنبأ بالبنية ثلاثية الأبعاد للبروتينات بناءً على التسلسل من الدرجة الأولى للأحماض الأمينية.
تحل نتائجهم مشكلةً لطالما أزعجت المجتمع العلمي، وتفتح الباب أمام تسريع وتيرة البحث في مجال الطب الحيوي. تلعب البروتينات دورًا محوريًا في تطور الأمراض: ففي مرض الزهايمر، تتجمع البروتينات وتتشابك؛ وفي السرطان، تفقد وظيفتها التنظيمية؛ وفي الاضطرابات الأيضية الخلقية، تكون مختلة؛ وفي التليف الكيسي، تدخل البروتينات إلى مكان خاطئ في الخلية. هذه ليست سوى أمثلة قليلة على الآليات العديدة التي تسبب المرض. يمكن لنماذج بنية البروتين التفصيلية أن توفر تكوينات ذرية، وأن تُسهم في تصميم أو اختيار جزيئات عالية الألفة، وأن تُسرّع اكتشاف الأدوية.
تُحدَّد هياكل البروتينات عمومًا باستخدام علم البلورات بالأشعة السينية، والرنين المغناطيسي النووي، والمجهر الإلكتروني بالتبريد. هذه الطرق مكلفة وتستغرق وقتًا طويلًا. وينتج عن ذلك وجود قواعد بيانات ثلاثية الأبعاد لهياكل البروتينات تحتوي على حوالي 200,000 بيانات هيكلية فقط، بينما أنتجت تقنية تسلسل الحمض النووي أكثر من 8 ملايين تسلسل بروتيني. في ستينيات القرن الماضي، اكتشف أنفينسن وآخرون أن تسلسل الأحماض الأمينية أحادي البعد يمكن أن ينطوي تلقائيًا وبشكل متكرر إلى تكوين وظيفي ثلاثي الأبعاد (الشكل 1أ)، وأن "المرافقات" الجزيئية يمكن أن تُسرِّع وتُسهِّل هذه العملية. تُؤدي هذه الملاحظات إلى تحدٍّ استمر 60 عامًا في علم الأحياء الجزيئي: التنبؤ بالبنية ثلاثية الأبعاد للبروتينات من تسلسل الأحماض الأمينية أحادي البعد. مع نجاح مشروع الجينوم البشري، تحسنت قدرتنا على الحصول على تسلسلات الأحماض الأمينية أحادية البعد بشكل كبير، وأصبح هذا التحدي أكثر إلحاحًا.
يصعب التنبؤ ببنية البروتينات لعدة أسباب. أولًا، تتطلب جميع المواضع الثلاثية الأبعاد المحتملة لكل ذرة في كل حمض أميني الكثير من البحث. ثانيًا، تُوظّف البروتينات التكاملية في بنيتها الكيميائية إلى أقصى حد لتكوين الذرات بكفاءة. ولأن البروتينات عادةً ما تحتوي على مئات من "الجسيمات المانحة" للروابط الهيدروجينية (عادةً الأكسجين) التي يجب أن تكون قريبة من "المستقبل" للرابطة الهيدروجينية (عادةً النيتروجين المرتبط بالهيدروجين)، فقد يكون من الصعب جدًا إيجاد تكوينات يكون فيها كل جسيم مانح تقريبًا قريبًا من المستقبل. ثالثًا، قلة الأمثلة المتاحة لتدريب الأساليب التجريبية، لذا من الضروري فهم التفاعلات الثلاثية الأبعاد المحتملة بين الأحماض الأمينية بناءً على تسلسلات أحادية البعد باستخدام معلومات حول تطور البروتينات ذات الصلة.
استُخدمت الفيزياء لأول مرة لنمذجة تفاعل الذرات بحثًا عن أفضل تكوين، وطُوّرت طريقة للتنبؤ ببنية البروتينات. مُنح كاربلس وليفيت ووارشيل جائزة نوبل في الكيمياء لعام 2013 لعملهم في المحاكاة الحاسوبية للبروتينات. ومع ذلك، فإن الطرق القائمة على الفيزياء مكلفة حسابيًا وتتطلب معالجة تقريبية، لذا لا يمكن التنبؤ بالهياكل ثلاثية الأبعاد الدقيقة. ومن الأساليب الأخرى "القائم على المعرفة" استخدام قواعد بيانات للهياكل والتسلسلات المعروفة لتدريب النماذج من خلال الذكاء الاصطناعي والتعلم الآلي (AI-ML). يطبق هاسابيس وجامبر عناصر من الفيزياء والذكاء الاصطناعي والتعلم الآلي، إلا أن الابتكار والقفزة النوعية في أداء هذا النهج تنبع في المقام الأول من الذكاء الاصطناعي والتعلم الآلي. وقد جمع الباحثان بشكل مبتكر قواعد بيانات عامة كبيرة مع موارد حوسبة صناعية لإنشاء AlphaFold.
كيف نعرف أنهم "حلوا" لغز التنبؤ الهيكلي؟ في عام 1994، تم إنشاء مسابقة التقييم النقدي للتنبؤ بالهيكل (CASP)، والتي تجتمع كل عامين لتتبع تقدم التنبؤ الهيكلي. سيشارك الباحثون تسلسل أحادي البعد للبروتين الذي حلوا بنيته مؤخرًا، ولكن لم يتم نشر نتائجه بعد. يتنبأ المتنبئ بالهيكل ثلاثي الأبعاد باستخدام هذا التسلسل أحادي البعد، ويحكم المُقيِّم بشكل مستقل على جودة النتائج المتوقعة من خلال مقارنتها بالهيكل ثلاثي الأبعاد الذي قدمه التجريبي (المقدم للمُقيِّم فقط). تُجري CASP مراجعات عمياء حقيقية وتسجل قفزات دورية في الأداء مرتبطة بالابتكار المنهجي. في مؤتمر CASP الرابع عشر في عام 2020، أظهرت نتائج تنبؤ AlphaFold قفزة كبيرة في الأداء لدرجة أن المنظمين أعلنوا أن مشكلة التنبؤ بالهيكل ثلاثي الأبعاد قد تم حلها: كانت دقة معظم التنبؤات قريبة من دقة القياسات التجريبية.
تكمن الأهمية الأوسع في أن عمل هاسابيس وجامبر يُظهر بوضوح كيف يُمكن للذكاء الاصطناعي والتعلم الآلي إحداث نقلة نوعية في العلوم. يُظهر بحثه أن الذكاء الاصطناعي والتعلم الآلي يُمكنهما بناء فرضيات علمية مُعقدة من مصادر بيانات مُتعددة، وأن آليات الانتباه (المُشابهة لتلك الموجودة في ChatGPT) يُمكنها اكتشاف التبعيات والارتباطات الرئيسية في مصادر البيانات، وأن الذكاء الاصطناعي والتعلم الآلي يُمكنه تقييم جودة نتائجه ذاتيًا. الذكاء الاصطناعي والتعلم الآلي هو في جوهره علمٌ قائمٌ على المعرفة.
وقت النشر: ٢٣ سبتمبر ٢٠٢٣




