פרס לסקר למחקר רפואי בסיסי השנה הוענק לדמיס האסאביס וג'ון ג'אמפר על תרומתם ליצירת מערכת הבינה המלאכותית אלפאפולד, אשר מנבאת את המבנה התלת-ממדי של חלבונים על סמך רצף מסדר ראשון של חומצות אמינו.
תוצאותיהם פותרות בעיה שהטרידה זמן רב את הקהילה המדעית ופותחות את הדלת להאצת המחקר ברחבי התחום הביו-רפואי. חלבונים ממלאים תפקיד מרכזי בהתפתחות מחלות: במחלת אלצהיימר, הם מתקפלים ומתקבצים יחד; בסרטן, תפקודם הרגולטורי אובד; בהפרעות מטבוליות מולדות, הם מתפקדים באופן לקוי; בסיסטיק פיברוזיס, הם נכנסים למקום הלא נכון בתא. אלה רק חלק מהמנגנונים הרבים הגורמים למחלות. מודלים מפורטים של מבנה חלבונים יכולים לספק תצורות אטומיות, להניע את התכנון או הבחירה של מולקולות בעלות זיקה גבוהה, ולהאיץ את גילוי התרופות.
מבני חלבונים נקבעים בדרך כלל על ידי קריסטלוגרפיה בקרני רנטגן, תהודה מגנטית גרעינית ומיקרוסקופיית קריו-אלקטרונים. שיטות אלו יקרות וגוזלות זמן. כתוצאה מכך, קיימים מסדי נתונים תלת-ממדיים של מבנה חלבונים עם כ-200,000 נתונים מבניים בלבד, בעוד שטכנולוגיית ריצוף DNA ייצרה יותר מ-8 מיליון רצפי חלבונים. בשנות ה-60, אנפינסן ועמיתיו גילו כי רצף חד-ממדי של חומצות אמינו יכול להתקפל באופן ספונטני וחוזר על עצמו לקונפורמציה תלת-ממדית פונקציונלית (איור 1A), וכי "מלווים" מולקולריים יכולים להאיץ ולהקל על תהליך זה. תצפיות אלו מובילות לאתגר בן 60 שנה בביולוגיה מולקולרית: ניבוי המבנה התלת-ממדי של חלבונים מרצף חד-ממדי של חומצות אמינו. עם הצלחת פרויקט הגנום האנושי, יכולתנו להשיג רצפי חומצות אמינו חד-ממדיים השתפרה מאוד, ואתגר זה הפך דחוף אף יותר.
ניבוי מבני חלבונים קשה מכמה סיבות. ראשית, כל המיקומים התלת-ממדיים האפשריים של כל אטום בכל חומצת אמינו דורשים חקירה רבה. שנית, חלבונים עושים שימוש מקסימלי במשלימות במבנה הכימי שלהם כדי לעצב אטומים ביעילות. מכיוון שלחלבונים יש בדרך כלל מאות "תורמים" של קשרי מימן (בדרך כלל חמצן) שצריכים להיות קרובים ל"מקבל" של קשרי מימן (בדרך כלל חנקן קשור למימן), קשה מאוד למצוא קונפורמציות שבהן כמעט כל תורם קרוב למקבל. שלישית, ישנן דוגמאות מוגבלות לאימון שיטות ניסיוניות, ולכן יש צורך להבין את האינטראקציות התלת-ממדיות הפוטנציאליות בין חומצות אמינו על סמך רצפים חד-ממדיים באמצעות מידע על האבולוציה של החלבונים הרלוונטיים.
פיזיקה שימשה לראשונה למידול האינטראקציה של אטומים בחיפוש אחר הקונפורמציה הטובה ביותר, ופותחה שיטה לחיזוי מבנה החלבונים. קרפלוס, לויט וורשלה זכו בפרס נובל לכימיה לשנת 2013 על עבודתם על סימולציה חישובית של חלבונים. עם זאת, שיטות מבוססות פיזיקה הן יקרות מבחינה חישובית ודורשות עיבוד מקורב, ולכן לא ניתן לחזות מבנים תלת-ממדיים מדויקים. גישה "מבוססת ידע" נוספת היא שימוש במאגרי מידע של מבנים ורצפים ידועים כדי לאמן מודלים באמצעות בינה מלאכותית ולמידת מכונה (AI-ML). האסאביס וג'אמפר מיישמים אלמנטים הן של פיזיקה והן של AI-ML, אך החדשנות והקפיצה בביצועים של הגישה נובעות בעיקר מ-AI-ML. שני החוקרים שילבו באופן יצירתי מאגרי מידע ציבוריים גדולים עם משאבי מחשוב ברמה תעשייתית כדי ליצור את AlphaFold.
כיצד אנו יודעים שהם "פתרו" את חידת החיזוי המבני? בשנת 1994 הוקמה תחרות ההערכה הקריטית של חיזוי מבנה (CASP), המתכנסת כל שנתיים כדי לעקוב אחר התקדמות החיזוי המבני. החוקרים ישתפו את הרצף החד-ממדי של החלבון שאת מבנהו פתרו לאחרונה, אך תוצאותיו טרם פורסמו. המנבא מנבא את המבנה התלת-ממדי באמצעות רצף חד-ממדי זה, והמעריך שופט באופן עצמאי את איכות התוצאות החזויות על ידי השוואתן למבנה התלת-ממדי שסופק על ידי הנסיין (שסופק רק למעריך). CASP עורכת סקירות עיוורות אמיתיות ומתעדת קפיצות ביצועים תקופתיות הקשורות לחדשנות מתודולוגית. בכנס CASP ה-14 בשנת 2020, תוצאות החיזוי של AlphaFold הראו קפיצה כה גדולה בביצועים עד שהמארגנים הכריזו כי בעיית חיזוי המבנה התלת-ממדי נפתרה: דיוק רוב החיזויים היה קרוב לזה של מדידות ניסיוניות.
המשמעות הרחבה יותר היא שעבודתם של האסאביס וג'אמפר מדגימה בצורה משכנעת כיצד בינה מלאכותית למידת מכונה (AI-ML) יכולה לשנות את המדע. מחקרם מראה שבינה מלאכותית למידת מכונה יכולה לבנות השערות מדעיות מורכבות ממקורות נתונים מרובים, שמנגנוני קשב (בדומה לאלה שב-ChatGPT) יכולים לגלות תלויות וקורלציות מרכזיות במקורות נתונים, ושבינה מלאכותית למידת מכונה יכולה לשפוט את איכות תוצאות התפוקה שלה באופן עצמאי. בינה מלאכותית למידת מכונה היא למעשה עשיית מדע.
זמן פרסום: 23 בספטמבר 2023




