מודלי-בסיס (Foundation Models) של IBM ינתחו מאגרי נתונים עצומים של צילומי לוויינים ומידע גיאוגרפי של נאס”א, ויאפשרו חיפוש יעיל ביותר מ-300 אלף מאמרים אקדמיים על כדור הארץ, כדי לסייע בגיבוש תובנות וחשיפת ידע חדש ובעל ערך עבור החוקרים שמתמודדים עם אתגרי האקלים הדחופים ביותר
ענקית המחשוב IBM ומרכז מארשל לטיסות חלל של נאס”א (Marshall Space Flight Center) מכריזים היום על שיתוף פעולה שעיקרו שימוש בטכנולוגיות הבינה המלאכותית של IBM כדי להגיע לתובנות מחקריות חדשות מתוך מאגר הנתונים המדעי והגיאוגרפי העצום של נאס”א. לראשונה ייעשה שימוש במודלי-בסיס (Foundation Models) של IBM שיעבדו וינחתו צילומי לוויין של כדור הארץ שנאספו במשך שנים.
Foundation Models הם מודלים של בינה מלאכותית שאומנו על מאגרי נתונים רחבים מאוד שלא תוייגו, כך שניתן למקד אותם במשימות גיבוש תובנות מסוגים שונים. בחמש השנים האחרונות מודלים שכאלה קידמו במהירות את תחום עיבוד השפה הטבעית (NLP), ו-IBM היא חלוצה עולמית ביישום של מודלים אלה מעבר לשימוש שונים של שפה.
נאס”א מבצעת מזה שנים רבות תצפיות לוויינים על כדור הארץ, כדי לאפשר למדענים לנטר ולחקור את כדור הארץ ותופעות פיזיקליות וגיאוגרפיות שונות. אלא שנוכח גודלו העצום של מאגר הנתונים, נדרשות כעת גישות חדשות וחדשניות לחלץ תובנות ומידע שימושי מתוך הנתונים. לפיכך, מטרת שיתוף הפעולה בין IBM לנאס”א היא לספק דרך יעילה יותר למדענים וחוקרים לנתח ולהפיק תובנות ממאגרי הנתונים הגדולים הללו, ול-Foundation Models של IBM יש את הפוטנציאל להאיץ את ניתוח הנתונים וגילוי של תובנות חדשות על כדור הארץ, ולקדם מהר יותר את ההבנה המדעית של תופעות הקשורות לאקלים.
במסגרת שיתוף הפעולה, IBM ונאס”א מתכננות לפתח מספר טכנולוגיות חדשות כדי לחלץ תובנות מהתצפיות בכדור הארץ. פרויקט אחד יאמן Foundation Model של IBM בתחום הגיאוגרפי על מערך הנתונים Harmonized Landsat Sentinel-2 שמתעד שינויים בקרקע שנצפו על ידי לווינים המקיפים את כדור הארץ, שינויים בטביעת הרגל הגיאוגרפית של תופעות כמו אסונות טבע, תפוקות יבולים מחזוריות ובתי גידול לחיות בר. מדובר במערך נתונים הכולל פטה-בייטים (petabytes) של צילומי לוויין ונתונים נלווים, וטכנולוגיית ה-Foundation Model תסייע לחוקרים לנתח אותו ולספק תובנות קריטיות אודות המערכות הסביבתיות של כדור הארץ.
שיתוף הפעולה צפוי גם להניב יכולת חיפוש בכל מאגר הספרות המדעית אודות כדור הארץ שנאספה על ידי נאס”א. IBM פיתחה מודל עיבוד שפה טבעית (NLP) שהוכשר על כמעט 300 אלף מאמרים אקדמיים העוסקים במדעי כדור הארץ, ויקל על חילוץ ידע חדש בתחום. מדובר באחד ממאגרי המידע הגדולים בעולם, והאימון של המערכת בוצע על גבי פלטפורמת התוכנה OpenShift של חברת Red Hat, בעזרת PrimeQA – פתרון מבוסס שאלות ותשובות רב לשוני ובקוד פתוח. מעבר לשימוש שלו ככלי לחוקרים, מודל השפה החדש ש”יתמחה” במדעי כדור הארץ, יוכל לשמש גם לניהול נתונים מדעיים וניהול תהליכים בנאס”א.
“טכנולוגיית ה- Foundation Modelהוכיחה עצמה כהצלחה בעיבוד שפה טבעית, והגיע הזמן להרחיב אותה לתחומים חדשים החשובים לעסקים ולחברה”, אמר Raghu Ganti, חוקר ראשי ב-IBM. “החלת Foundation Model על נתונים גיאוגרפיים, תהליכים המתפרסים על פני זמן וסוגי נתונים מדעיים נוספים שאינם שפה, יכולה לחשוף תובנות חדשות וידע בעלי ערך עצום לקבוצה רחבה הרבה יותר של חוקרים, עסקים ואזרחים, ולהקל על מספר גדול יותר של אנשים שעובדים על כמה מאתגרי האקלים הדחופים ביותר”.
המשך שיתוף הפעולה בין IBM לנאס”א צפוי לכלול בניית Foundation Model לחיזוי מזג אוויר ואקלים באמצעות MERRA2, מערך נתונים של תצפיות אטמוספריות. שיתוף פעולה זה הוא חלק מיוזמת המדע הפתוח של נאס”א, שהתחייבה לגבש קהילה מדעית שיתופית במהלך העשור הבא.