s AI21 משיקה מודל שפה חדש שמשדרג מהותית את הביצועים של ממשקי שפה טבעית מבוססי בינה מלאכותית

AI21 Labs  של פרופ’ אמנון שעשוע שהביאה לעולם את Wordtune משיקה מודל שפה חדש שמשדרג מהותית את הביצועים של ממשקי שפה טבעית מבוססי בינה מלאכותית

  • לראשונה ניתן יהיה לחבר בין מודל שפה למאגרי מידע חיצוניים כדי לקבל מידע עדכני וגם לשלב יכולות הנמקה
  • מודל השפה החדש יאפשר לחשב אחוזים, להתעדכן במזג האויר או שערי המטבעות באמצעות יכולות התממשקות למאגרי מידע עדכניים, מחשבונים מקוונים, או מערכת חיזוי מזג אוויר
  • פרופ’ יואב שוהם, ממייסדי החברה: “כיום, מודלי השפה מתעדכנים אחת לשלוש שנים בממוצע. לכן, מודל שאומן לפני נובמבר 2020, יחשוב שדונלד טראמפ הוא עדיין נשיא ארה”ב ולא יהיה לו מושג שבימים אלה מתחוללת מלחמה באוקראינה. כשל נוסף ומוכר הוא בעיית ההנמקה של המודלים הקיימים, שידעו לענות שעשר פחות שתיים זה שמונה, אבל אם נגלם את השאלה בתוך בעיה מילולית (לרונית היו עשרה תפוחים והיא נתנה שניים ליעל, כמה נשארו לה?) – המחשב ייתקע. המערכת החדשה של AI21, מתקנת את הכשלים הללו”.

חברת הסטארטאפ הישראלית AI21 Labs, מודיעה היום (רביעי) על השקת מערכת חדשה ופורצת דרך בתחום הבינה המלאכותית ומודל שפה. המערכת החדשה מציעה פתרון לכשלים שמנעו את מימוש מלוא הפוטנציאל של יישומים מבוססי בינה מלאכותית ומודל שפה עד כה, באמצעות פיתוח יכולות הנמקה וחיבור למקורות מידע חיצוניים לצורך קבלת מידע עדכני בזמן אמת.

AI21 היא חברת מודל-שפה-כשירות (NLP-as-a-Service), שהשיקה את שירות יצירת ועריכת התוכן  המצליח Wordtune, ואת – Wordtune Read שירות הקריאה המהירה שמאפשר קבלת תקציר של טקסטים ארוכים.

המערכת חדשה פועלת לפי עקרונות ה- MRKL (Modular Reasoning, Knowledge and Language)

ומשלבת את היכולות המתקדמות של מודל השפה עם הנגשה למאגרי מידע עדכניים וקנייניים כמו ויקידטה, יישומי מזג אוויר ואחרים. החיבור בין מודל השפה למאגרי המידע יאפשר לקבל תשובות עדכניות ולא תשובות המתבססות על המידע שהוזן למודל עם יצירתו, והן אינן רלוונטיות יותר.

הבעיה: מודלי שפה לא מעודכנים וחוסר יכולת הנמקה

מודלי השפה עשו בשנים האחרונות קפיצה משמעותית והפכו לטכנולוגיה ישימה המאפשרת ליצור תוכן אוטומטי. אבל, פרויקט אימון מודל שפה עולה מליונים ולוקח כמה חודשים. המידע שנאסף לצורך אימון המודל הינו קבוע ולא מתעדכן.

לדברי פרופ’ יואב שוהם, מיייסד שותף ב- AI21: “כיום, מודלי השפה עדיין לא מצליחים לממש את הפוטנציאל האמיתי שלהם, להוות ממשק שפה טבעית לשימוש כללי שמקבל קלט בשפה טבעית ועונה באופן דומה – בשפה טבעית גם כן. אחת הסיבות לכך היא שפרויקט עדכון מודלי שפה נעשה פעם בשלוש שנים בממוצע. באופן הזה, מודל שאומן לפני נובמבר 2020, עדיין יחשוב שדונלד טרמפ הוא נשיא ארה”ב ולא יהיה לו מושג שבימים אלה מתחוללת מלחמה באוקראינה. כשל נוסף ומוכר הוא ההתמודדות הבעייתית של המודלים הקיימים עם בעיות חשבון מילוליות. המודלים הקיימים ידעו לענות עשר פחות שתיים זה שמונה, אבל אם נגלם את השאלה בתוך בעיה מילולית (לרונית היו עשרה תפוחים והיא נתנה שניים ליעל, כמה נשארו לה?) – המחשב ייתקע. המערכת החדשה של AI21, מאפשרת התממשקות ומתקנת את הכשלים הללו”.

 

שלושת המייסדים מימין לשמאל -אמנון שעשוע, יואב שוהם ואורי גושן. קרדיט צילום: AI21Labs

למה זה ישמש?

בחברה צופים כי ספקטרום השימוש בטכנולוגיה החדשה יהיה רחב ביותר ויכלול יישומים בעולמות הפרסום, פיננסיים, ועוד. בין החברות הראשונות שכבר חתמו עם 21AI על הסכמי שיתוף פעולה לעיצוב שירותים משותפים  לשימוש ביישום הראשון של הטכנולוגיה החדשה, Jurassic-X, ניתן למצוא את  קבוצת פובליסיס ( Publicis Groupe), סוכנות הפרסום והשיווק מהגדולות בעולם, ומו”ל אמריקני מוביל.

למטיבי לכת:

גישת המערכת של MRKL מחברת מודלים של שפה לאלמנטים חיצונים והופכים לתוסף המשפר משמעותית את עבודתם. אלמנטים כמו: מחשבונים מקוונים, ממירי מטבעות או מאגרי מידע חיצוניים ציבוריים וקנייניים המכילים את המידע הרלוונטי לקלט נתון. ל- MRKL סט מודולים הניתן להרחבה ונתב אינטליגנטי שמפעיל כל מודול. מודולים אלה יכולים לכלול מודל שפה עצום, מאומן מראש, למטרות כלליות, מספר מודלים עצביים קטנים יותר, מיוחדים, כמו גם מודולים סימבוליים, כולל כאלה שניגשים למקורות ידע ספציפיים באמצעות קריאות API ציבוריות או קריאות SQL לבסיסי נתונים קנייניים.

ה- MRKL הושק במאמר טכני חדש, והיישום הראשון שלה, Jurassic-X, זמין ב-AI21 Studio, פלטפורמת מפתחים המציעה גישה מיידית למודל Jurassic-1 שבו 178 מיליארד פרמטרים.


 

מערכת ניו-טק מגזינים גרופ

תגובות סגורות