הפעלת אשכולות מעבדי בינה מלאכותית הספק אנכי מאפשר הספקת עד 100kA של זרם ומתח ליבה מרובת מסילות

ההשקה האחרונה של מחשבי-על מבוססי מעבדי AI ASIC באשכולות חדשים מרחיבה את גבולות רשתות אספקת החשמל לרמות שלא היינו מדמיינים אך לפני מספר שנים. עם רמות הזרם שמתקרבות ל-100 קילואמפר/אשכול ASIC, נדרשת חדשנות בארכיטקטורות של מערכות חשמל, טופולוגיות, מערכות בקרה ומארזים כדי לספק זרמים כה גבוהים. בגלל רמות ההספק המתגברות, אספקת חשמל של 48V היא חיונית. יתר על כן, אשכולות מעבדים ארוזים היטב מגבילים את ההיתכנות של אספקת חשמל רוחבית, מה שהופך גישה חדשה להכרחית.

Vicor 48V ישיר לעומס (<1V) Factorized Power Architecture (FPA™) היא סטייה משמעותית מארכיטקטורת פס הביניים 48V (IBA) המורכבת מממיר אפיק ביניים ואחריו ווסתי PoL רב-פאזיים. FPA נותן מענה ייחודי לכל אחד מאתגרי אספקת החשמל העומדים בפני אשכולות מערכות מעבדים עם פתרונות חדשניים ומאפשר גם אספקת חשמל אנכית (VPD), שהינו חיוני כדי לספק זרמים גבוהים למערכות כאלה.

אתגרי אשכולות אספקת חשמל מקובצים

אשכולות ASIC ארוזים היטב במטרה להשיג את רוחב הפס המהיר הנדרש כדי להשיג את הטרפלופים של ביצועי העיבוד הנדרשים לעומסי עבודה של אימון בינה מלאכותית כגון נהיגה אוטונומית. לכל מעבד באשכול עשויים להיות נחוצים 600 עד 1000 אמפר, דבר שאפילו עבור כרטיסי מאיץ של מעבד בודד מהווה אתגר לאספקת חשמל עם הפסדי עכבה של PCB או מצע משמעותיים אם מיקום ה-VR אינו קרוב פיזית לפיני הכוח של המעבד.

בנוסף, ההתקדמות המהירה בבינה מלאכותית (AI) מתאפשרת על ידי GPUs ומעבדי AI יעודיים המשתמשים בצמתי תהליכי סיליקון במהירות 7nm, 5nm ובקרוב, 3nm. מתחי תפעול הליבה הנומינליים בצמתי תהליך אלו הם כיום בין 0.75 ל-0.85V. כדי לעמוד בעומסי העבודה שדורשת בינה מלאכותית, ה-GPU והמעבדים מורכבים על כרטיסי האצה אשר מקובצים לאשכולות לאחר מכן לתוך מערכת של RACK שרת עם 4, או 8 כרטיסים לכל RACK עבור מרכזי נתונים ומחשבים בעלי ביצועים גבוהים. עם זאת, ההקדמות האחרונות של Cerebras ו-Tesla הציגו גישה חלופית של קיבוץ ה-AI ASICs עצמם, המאפשרת מחשבי-על מהירים במיוחד, בצפיפות גבוהה, אך מציגה אתגרי אספקת חשמל וניהול/קירור תרמי משמעותיים נוספים.

עבור אספקת חשמל, אשכול ה-ASIC/GPU לא משאיר מקום לאספקת כוח רוחבי כמו בכרטיסי AI עם מעבד יחיד או כפול, והקלט/פלט המהיר המשמש רגיש במיוחד לרעש מיתוג קשה של זרם גבוה, כפי שקיים עם מיתוג קשה של ווסתי באק רב-פאזיים. העברת ה-VR הרב-פאזי במיתוג קשה קרוב עוד יותר למעבד מביאה עימה גם את רעש המשויך ל-VR, מה שמגביר עוד יותר את אתגר המספר של תכנון PDN מספיק ל-I/O רגיש לרעש. בערך תכנון טיפוסי של 40 – 60A/פאזה, מספר הפאזות הבדידות הנדרשות לאספקת זרמי שיא גבוהים (>1500A לכל ליבה במקרים רבים) יכול בקלות לעלות על 30 פאזות לכל AI ASIC או GPU, מספר שקשה, אם לא בלתי אפשרי, להשיג עם אספקת כוח רוחבית.

כוח מחולק פותח רמות חדשות של אספקת זרם

ארכיטקטורת כוח מחולק מבוסס על העיקרון הבסיסי של חלוקת ממיר הספק לשתי פונקציות ראשוניות, אופטימיזציה של כל אחת מהן בנפרד ולאחר מכן יישום פונקציות אלו כמערכת. שתי הפונקציות הן ויסות והכפלת זרם.

תקנה

היעילות של הווסת עומדת ביחס הפוך לעבודה שבוצעה – ככל שעבודה רבה יותר, כך היעילות נמוכה יותר. ככל שמתחי הכניסה והיציאה של הווסת קרובים יותר זה לזה; מבוצעת פחות עבודה ומושגת יעילות גבוהה יותר. מתוקף מיקומו במערכת, ה-FPA ממזער את הפרש מתח קלט-פלט של הווסת. ווסת ה-PRM™ מיושם באמצעות טופולוגיית מיתוג מתח אפס (ZVS), הכוללת יעילות גבוהה כאשר הפרש מתח הכניסה והיציאה קטן. ZVS מפחית מאוד את הפסדי המיתוג, מאפשר הפעלה בתדר גבוה ומצמצם מאוד את מימדי הממיר. ה-PRM מווסת בדרך כלל כניסה בין 40 ל-60V למתח מוצא בין 30 ל-50V.

מיתוג רך והכפלת זרם

אחרי ה-PRM מגיע שלב שני המבצע פונקציית הורדת מתח במדרגות והעלאה מדורגת בזרם. דבר זה מיושם באמצעות הטופולוגיה של ממיר אמפלידודת הסינוס (SAC™) במכשיר הנקרא VTM™ Current Multiplier. ניתן לממש את ההתנהגות של ה-VTM כשנאי אידיאלי, כאשר מתח הקלט והפלט קשורים ביחס קבוע ועכבת המכשיר נשארת נמוכה (מאות µΩ) מעבר ל-1MHz.

מכיוון שאין אחסון אנרגיה ב-VTM, הוא יכול לספק כמויות גדולות של מתח אם הוא מקורר מספיק. זה מאפשר להתאים את יכולת ההספק של ה-VTM ליכולת התרמית של המעבד.

טופולוגיית SAC משתמשת במערכת בקרת מיתוג מתח אפס וזרם אפס, ומפחיתה עוד יותר את רעשי המיתוג ואיבודי הספק.

איור 1: PRM™ ו-VTM™ הם אבני הבניין של FPA. PRMs נבחרים על סמך טווח מתח הכניסה של המערכת ודרישות ההספק; VTMs נבחרים על סמך טווח מתח היציאה ודרישות הזרם. ניתן להרכיב את ה-PRM בכל מקום במערכת היכן שנוח; ה-VTM צריך להיות מותקן קרוב ככל האפשר לליבת המעבד.

ביחד, ה-PRM וה-VTM מהווים את אבני הבניין של FPA. האחד מוקדש לוויסות והשני מוקדש להיות שנאי והכפלת זרם.

חבילת SM-ChiP מפחיתה רעש ומשפרת התנהגות תרמית

בעוד שהטופולוגיה והארכיטקטורה המשמשים להטמעת ווסת בעל ביצועים גבוהים חשובות, חשובה לא פחות טכנולוגיית האריזה. חבילת Vicor SM-ChiP™ משלבת הכל – פסיביים, מגנטים, FETs ובקרה – לתוך התקן אחד. יתר על כן, חבילה זו תוכננה כדי לאפשר את החילוץ היעיל ביותר של זרם בעכבה התרמית הנמוכה ביותר כדי להקל על הקירור. SM-ChiPs רבים כוללים גם סיכוך מתכת מוארק על פני שטח משמעותי של המכשיר. דבר זה משמש לא רק כדי להקל על הקירור, אלא גם כדי לאתר זרמים טפיליים בתדר גבוה כדי למנוע מהם להתפשט מחוץ למכשיר.

אספקת חשמל אנכית חותכת את הפסדי PDN ב-95%

אספקת מתח לרוחב עבור מערכי מעבדים באשכולות היא כמעט בלתי אפשרית עם מערכים גדולים. הפתרון הטוב יותר לאספקת מתח באשכול מעבדים הוא אספקת מתח אנכי (VPD). ב-VPD, מכפיל הזרם ממוקם ישירות מתחת למעבד בצד הנגדי של הלוח, מה שמפחית משמעותית את הפסדי PDN על ידי הקטנת המרחק שהזרם עובר דרך לוח האם. VPD זקוק לשתי תכונות מפתח כדי להשיג פונקציה זו.

איור 2: אספקת מתח אנכית (VPD) עם GTM™ Geared Current Multiplier ממוקם מתחת למעבד וממקסם את ביצועי אספקת המתח. פתרון ה-VPD גם מקל על הצד העליון של המעבד עבור אפשרויות הכוללות ניתוב I/O גבוה יותר, זיכרון מובנה או אשכולות הדוקים יותר של מעבדים.

ראשית, האזור שמתחת למעבד מכיל קבלים בתדר גבוה הנחוצים כדי לנתק זרמים בתדר גבוה מאוד (>10MHz) משאר המערכת. שנית, ליעילות מירבית, המיקום הפיזי והתבנית של הזרם היוצא מפתרון ה-VPD חייבים לשקף בדיוק את המיקום והתבנית של כניסות המתח של ליבת המעבד. זה מאפשר לזרימת הזרם הגבוה להשיג פרופיל “אנכי” אמיתי.

כדי להשיג את התכונות הללו, פתרון Vicor VPD הוא מודול משולב המורכב משלוש שכבות: מערך VTM™ Current Multiplier המיושם עם תיבת הילוכים למטה ווסת PRM™ המותקן מעל כדי לספק פתרון מווסת לחלוטין של 48V לעומס עבור כל מעבד שהינו ™DCM. תיבת ההילוכים מבצעת שתי פונקציות: היא משלבת קיבול ניתוק בתדר גבוה ומפיצה מחדש את הזרם מה-VTM לתבנית המשקפת את המעבד שמעליה. גודל מערך ה-VTM מבוסס על דרישת זרם היציאה של המעבד וגודל ה- PRM מבוסס על דרישת ההספק. אם ה-GPU או ASIC דורשים מסילות חשמל מרובות, ניתן ליישם את שכבות ה-VTM וה-PRM עם PRMs ו-VTMs עצמאיים בגודל המתאים לעמוד בדרישות הזרם והמתח עבור כל מסילה ספציפית.

איור 3: ה-Vicor DCM™ הוא פתרון VPD שלם של 48V לעומס בחבילה מתקדמת אחת עבור אשכולות ASIC. שכבות ה-PRM™, VTM™ ותיבת ההילוכים של המודול מספקות ויסות, הכפלת זרם, קיבול ניתוק והתאמה של דריסת רגל בין פין לפין.

ארכיטקטורת Vicor FPA™, מערכת בקרת ZVS ו-ZCS, טופולוגיית מכפיל זרם SAC™ בתדר גבוה וטכנולוגיית אריזה SM-ChiP™ מספקות את כל המרכיבים לייצור VPD מושלם. דבר זה פותר את אתגר אספקת מתח באשכולות בעלי רעש נמוך, תוך הקלה על התכן המכני של הקירור והניהול התרמי ביעילות גבוהה וחבילת מודול מתח תרמי מותאם. פתרון ה-VPD הוא באמת מאפשר אמיתי למערכות בינה מלאכותית בעלות ביצועים גבוהים יותר בכך שהוא מאפשר ניתוח נתונים מסיבי במהירות גבוהה דרך האשכול כדי לשכלל מודלים של אימון ולקדם למידת מכונה לרמות גבוהות משמעותית.

דרך טובה יותר לכוח מחשוב בעל ביצועים גבוהים

AI ולמידת מכונה נמצאים בחיתולי הצמיחה שלהם.  רכבת זו רק תתפוס תאוצה ככל שיעברו השנים.  האצה זו תדרוש עיבוד מהיר יותר עבור פתרונות מורכבים יותר.  מחשבי-על מבוססי מעבדי AI ASIC ידרשו יותר מתח ממה שביכולתם של שיטות קונבנציונליות לספק.  גישה חדשה וחדשנית לאספקת חשמל היא הדרך היחידה שבה ההבטחה של AI יכולה להתממש.  דבר זה ידרוש ארכיטקטורות של מערכת חשמל, טופולוגיות, מערכות בקרה ואריזות הפועלות בהרמוניה כדי לספק זרמים גבוהים ההולכים וגדלים.  אספקת כוח אנכית, תוך מינוף ההכפלה הנוכחית, היא הפתרון הנבחר.  זוהי גישה מוכחת העונה על הדרישות למחשוב ביצועים גבוהים כיום ויכולה להתאים בקלות כדי לעמוד בקצב הצרכים העתידיים.  הוא קומפקטי, יעיל ויכול להפחית את הפסדי PDN בעד ל-50%.


פול יימן, מנהל הנדסת יישומים, Vicor Corporation

תגובות סגורות