QorlQ

מיקרו מעבד QorIQ בריבוי עיבודים מתקדם [AMP] של Freescale מציע חלופה ליכולת מחשוב בהתקנים משובצים בביצועים גבוהים ובהספק נמוך

QorlQמאת: Haim Cohen, Freescale Semiconductor Israel Limited.

הטכנולוגיה הידועה בשם AltiVec מאת Freescale Semiconductor, מרחיבה את היכולות של מעבדי מיקרו הבנויים בטכנולוגיה Power Architecture, על ידי כך שהם מספקים עיבוד לשימוש כללי, עיבוד נתונים ועיבוד אותות ספרתיים (DSP) בשבב יחיד.

הטכנולוגיה AltiVec היא המאיץ קלט-יחיד-נתונים-מרובים (SIMD) במעבדי המיקרו בליבת e600 של Freescale, והיא חלק ממפת הדרכים למעבדי התקשורת QorIQ של Freescale. הטכנולוגיה כוללת ליבות ®Power Architecture, מאיצים ואבטחה. הפלטפורמה כוללת מעבדי QorIQ בריבוי עיבודים מתקדם [AMP] מבוססים על טכנולוגיית תהליך של 28 ננו-מטר. השילוב של טכנולוגיית AltiVec עם מעבדי המיקרו QorIQ מאפשר למתכנני המחשוב המשובץ בתחום החלל-תעופה ובתחום הצבאי להשתמש במנוע SIMD בתוך מעבד בעל ריבוי ליבות.

יישומים בתחום חלל-תעופה ובתחום הצבאי זקוקים לביצועי SIMD בעלי נצילות הספק, אך גם לעיבוד אותות מהיר, לעיבוד תמונה מהיר ולביצוע במהירות של פעולות מתמטיות, כמו למשל כפל מטריצות. הדמאה בזמן אמת ועיבוד אותות מאפשרים קבלת החלטות אוטונומית ומספקים במהירות מידע לגבי תמונה ונתונים, למרכזי השליטה.

צפוי שנתח עיקרי של תקציבי בטחון יופנה לתחומים של כלי טייס בלתי מאוישים-כטב”מים

(UAV) ושל כלי רכב קרקעיים בלתי מאוישים-כרב”מים (UGV). מספר החיישנים והנתונים שהם מפיקים גדלים באופן מעריכי מהכטב”מים של הדור הראשון ועד היכן שניתן לראות בעתיד. הצורך בקבלת החלטות זמן אמת באופן אוטונומי בתוך דרישות הגודל, המשקל וצריכת ההספק (SwaP) יציב דרישות שמתעצמות ליכולת עיבוד במערכות עתידיות, וכך הופך את מנוע SIMD למתאים ביותר לביצוע עיבוד וקטורי עבור יישומים אלו.

איור 1: אפשר להקטין את מעטפת צריכת ההספק בעזרת טכנולוגית התהליך המתקדמת ב- 28 ננו–מטר

עיבוד סינכרוני ומעבדי אותות ספרתיים

טכנולוגיית AltiVec מספקת פונקציונליות בדומה למעבדי אותות ספרתיים (DSP) וליחידות עיבוד גרפיות (GPU). בדרך אופיינית, היע”מ (CPU) היה מעביר נתונים אל מעבד DSP או אל יחידת GPU לצורך עיבודם, ובינתיים, ליבת CPU הייתה יכולה להמתין בעצירה (stall) או לעבור הלאה לעיבוד אחר. על אף שזה עיבוד מהיר, אין זה ממש עיבוד זמן אמת. למעבדי DSP יש יכולת רבה יותר מאשר למנוע AltiVec במונחים של יכולת עיבוד מתמטית, אך עם זאת, מעבדי DSP וטכנולוגיית AltiVec מוכוונים לעבר צרכים שונים. ההתנהגות הסינכרונית של מנוע AltiVec בליבה היא המפרידה אותו ממעבדי DSP, במיוחד ביישומי חלל-תעופה וביישומים צבאיים.

יחידות GPU מתוכננות לעבד מצולעים (פוליגונים) ומשולשים שמתאימים ליישומים כגון גרפיקה למשחקי וידיאו, ועם זאת מתכננים של התקני מחשוב משובצים נמשכים ליחידות GPU בשל ביצועי מחשוב-העל שלהם ובגלל היכולת שלהם להציג נתונים בזמן אמת לגבי מצבים בחיים הממשיים.

מנוע AltiVec יכול לספק יכולת מחשוב מהירה כזו, ללא תקורת התוכנה של יחידת GPU. טכנולוגיית AltiVec מספקת כמה מהפונקציות של מעבדים גרפיים ושל מעבדי DSP ללא האסינכרוניות של משלוח הנתונים אל מחוץ לשבב וההמתנה להם, עד שיחזרו. שילוב של ליבה עם מנוע AltiVec ומעבד DSP על אותו שבב, יכול לספק אפשרויות עיבוד מהירות רבות יותר. לדוגמה, יישומי תקשורת משתמשים במעבדי DSP לעיבוד חבילות מפני שהם יכולים לחשב במהירות חישובים מתמטיים – אבל זה יכול להתקיים מחוץ לשבב. אספקת איכות של שירות עבור תעבורת קול ונתונים אינה חשופה לאותן דרישות זמן אמת כמו רבים מבין יישומי החלל-תעופה והיישומים הצבאיים.

ברצף הביצוע הווקטורי בתוך הליבה, יחידת השיגור (dispatch) בוחנת את ההנחיות הנכנסות ושולחת נתונים ליחידת הווקטור. ללא יחידת הווקטור, היה צריך לעבד את הנתונים בנקודה צפה או בסקאלאר. יחידת השלמים (IU) ויחידת הנקודה הצפה (FPU) היו עוצרות בגלל כל המחזורים הנדרשים לביצוע חישובים מתמטיים ברמה גבוהה כזו. יחידת הווקטורים, עם קבוצת האוגרים הגדולה שלה ועם רוחב אפיק הנתונים שלה יכולה לבצע פעולות בכמה קבוצות של נתונים לפי פקודה יחידה. עיבוד סינכרוני זה משחרר את יחידת השלמים ואת יחידת הנקודה הצפה להמשיך בביצוע חישובים סקאלריים וחישובי נקודה צפה מבלי להעמיס עיבוד נוסף על מנוע AltiVec.

יחידת הביצוע הווקטורית של AltiVec פועלת בו זמני עם יחידת המספרים השלמים Power Architecture ועם יחידת הנקודה הצפה. היא מתאפיינת באוגרי וקטור ייעודיים משופרים, נפרדים. אפשר לערבב פעולות במספרים שלמים, פעולות בנקודה צפה ופעולות של AltiVec ללא אובדן ביצועים.

ארכיטקטורה וקטורית מאפשרת עיבוד בו זמני של כמה פריטי נתונים במקביל. הפעולות מבוצעות על כמה יחידות נתונים בפקודה אחת. צורת פעולה זו ידועה בשם “עיבוד מקבילי של נתונים מרובים בפקודה יחידה” (SIMD). בצורת הפעולה הזו, פקודה אחת לא תתרחב על פני כמה ליבות

איור 2: ארכיטקטורת QorIQ בסדרת העיבוד המרובה המתקדם (AMP)

הספק נמוך

טכנולוגיה AltiVec זוכה כבר ביתרונות הנובעים מצריכת הספק נמוכה של מעבדי Power Architecture. למנועי AltiVec במעבדים מרובי ליבות יש יתרון הנובע מטכניקה של חיסכון בהספק הנקראת “ניהול הספקים מדורג (cascading power management)” אשר מכוון משימות ממספר קטן יחסית של ליבות, כך שליבות הנמצאות במצב סרק יכולות להיכנס למצב של הספק מזערי או למצב “רדום”. ניהול הספקים מדורג מפחית את צריכת ההספק במצב של עומסי רשת נמוכים, ולאחר מכן, כאשר העומס ברשת גדל, הוא מאפשר לליבות לחזור במהירות לתפקוד מלא באופן אוטומטי.

לדוגמה, להתקן שכולל 12 ליבות עם 24 ליבות וירטואליות יהיו 12 ליבות פיסיות ו- 12 מנועי AltiVec פיסיים. מתכנני מערכות שמעונינים להשתמש בכל הליבות האלו, יכולים לנצל אותן אם כי בתמורה לעומס ההספק הנלווה. עם זאת, השימוש בשתי ליבות או בארבע ליבות ייעודיות למשימה יכול לשחרר את המעבדים האחרים במארז האמור לצורך ביצוע פקודות בנקודה צפה או פקודות במספרים שלמים.

לוגיקת AltiVec בליבות אחרות אלו תימצא במצב צף נמוך קרוב לאפס, אשר מאפשר שימוש נרחב יותר בהתקני AltiVec בעלי ליבות מרובות, ללא השימוש בהספק עודף.

AltiVec בעיבוד QorIQ AMP

סדרת של מעבדי המיקרו QorIQ AMP של Freescale, שיצאה לשוק לאחרונה, מספקת ביצועים המגיעים לעד פי ארבעה יותר מהביצועים שמקבלים עם ההתקן QorIQ P4080 בעל שמונה הליבות, שהיה ספינת הדגל בדור הקודם של Freescale. סדרת AMP מיועדת לשדרג אל מעבדי מישור הבקרה ומישור הנתונים של הדור הבא את המוצרים, החל ממוצרי ליבה יחידה בהספק נמוך ביותר וכדאיים מבחינת העלות ועד למערכות על שבב בעלות 24 ליבות וירטואליות המיועדות לשימוש ביישומים תעשייתיים ותעופה-חלל או יישומים צבאיים דורשניים של רישות.

מתכנני מערכות בתחום התעופה-חלל ובתחום הצבאי עומדים בפני צורכי ביצועים ודרישות הספק דורשניים  של התקנים ניידים חכמים ושל תעבורת IP הכרוכה בכך. בינתיים רשתות מוכוונות שירות עומדות בפני מורכבות תוכנה שגדלה ובפני דרישה לעיבוד רב יותר לכל חבילה, בזמן שהשימוש במחשוב ענן דורש מהרשתות לטפל ביישומים רבים יותר, וזאת במקביל להתמזגות במעבדי ריבוי ליבות עם עיבוד וירטואלי ומשאבי קלט-פלט. מעבדי סדרת AMP מספקים תערובות מדויקות של ביצועים, צריכת הספק וחוכמת התקנים משובצים מהשורה הראשונה, במטרה לעמוד בפני אתגרים אלו ובפני הצרכים הדורשניים שמעמידים יישומי תעופה-חלל ויישומים צבאיים אחרים, לרבות הרכשת מטרות ותצוגות בתא הטייס, וכן יישומי הדמאת מכ”ם לטווח ארוך בכל תנאי מזג אוויר ובכל הגבהים.

תכונה מרכזית של סדרת AMP של Freescale היא ליבת e6500 בטכנולוגיית Power Architecture ל-64 סיביות ובריבוי תהליכונים, אשר פועלת בתדירות של עד 2.5 ג’יגה-הרץ. e6500, המתאים במיוחד ליישומים של מישור הבקרה ברמה הגבוהה ביותר ושל מישור הנתונים בביצועים גבוהים, יימצא במוצרי סדרת AMP .e6500 משלב גרסה מורחבת של יחידת העיבוד הווקטורית AltiVec בעלת הביצועים הגבוהים שפעולתה הוכחה והיא נמצאת בשימוש נרחב. בהתקן T4240 המנוע AltiVec יכול לספק ביצועים של 240 מיליארד פעולות בנקודה צפה בשנייה (FLOPS) בתוך מצע סיליקון מונוליטי יחיד.

תגובות סגורות