חדשות היום

מנוע AltiVec של פריסקייל עבור יישומים ביטחוניים ויישומי אוויר/חלל

מאת: Haim Cohen Freescale, Semiconductor Israel. טכנולוגיית AltiVec של פריסקייל מרחיבה את יכולות המיקרו-מעבדים הבנויים על הטכנולוגיה של ארכיטקטורת Power בכך שהיא מספקת ביצועי עיבוד מובילים למטרה כללית, כשבו זמנית היא מתייחסת לעיבוד נתונים בטווח תדרים גבוה ולעיבוד אותות אינטנסיבי ומבוסס אלגוריתם, וכל זאת בפתרון הבנוי משבב יחיד. טכנולוגיית AltiVec, מאיצת ה-SIMD (ביצוע הוראה אחת במספר רב של נתונים) במיקרו-מעבדים שבליבות ה-e600 הנוכחיות, מצאה בית במפת הדרכים של מעבדי התקשורת QorIQ. ארכיטקטורה משולבת זו כוללת ליבות של ארכיטקטורת Power, מאיצים וטכנולוגיית אבטחה. הפלטפורמה כוללת את מעבדי ה-QorIQ AMP (עיבוד מרובב מתקדם) המבוססים על טכנולוגיית ייצור של 28 ננו-מטר. עם התוספת של טכנולוגיית AltiVec למשפחת QorIQ, חברות בתחום הביטחוני ובתחום האוויר/חלל יכולות לנצל את מנועי ה-SIMD במעבד מרובה ליבות.
שווקי הביטחון והאוויר/חלל דורשים ביצועי SIMD בתקציבי כוח משובצים. חברות זקוקות לעיבוד אותות, עיבוד תמונות וביצוע פעולות מתמטיות, כגון הכפלת מטריצות, במהירות גבוהה. מאז שנכללה לראשונה בהתקן MPC7400 ב-1999, טכנולוגיית AltiVec אומצה במהירות ביישומי ביטחון ואוויר/חלל רבים. יישומים אלו דורשים עיבוד אותות דימות בזמן אמת בכדי לאפשר קבלת החלטות אוטונומית, וכדי לספק מידע מבוסס נתונים ותמונה במהירות למרכזי בקרה. דימוי באמצעות ראדאר, תצוגות תא טייס ורכישת מטרות – כל אלו הם תחומים שניצלו היטב את יכולות הטכנולוגיה הזו. התועלת של שילוב טכנולוגיית AltiVec במעבד שליטה הינה משמעותית ביותר בעת שבוני מערכות מתכננים אותן בהתאם לדרישות הגודל, המשקל וצריכת הכוח של יישומים משימתיים.
גם צרכים עתידיים ינצלו את היכולת הזו. חלקים גדולים של תקציבי הביטחון יופנו לטובת כלים אוויריים לא מאוישים (UAVs) מספר החיישנים, והמידע שהם מייצרים, גדל באופן אקספוננציאלי מהמל”טים של הדור הראשון לפיתוחים שעוד נראה בעתיד. הצורך בקבלת החלטות אוטונומית בזמן אמת ברמה גבוהה יותר, במסגרת מגבלת המידות של הפלטפורמות הללו, מעמיד תביעות גבוהות יותר בפני יכולות העיבוד הכוללות של המערכות הללו. מנוע SIMD מתאים היטב לביצוע העיבודים הווקטורים של יישומים אלו.
לעיתים קרובות יש צורך בעיבוד מהיר של המידע בסביבת זמן אמת. המידע נאסף על ידי חיישן, לדוגמה, ששולח אותו אל השבב לצורך עיבוד. המידע של התמונה הגולמית חייב לעבור עיבוד לצורך ביצוע ניתוח מיידי. השבב צריך להבין את הכיוונים ואת החשיבות של המידע המתקבל מהחיישן, ולעבד אותו באופן מובן בכדי שניתן יהיה לקבל את ההחלטות בזמן אמת. יצירת תור נתונים וביצוע עיבוד נוסף גורמים לבזבוז שניות יקרות במצבים בהן הזמן מאוד קריטי.

תרשים 1: דיאגרמת הבלוקים של יחידת הביצוע הווקטורית ב-AltiVec, יחידת הביצוע הווקטורית של AltiVec תזרים הביצוע של ארכיטקטורת Power, זרימת ההוראות שידור: IU, FPU, יחידה ווקטורית, GPRs, FPRs, קובץ רישום ווקטורי, מטמון/זיכרון

תרשים 2: ארכיטקטורה ווקטורית

עיבוד סינכרוני ועיבודי אותות דיגיטליים
טכנולוגיית AltiVec מספקת תפקודיות דמוית GPU ו-DSP באופן סינכרוני. בדרך כלל המעבד הראשי מעביר נתונים למעבד אותות דיגיטליים או לשבב גרפי לצורך העיבוד. בינתיים, ליבת העיבוד הראשית עוצרת או עוברת לבצע תהליך אחר. למרות שמדובר בעיבוד מהיר מאוד, זה עדיין לא עיבוד בזמן אמת. מעבדי אותות דיגיטליים הינם חזקים יותר ממנוע ה-AltiVec במנוחים של עוצמת עיבוד מתמטי; עם זאת, מעבדי אותות דיגיטליים וטכנולוגיית AltiVec מנווטים לצרכים שונים. ההתנהגות הסינכרונית של מנוע ה-AltiVec בליבה היא זו שמבדילה בינו לבין מעבד האותות, במיוחד ביישומי ביטחון ואוויר/חלל.
שבבים גרפיים מתוכננים לצורך עיבוד פוליגונים ומשולשים, ולדוגמה, להציג על המסך את הגרפיקה של משחק ווידאו. חברות רבות רוצות להשתמש בתבניות תוכנה שקיימות עבור שבבים גרפיים בכדי לרתום את הכוח/ביצועים של השבב הגרפי באופן כללי יותר (GPGPU) – לא בכדי להראות קרב עתיר ביצועים נגד מומיה מפלצתית, אלא כדי להציג נתוני זמן אמת אודות מצבים בחיים האמיתיים. מנוע AltiVec יכול לספק את יכולות העיבוד המהירות הללו מבלי תקורת התוכנה של השבב הגרפי. טכנולוגיית AltiVec אינה מתוכננת כתחליף עבור מעבדי אותות דיגיטליים ושבבים גרפיים. בתרחיש השימוש הקלאסי שבב גרפי עדיין מספק מנגנון להצגת תמונה על מסך, בעוד שטכנולוגיית AltiVec אינה מתוכננת לצייר שום דבר על אף מסך כלשהו. ביישומים מסוימים, כגון FFT (התמרת פורייה מהירה), טכנולוגיית AltiVec הראתה שהשילוב בתהליך הבקרה והביצוע בזמן אמת יכולים ליהנות ממעבד אותות דיגיטליים שמוקדש למטרה זו. טכנולוגיית AltiVec מספקת חלק מהפונקציות של שני הבלוקים אבל בלי איבוד הסינכרון שמתרחש בעת שליחת מידע אל מחוץ לשבב וההמתנה לחזרתו.
שילוב ליבה עם מנוע AltiVec ומעבד אותות דיגיטליים באותו שבב יכול לספק אפשרויות עיבוד מהיר. לדוגמה, יישומי טלקום משתמשים במעבדי אותות דיגיטליים לצורך עיבוד חבילות נתונים מכיוון שהם יכולים לספק ביצועים מתמטיים מהירים – אבל זה יכול להתרחש גם מחוץ לשבב. אספקת איכות שירות עבור עומסי נתונים וקול אינה גורמת בפני עצמה לאותן דרישות זמן אמת של יישומי ביטחון ואוויר/חלל רבים.
תרשים 1 מציג את תזרים הביצוע הווקטורי בליבה. יחידת השידור בודקת את ההוראה הנכנסת ושולחת את הנתונים ליחידה הווקטורית. הנתונים צריכים לעבור עיבוד בתוך היחידה הווקטורית בתהליך נקודה צפה או בתהליך סקלרי. יחידת המספר השלם (IU) ויחידת הנקודה הצפה (FPU) יעצרו בגלל כל המחזורים שנדרשים לביצוע המתמטיקה ברמה הגבוהה הזו. היחידה הווקטורית, עם מערך האוגרים ועם רוחב פס הנתונים הגדולים שלה, יכולה לתפעל מספר מערכי נתונים בהוראה יחידה. העיבוד הסינכרוני הזה משחרר את ה-IU ואת ה-FPU להמשך חישובי נקודה צפה וחישובים סקלריים מבלי להעמיס מטען עיבוד נוסף על מנוע ה-AltiVec.
יחידת הביצוע הווקטורי של AltiVec מתואמת עם יחידות המספר השלם והנקודה הצפה של ארכיטקטורת ה-Power. היא מציעה אוגרים וקטוריים מוקדשים, נפרדים ומשופרים. אין כל קנס בגין עירוב פעולות חישוב שלמים, נקודה צפה ו-AltiVec.
ארכיטקטורה ווקטורית מאפשרת את העיבוד הסימולטני של מספר פריטי נתונים במקביל. הפעולות מבוצעות על מספר אלמנטים של נתונים בעזרת הוראה יחידה. תהליך זה נקרא גם עיבוד מקבילי בשיטת ה-SIMD (הוראה אחת עבור מספר אלמנטים של נתונים). תרשים 2 מציג את וקטור A, וקטור B ווקטור C כאופרנדים שהתוצאה שלהם היא בווקטור T. ב-SIMD, הוראה יחידה אינה נמתחת על פני מספר ליבות. לדוגמה, הווקטורים
B, A ו-C נשלחים לליבה אחת, הווקטורים E, D ו-F נשלחים לליבה השנייה, וכך הלאה. כל זה קורה במקביל,בניגוד למצב בו ווקטורים E ,D ו-F מחכים לחזרת הווקטורים B, A ו-C. המטרה היא לעבד עוד ווקטורים באותו הזמן.

אפילו פחות כוח
טכנולוגיית AltiVec כבר נהנית ממעטפת הכוח הנמוכה של מעבדי ארכיטקטורת ה-Power. גם מנועי AltiVec במעבדי מרובי ליבות ייהנו מטכניקת חסכון בכוח חדשנית שנקראת ניהול כוח מדורג (Cascading Power Management). מדובר בטכניקה המבוססת על שילוב של תוכנה עם חומרה שמפנה מטלות למספר קטן יותר של ליבות במטרה לאפשר לליבות שלא מבצעות פעולות להיכנס למצב צריכת כוח מינימלית או מצב “רדום”. הליבות הרדומות יכולות לפעול בצריכת כוח נמוכה עד 80%. ניהול כוח מדורג מוביל לצריכת אנרגיה מופחתת בעומסי רשת נמוכים ואז מאפשר לליבות לחזור באופן אוטומטי ובמהירות לתפקוד מלא כשעומסי הרשת עולים.
התקן 12 ליבות עם 24 ליבות ווירטואליות, לדוגמה, יכיל למעשה 12 ליבות פייזות ו-12 מנועי AltiVec פיזיים. חברה שרוצה להשתמש בכל הליבות הללו בהחלט יכולה לנצל אותן, אבל עם עומס הכוח הבלתי נמנע. עם זאת, אם חברה רוצה להשתמש רק בשתיים או ארבע ליבות שמוקדשות למטלה מסוימת, שאר המעבדים במקרה כזה יוכלו להתפנות להוראות מספרים שלמים ונקודה צפה. הלוגיקה של AltiVec בליבות האחרות הללו תצנח קרוב לאפס, ומכיוון שכך הן לא ישתמשו ביותר כוח מאשר הן זקוקות לו. זה מאפשר אימוץ רחב יותר של התקני AltiVec מרובי ליבות מבלי להשתמש ביותר מדי כוח לצורך הרצת מנוע AltiVec שאינו נדרש לצורך המטלה. חברות יוכלו להשתמש בעיבוד באמצעות מנועי AltiVec בדרך שמיושרת יותר לתרחישי השימוש שלהן. הכללת מנועי AltiVec באותו שבב כמו הליבות תורמת גם למעטפת כוח קטנה יותר מכיוון שאין צורך בשבב נפרד שצורך כוח נוסף.
אפשור
חברות בשוק הביטחוני והאוויר/חלל מאמצות את טכנולוגיית AltiVec ומפתחות תוכנה רבה עבורה. פריסקייל מחויבת להרחיב את העבודה הקיימת הזו ולספק פתרונות ותוכנה שארוזים ומוכנים לשימוש. ייתכן וקשה ללמוד תכנות ומתמטיקה ווקטורית, והמעבר מ-C או C++ לתכנות ווקטורי אינו מהווה מטלה קלה. פריסקייל תקל על המעבר הזה באמצעות שותפויות עם לקוחות בתחום הביטחון והאוויר/חלל ויצרניות תוכנה במטרה לספק אפשור. הספריות והמהדר שפותחו בידי פריסקייל כוללים ספריות פנימיות בסיסיות עם שפת מכונה לצורך קישור ליישומי לקוחות; ספריות אלגוריתמים ליישומים ספציפיים; ו-GCC (אוסף מהדרי GNU) שמאפשר לטכנולוגיית AltiVec לתמוך בהידור יעיל יותר. ההשקעות של פריסקייל והתמיכה הטכנית עבור חברות OEM וסטנדרטים פתוחים כוללות תוכנה עם תמיכה בריבוי ליבות, שיפור הגישה של השוק לספריות, תמיכה הנדסית וטכנולוגיה עבור ספקיות מערכות הפעלה בזמן אמת (RTOS) וכן תמיכה טכנית בפיתוח ספריות עבור יצרניות OEM וסטנדרטים תעשייתיים. פריסקייל תומכת בטכנולוגיית AltiVec גם באמצעות קהילת משתמשים מקוונת.
יישום טכנולוגיית AltiVec במעבדי QorIQ AMP (עיבוד מרובב מתקדם)
סדרת QorIQ AMP, הידועה בזכות חותמת האיכות של השילוב האינטליגנטי של פריסקייל, מספקת ביצועים ברמה של עד פי ארבע לעומת התקן הדגל QorIQ P4080 בעל שמונה הליבות שהיה ספינת הדגל של הדור הקודם. סדרת QorIQ AMP מניחה את היסודות למערך רחב של מעבדי הדור הבא במישור השליטה והנתונים, עם יכולת התאמה לצרכים – החל במוצרי ליבה אחת עם צריכת כוח מאוד נמוכה ותמורה גבוהה, ועד מערכות על שבב מתקדמות שמתגאות ב-24 ליבות ווירטואליות ומיועדות ליישומי הרשת, התעשייה, הביטחון והאוויר/חלל התובעניים ביותר.
שווקי הביטחון והאוויר/חלל מתמודדים עם הצורך בביצועי עיבוד ודרישות שימוש בכוח תובעניים באופן קיצוני, שהם התוצאה של ההתפוצצות הגלובלית בתחום ההתקנים הניידים החכמים ותנועת ה-IP המשויכת לכך. בינתיים, רשתות מוכוונות שירותים צריכות להתמודד עם המורכבות ההולכת וגדלה של התוכנה ובדרישות לעיבוד רב יותר עבור כל חבילת נתונים, בזמן שאימוץ מחשוב הענן דורש מרשתות לטפל ביותר יישומים שמתכנסים במעבדים מרובי-ליבות עם עיבוד ווירטואלי ומשאבי קלט/פלט. מעבדי סדרת QorIQ AMP מספקים את התערובת המדויקת של ביצועים, צריכת כוח ואינטליגנציה משובצת עדכנית בכדי לעזור להתייחס לאתגרים הללו, וכן בדרישות התובעניות של יישומי ביטחון ואוויר/חלל אחרים, כולל רכישת מטרות ותצוגות תא טייס, וכן דימוי ראדאר לטווח רחוק עבור כל מזג אוויר וכל רום.

טכנולוגיית AltiVec בליבת e6500
אחד הדברים המרכזיים בסדרת QorIQ AMP של פריסקייל היא ליבת ה-e6500 של ארכיטקטורת 64 הסיביות וריבוי הנימים של Power שעובדת במהירות של עד 2.5 גה”ץ. ליבת ה-e6500 אידיאלית לשימוש במישור הבקרה וגם למישור המידע בביצועים גבוהים וכן עבור יישומי עיבוד אותות, והיא תאכלס את כל מוצרי סדרת QorIQ AMP. ה-e6500 משלב גרסה משופרת של יחידת העיבוד הווקטורי AltiVec המוכחת ועתירת הביצועים שזכתה לאימוץ נרחב. בהתקן T4240, מנוע ה-AltiVec יכול לספק ביצועים בקצב של 192 ג’יגה-פלופס במצע סיליקון מונוליטי יחיד.

מסקנה
דרישות העיבוד בשווקי הביטחון והאוויר/חלל גדלים באופן מעריכי בזמן שמערכות דורשות יותר נתונים ויותר מידע בכדי לקבל החלטות אינטליגנטיות. מצב זה הוא המנוע ליותר עיבוד אוטונומי בזמן אמת, וזה מה שמספק מנוע ה-AltiVec בסדרת QorIQ AMP. טכנולוגיית AltiVec מספקת כעת רמות חסרות תקדים של ביצועים בתוך מגבלות המידות והתנאים של יישומים קריטיים במאה ה-21.

תגובות סגורות