חדשות היום

האם האחסון שובר את חוק מור?

ערכות אחסון מסורתיות, דוגמת הכוננים המגנטיים (המכונים ‘הארד דיסק’), תאמו את התיאוריה של מור בכל הקשור לנפח, אך במקרים מסוימים הביצועים האטו ככל שהנפח גדל. במהלך השנים נוצר פער בין החידושים וההתקדמות של המעבדים והזיכרון, לעומת יכולות האחסון להתמודד איתם. אבל, לא לדאוג. גם לכך יש פתרון.

חוק מור מניע כל יום את החדשנות שאנו לוקחים כמובנת מאליה – מסמארטפונים, דרך האינטרנט ועד הביג דאטה. לאלו שלא מכירים מהו חוק מור, הוא נוסח על ידי גורדון א. מור, ממייסדי אינטל, במסמך שכתב בשנת 1965, לפיו לאורך ההיסטוריה של חומרת המחשוב צפיפות הטרנזיסטורים במעגלים משולבים מכפיל עצמו כל שנתיים לערך. החוק מוסיף ומנבא כי קצב הגידול הנ”ל ימשיך בעתיד. 50 שנה אחר כך, מדהים לראות איך ה”חוק” ממשיך להתקיים בתחום ביצועי המעבדים וזיכרון המחשב, הממשיכים לקטון על מנת להתאים לסביבה רעבת הנתונים של ימינו. (אפילו מור עצמו חשב שהתיאוריה שלו תחזיק מעמד לעשר שנים בלבד).
עם זאת, כשמדובר באחסון – חוליה חשובה לא פחות בשרשרת – התעשייה מוצאת עצמה במבוי סתום. מערכות אחסון מסורתיות, דוגמת הכוננים המגנטיים (המכונים ‘הארד דיסק’), תאמו את התיאוריה של מור בכל הקשור לנפח, אך במקרים מסוימים הביצועים האטו ככל שהנפח גדל. ההארד דיסק הראשון של ה-15K RPM יצא לשוק לפני יותר מעשר שנים, אך עדיין לא ראינו בשוק את כונני ה-30K או אפילו 20K. הסיבה לכך היא המגבלות המכניות שמונעות מהדיסק הקשיח להשיג תוצאות סיבוב מהירות יותר.
במהלך השנים נוצר פער בין החידושים וההתקדמות של המעבדים והזיכרון, לעומת יכולות האחסון להתמודד איתם. בעוד המעבדים, הזיכרון והרשתות המשיכו לצמוח לפי התיאוריה של מור והכפילו את הביצועים כל שנתיים לערך, ביצועי הכונן הקשיח מפגרים לעומת נבואת מור. ספקי שרתים ואחסון משקיעים כיום רבות בבקרים שמשתמשים במעבדים, DRAM ובטכנולוגיות אחרות, על מנת להיחלץ ממלכוד צוואר הבקבוק של הכונן הקשיח, אך אלו יכולים לעזור רק במקצת.
במהלך הזמן, ההבדלים בביצועים מביאים עימם חוסר יעילות, המחייבת כתיבה מחדש של אפליקציות על מנת להבטיח שימוש מאוזן של המערכת. אולם זיכרון הפלאש מאפשר פתרון פשוט הרבה יותר.

איך התקדמנו
בואו נראה כמה התקדמנו מאז ש-Hadoop נכנס לתמונה. Hadoop הוא פרויקט הקוד הפתוח של קרן התוכנה אפאצ’י המגדיר מסגרת תוכנה ליישום מבוזר המעבד כמויות גדולות של נתונים ומאפשר עבודה של אלפי יחידות עיבוד המטפלות בו זמנית במידע בהיקף של פטהבייטס. העבודה היא על קבצים גדולים המבוזרים על פני אשכולות מחשבים תוך שימוש במודל תכנות פשוט. בשנת 2006 כש-Hadoop נכנס לראשונה לשימוש, לשרת U2 טיפוסי היה מעבד שתי ליבות במהירות 3.8GHz עם שתי יציאות Gigabit Ethernet של 1 גיגה ומקסימום של 8GB DRAM. כיום, שרת ה-2U הטיפוסי הוא בעל מעבד של 12 ליבות(!), המציע ביצועים ברמה של פי 6 ו-32GB DRAM שהוא פי 4 יותר מהיר. הרשת עצמה עברה שיפור משמעותי עם מהירות גבוהה פי 10 המציעה דרך dual 10GbE תקן מתאם לרשת.
החלק היחיד במערכת הזו שלא התקדם מהר כל כך הוא הכוננים הקשיחים. נכון, הם דחוסים יותר, מציעים יותר נפח, אך בלי שינוי משמעותי בביצועי ה-random IO – נתון שיצר עיוות מאז ש-Hadoop הושק, כשהוא מעביר את צוואר הבקבוק אל מערכי האחסון.

מהנדסים נגד צוואר הבקבוק
ישנן שתי גישות אפשריות להתמודדות עם האתגרים בדטה סנטרס: לחבר כמות אדירה של מערכי HDD על מנת להשיג את ה-IOPS הרצוי (input/output operation per second), או להנדס מחדש אפליקציות, על מנת שיתאימו למגבלות חומרת האחסון (כולל להאט אותן!).
בואו ניקח את ה-Hadoop כדוגמה. Hadoop עוצב על מנת לאזן CPU, זיכרון, רשתות ואחסון, כך שמנהלי IT יוכלו להשתמש במספר שרתים בעלות נמוכה כאלטרנטיבה לקניית מחשב מיינפרם יקר מאוד. בשטח, ככל שהרעב בתעשייה לנתונים הולך וגדל, מתברר כי הגישות המסורתיות לא יכולות להוות פתרון בלי לגדול לממדים לא ריאליים. נדרשת גישה חדשה לאחסון אם אנו רוצים לייצב מחדש את הדטה סנטר, ולהקל על העומס בצוואר הבקבוק שנוצר באחסון.

החדשות הטובות
החדשות הטובות הן שכונני ה-SSD מאפשרים לאחסון ליישר קו עם חוק מור. אם נסתכל על התקדמות כונני ה-SSD בתחום האנטרפרייז בשנים האחרונות, נראה שהן הביצועים והן הנפח עוקבים אחר עקומת ההתפתחות שמור קבע. כך לדוגמה, רק לפני שלוש שנים התפוקה הממוצעת של ה-SSD הייתה בערך 250MB בשניה והנפח הגיע לכ-512GB. כיום, סאנדיסק מספקת לשוק האנטרפרייז SAS SSD שיכול להגיע ל-1,000MB בשניה של העברת נתונים, ונפח של עד 4TB, בכונן סטנדרטי של 2.5 אינץ’. וזה עוד לא הסוף. אנו נמשיך לראות גידול ביכולות ובביצועים, ונפחים גדולים יותר ככל שהליטוגרפיה של הפלאש תמשיך להיות קטנה יותר, ובמקביל אנו רואים את הכניסה של ה-3D NAND ופיתוחים נוספים שבאופק.
טבלה 1 מציגה את הפער הדרמטי בין ביצועי ה-HDD, שנשארו כמעט סטטיים לאורך השנים, לבין ביצועי ה-SSD לרבות בתחום ה-random read/write. ביצועי
ה-HDD השתפרו בכ-13% בלבד, בעוד ביצועי SSD השתפרו ב-400%-500%! ואנו לא מאטים.
כונני ה-HDD אכן מפרים את חוק מור, אבל לא בגלל שהם מהירים מדי, אלא להיפך, בגלל שהם איטיים מדי. בזמן שטכנולוגיות אחרות מבוססות שבבים, כמו מעבדים ואחסון פלאש הופכות מהירות יותר, HDD מקבלים דו”חות תנועה על כך שהן חוסמות את התנועה.

הכותב סטיב פינגרהט הינו סגן נשיא, פתרונות אחסון ארגוניים, חברת סאנדיסק

סטיב פינגרהט, סאנדיסק

תגובות סגורות