ברוכים הבאים לעידן הקול. עידן בו יצרני רכב מפתחים מערכות שמאפשרות לנהגים להפעיל בקולם ניווט מורכב, לנהל מערכות אינפוטיינמנט רבות עוצמה, להפעיל את מיזוג האוויר או לחייג למשרד. עידן בו ילדים מנהלים שיחות עם גברת בשם ״סירי״ השוכנת בלב האייפונים שלהם, טבחים מבקשים מגליל שחור העומד על משטח העבודה במטבח, הנחיות להכנת עוגות קצפת ובני גיל שלישי מזעיקים סיוע באמצעות מכשיר חכם שתלוי על הקיר.
הקביעה כי מערכות מופעלות ונשלטות קול יחליפו מתי שהוא בעתיד הלא רחוק את כל שאר ממשקי המשתמש, נשמעים שוב ושוב על ידי מומחים בתחום. הם אוהבים לצטט בכל הזדמנות את העתידן וסופר המדע הבדיוני, ארתור סי. קלארק, ואחד מאנשי החזון הבולטים של המאה ה-20, שחזה כבר די מזמן, שהגישה הגלובלית למידע תתבצע תוך שימוש בקול האנושי.
היה זה ב-1971 עת מימנה מחלקת ההגנה האמריקנית מחקר שאמור היה לפתח מכונה – Harpy שמה, שתוכננה להבין 100 מילים, אבל, הפטנט הראשון לטכנולוגיית הזיהוי הקולי הוגש רק עשור מאוחר יותר, בשנת 1983 על ידי שני חוקרים איטלקיים, קאווזה וסיאראמלה. שנים אחר כך, עוד ניתן היה למצוא פרוייקטים בהחלט מעניינים בתחום המבטיח הזה, אך כולם נוהלו תחת מעטה חשאיות מסויים בחברות התקשורת הגדולות ובגופי ממשל חשאיים. ואז, ב-1990 הופיע המוצר הצרכני הראשון – תוכנת הכתבה – שסללה את הדרך לשלל חידושים בתחום שהובילו בבטחה עוד לא מעט מוצרים עם הכניסה למילניום החדש. נכון, ההתחלה היתה לא קלה ולא מעט מוצרים שהתחייבו לספק ביצועי text-t-speech, או תרגום סימולטני, כשלו נחרצות, או התבררו כמורכבים ואיטיים מדי.
רק עם הכניסה לעידן ה״ענן״ והגישה למאגרי הביג דאטה, שאפשרו למערכות זיהוי קולי והפעלה קולית, גישה לכמויות בלתי נתפסות של נתונים בצמוד ללימוד מהיר ומדוייק יותר, החלה הפריחה המיוחלת. ב-2008 נכנסה לשימוש מערכת הזיהוי הקולי הראשונה בסמארטפונים, ותוך זמן קצר התמלאה הזירה באינספור שחקני ענק שהציפו אותה בשלל ״עוזרים דיגיטליים״, המסוגלים לבצע פקודות, לספק מידע, להקליט קול ולהפכו למילים כתובות, ואפילו לקבוע פגישות ביומנים.
אין ספק. הדיבור לשלל מכשירים, שגם מניב תוצאות מיידיות, הוא אבן דרך באבולוציה של הטכנולוגיה. אנו נעים לאט, אבל בטוח, לתצורה טבעית יותר של אינטראקציה עם מכשירים ומערכות דיגיטליות מסוגים שונים ושל יצרנים שונים ועל הדרך עדים לחיסול הבלתי נמנע של מקלדות, עכברים, או אפילו משטחי מגע ולכיוון עתיד בו ממשק האדם-מכונה יהיה חלק בלתי נפרד מהמציאות היומיומית של כולנו.
במציאות החדשה הזו, בה עוד נמצא פה ושם מסכי מגע, טכנולוגיות הקול ימשיכו ליהנות מהשימושים הכמעט אינסופיים במכשיר המהווה כיום את המקור הבלתי אכזב ככלי הקיבול לטכנולוגיות הקול – הסמארטפונים, ששולטים בבטחה על אוטומציה ביתית ומגוון יישומי בית חכם, ניווט לוייני ושאר פיצ׳רים רבי עוצמה שהופכים את החיים למעט נוחים יותר.
התקדמות במהירות האור
תערוכות העל האחרונות שנערכו ברחבי העולם, היו זירה נוחה לתצפיות על הטרנד הלוהט. כך לדוגמה, שון דובראוק, וסטיב קונינג, מאיגוד הטכנולוגיה הצרכנית (CTA) שאחראים בין השאר על ניהול תערוכת CES, אמרו בכל ראיון בתערוכה האחרונה כי טכנולוגיית הזיהוי הקולי השתפרה כל כך בשנים האחרונות עד כדי כך שהיא מהווה את הסמן המרכזי לעידן אותו הם מכנים ״faceless computing״… ״ראינו יותר התקדמות בטכנולוגיה הזו ב-30 החודשים האחרונים יותר מאשר ב-30 שנה אחורה״, הם אומרים.
אוהד אמיר, מנהל הטכנולוגיה (CTO) של אסנס הישראלית ספקית גלובלית של טכנולוגיות IoT ופתרונות לחיים מקושרים מבוססי ענן, מסכים איתם. בתערוכה הציגה אסנס, שמסתמנת כיום כשחקן מהשורה הראשונה בעולם, מערכות המאפשרות לאנשים לנהל את בתיהם המקושרים לרשת, מכל מקום, בכל זמן, מכל מסך מכשיר אלקטרוני – ובזמן אמת, כשלקוחות הקצה מקבלים פתרון רחב טווח, שכולל מחומרה, דרך תוכנה, ועד אפליקציות סלולר מותאמות. בין השירותים מהם ניתן ליהנות: מערכות ניהול ביתיות אינטראקטיביות, למטרות בטיחות (חיישני עשן ודליפת מים), בטחון אישי (אזעקה) ואוטומציה ביתית (לניהול מגוון מערכות חשמל ואנרגיה) – והכל באמצעות אפליקציה אינטראקטיבית. בארסנל של החברה מצויה גם מערכת ביתית חכמה לבקרה על שיגרה יום יומית של מבוגרים, הניתנת להתקנה ולתפעול עצמי על ידי בני המשפחה. המערכת מפקחת על פעולות קבועות של המבוגר השוהה לבד בביתו ומאפשרת לבני המשפחה להשגיח על המבוגר באופן רציף. מרכיבי המערכת הבסיסיים כוללים פאנל הפעלה מרכזי, חיישני תנועה וחיישנים לפתיחת דלת או חלון, כאשר ניתן להוסיף בקלות רבה חיישנים או רכיבים נוספים. וכן, לטכנולוגיות הקול יש מקום של כבוד שם.
״בתערוכות האחרונות אנו מוכרים את הפתרונות שלנו לספקיות תקשורת מרחבי העולם״, אומר אמיר. ״הן מגלות עניין כיום בשירותים בעלי ערך מוסף שניתן להציע ללקוחות, כדי לחזק את נאמנות לקוחות הקצה וחלקן אף החלו בהצעת שירותי בית חכם המשלימים את השירות שלהן. השימוש שלנו ביכולות הטמונות בתחום העכשווי של ׳האינטרנט של הדברים׳ שכולל גם יכולות אנליטיות, שליטה קולית וניהול אנרגיה ביתית, ומשפר משמעותית את חוויית לקוח הקצה״.
על פי ההערכות של CTA, השחקנים הנוספים בזירת הקול, דוגמת חברת אמזון וגוגל, שהתייצבו עם Amazon Echo ועםGoogle Home, מכרו עד היום מעל 5 מיליון יחידות של העוזרים הדיגיטליים שלהם מבוססי הזיהוי הקולי, מספרים שרק יכפילו עצמם עד סוף 2017.
לדברי אמיר, מבחינת החברה הישראלית, חלק מהמשחק הוא אספקה של יכולות התממשקות עם כל החידושים, המוצרים והטכנולוגיות שיש בשוק. ״יש לא מעט אפליקציות כיום התואמות לממשקים של Google או Amazon. הן מחפשות מידע, הן מחברות אותך לבידור מקוון, הן מאפשרות שלל שירותים, כמו לדוגמה בתחום הקמעונאי, או להפעלה וכיבוי של מערכות אזעקה, והן יכולות להוות בסיס במקרים בהם מדובר על תעשיית האבטחה. בכולן נעשה שימוש בקול. כך, ניתן בהחלט למצוא פתרון לשימוש במכשיר ה-Echo של Amazon כדי להדליק ולכבות אורות בבית, להפעיל או לכבות מערכות חשמל וכד׳״.
כיום, Amazon Echo, גליל מתכת ממוחשב מונע קול, ועונה לשם אלכסה, יכול להשיג עבורך תחנות רדיו שונות, לספר בדיחות ולענות על חידות טריוויה, וכן, לשלוט על יישומים חכמים. Siri של Apple מטפלת מדי שבוע בשני מיליארד פקודות או בקשות ועשרים אחוז מהחיפושים שמתבצעים בחיפוש של גוגל על מערכות אנדרואיד בארה״ב, מתבצעות על ידי שימוש בקול. אין ספק. כמה שזה נשמע פשוט ומובן, לקול יש את היכולת לבצע מהפיכה של ממש בעולם המחשוב על ידי שימוש באמצעי טבעי לאינטראקציה עם המכונה. כשם שסמארטפונים הם הרבה יותר מאשר טלפונים ללא חוטים ומכוניות הן יותר מאשר מובילות נוסעים, בלי סוסים, כך גם למחשבים בלי מסכים ומקלדות יש את הפוטנציאל להיות הרבה יותר שימושיים, הרבה יותר חזקים ויעילים מאשר ניתן לדמיין כיום. השימוש בקול יאפשר ליותר ויותר בני אדם לתקשר עם טכנולוגיה שסביב להם, ממכונות כביסה, דרך מקררים ועד אמצעי עזר לחיים טובים יותר.
״מתכונים״ קבועים מראש
על פי דוחו״ת אחרונים, כרבע מהאוכלוסיה בארה״ב תעשה שימוש עד סוף 2017 בפתרון כלשהו בתחום הבית החכם המקושר. קרוב ל-50% מלקוחות בני דורות ה-GenX והמילניאלס כבר מחזיקים כיום בביתם מוצר חכם כלשהו ו-56% מהצרכנים שמשתמשים כיום בביתם במכשיר חכם מקושר מתכונים לרכוש מוצר דומה אחד לפחות במהלך שנת 2017.
על פי הסקרים, המערכות המקושרות הפופולריות ביותר כוללות מצלמות, וסתי טמפרטורה ביתיים (תרמוסטטים), תאורה חכמה ומערכות נעילה חכמות לבית. שילוב יכולות IFTTT וקישוריות Z-Wave+ במוצרים עכשויים מאפשר כיום לצרכנים הביתיים לבנות לעצמם בקלות ובאינטואיטיביות רבה, תרחישים אוטומטיים שיתנו להם יכולת לנהל בעצמם את הסביבה הביתית, מכל מקום, בכל זמן תוך שימוש במגוון מכשירים ניידים (סמארטפון, מחשב נייד, טאבלט ואחרים). Z-Wave+ הוא פורמט לשליטה בבית חכם המשולב במערכות גלאי תנועה, חיישני דלתות/חלונות ושאר מערכות מהדור החדש.
IFTTT היא אפליקציית אוטומציה פופולרית, המאפשרת ליצור ״מתכונים״ קבועים מראש שבאמצעותם יכולים המשתמשים במכשירי בית חכם להתנות פעולה אחת באחרת ולבצע את הפעולות באופן אוטומטי באינטרנט. במרבית המקרים בהם נעשה שימוש ב-IFTTT, השימוש הוא בבקרה והפעלה קולית של מערכות מיגון ביתיות העושה שימוש במכשיר Amazon Echo. ספקי שירותים שיציעו ללקוחות הקצה ערוץ IFTTT במערכות הבית החכם, יעניקו למשתמשים חויית משתמש יעילה יותר כמו גם היכולת לגשת למגוון השירותים שלהם באמצעות אפליקציה אחת״, אומר אמיר. ״עם שילוב ה-Z-Wave+ הלקוחות יוכלו להנות מטווח שירותים רחב יותר למערכות שברשותם, דוגמת מערכות בקרה ושליטה על הבית החכם המוצעים כיום על ידי יצרנים מובילים בשוק. הלקוחות מבקשים כיום יותר קישוריות עם מכשירים אחרים ויעילות רבה יותר מפתרונות ה-IoT שברשותם״, אומר אמיר. ״הפתרונות והחידושים הטכנולוגיים מאפשרים למשתמשים להפיק את מירב התועלות מהעולם המקושר של ה-IoT״.
בין השחקנים הבולטים כיום בזירה, ניתן למצוא חוץ מה-Amazon Echo ,Nest וה-Google Home, מוצרים של חברות ענק נוספות שרואות בתחום את הזירה החדשה. כך, Samsung SmartThings של סמסונג, מעין מרכזיה חכמה שמנסה לחבר ולקשר מערכות של מגוון יצרנים, Philips Hue, ה-Logitech Harmony and Pop, שמסייע לחבר את ציוד הבידור הביתי לעידן האינטרנט של הדברים וה-Sony smart speaker.
אחד המוצרים שמדגים יפה את השימוש בזיהוי הקולי באסנס, הוא ה-VPD – Voice Panic Detector, שזוכה ללא מעט פרסי תעשייה בחודשים האחרונים. ה-VPD הוא מוצר ראשון מסוגו בתעשייה, המשלב זיהוי קולי חכם ב׳כפתור מצוקה׳, המאפשר למתקשים לקום ממיטתם, או להגיע בכוחות עצמם ללחצן מצוקה, להזעיק עזרה משירותי חירום תוך שימוש בקול בלבד. את המכשיר ניתן להניח בכל פינה בבית, או לתלות על הקיר (כולל בחדרי רחצה ואמבטיה). הוא ׳שומע׳ את הקורה סביבו 24/7, וכשהוא מזהה קריאת חרום קבועה מראש – הוא מפנה אותה למוקד החירום. המכשיר החכם – המשדר דו-כיווני – אף מאפשר לעובדי מוקדי החירום לתקשר באמצעותו עם החולה ולקבוע מה רמת הסיוע הנדרש לו – ולהגיב בהתאם.
ברקע פועלת טכנולוגיה מפיתוח כחול-לבן -Intelligent Voice Activation – טכנולוגיה הפועלת ללא הפסקה ברקע היכולה לזהות קול ולהניע לפעולות מסויימות. כאשר משלבים אותה במערכות ניטור להתנהגות בני גיל שלישי, או במערכות אזעקה חכמות, היא זו שתדאג להפעיל – לאחר קבלת הנחיה קולית – חיבור לסיוע חיצוני או חירום. המערכות אלחוטיות ומופעלות בתקשורת RF, מידע רגיש אינו משודר מהן לענן לטובת שמירה מקסימלית על פרטיות.
״בשימוש ביישומי קול עלינו להתמודד טכנולוגית עם לא מעט נושאים״, מספר אמיר. ״כך לדוגמה, האנשים אצלנו שעובדים על פיתוח של יישומים מעשיים של האלגוריתמים המשמשים לניתוח קול, פעילים אצלנו שעות נוספות. והסיבה: המערכות חייבות להבין מהנאמר, הן חייבות להיות מסוגלות לנטרל רעשי רקע ולהתמקד במילים מסויימות ולעתים הן חייבות גם לזהות מאפיינים ביומטריים של המשתמשים בקול כדי להפעיל מערכות שונות, כדוגמת מערכת אבטחה, שהרי אף אחד לא רוצה שאדם לא מאושר על ידי המערכת, אבל שמכיר את הקוד הסודי, יוכל לכבות את מערכת ההגנה ההיקפית והאבטחה של הבית. בשביל זה צריך שהמערכת תשתמש בזיהוי קולי מוחלט של הדובר. מכאן אפשר להוביל את המערכות הביתיות של הדור הבא לכיוון מתן היתרי כניסה הביתה, או למתקנים מסווגים, רק לאחר זיהוי קולי ודאי, להפעיל מגוון מערכות חשובות, או לזהות אדם – על פי קולו – שהוא נמצא במצוקה כלשהי… כך למשל, במקרי חירום ניתן יהיה לקבל סיוע מהיר בלי שהמעורבים כלל יידעו שהעזרה בדרך״.
מושג הקסם
מילת מפתח בכל התוכנית העתידית המופלאה, היא, איך לא – IoT. נכון. האינטרנט של הדברים, אותו מושג קסם שמתייחס למצב בו אינספור מכשירים ומערכות אלקטרוניות עמוסות חיישנים, נעשים חכמים מיום ליום ואף מתחילים לדבר האחד עם השני. Strategy Analytics מעריכה כי מדובר במעל 33 מיליארד מערכות כאלה עד שנת 2020, ואם זורקים לחבילה, יכולות זיהוי קול, חיבורי ענן ו׳למידה עמוקה׳, מקבלים כוחות הנעה רבי עוצמה שמביאים עימן רמות חדשות של תחכום לכל מה שסובב אותנו, או, אפילו, נמצא עלינו (ומישהו אמר ״מחשוב לביש״?) וגם כאן, אם מחפשים הבנה במספרים, הרי ש-Strategy Analytics צופה כי הצרכנים יוציאו על תחום מערכות בית חכם לבדן, סכום של מעל 130 מיליארד דולר בשנה…
לדברי אמיר מאסנס, שנת 2017 מביאה עמה לא מעט שינויים בתעשייה. ״שנת 2017 מסתמנת כשנה בה חברות המפתחות ומייצרות מוצרי בית חכם, יצטרכו לשים יותר דגש על עמידות מוצריהן בהתקפות סייבר, על יישומי ביג דאטה ועל השימוש בקול. ״מניתוח עומק של התעשייה כולה, גילינו שבעקבות אירועי אוקטובר 2016, עת בוצעו מתקפות סייבר על רשתות לשימושי IoT, מתכוונות רבות מהספקיות בתחום לבחון היטב במהלך 2017 את מוכנותן ועמידות מוצריהן בפני מתקפות נוספות. מהניתוח עוד עולה כי ספקי השירותים השונים בתחום הבית החכם וה-IoT מתחילים להבין את הכוח השיווקי הטמון בניתוח הנתונים הרבים שנאספים בעקבות השימושים שעושים הצרכנים במוצריהם. הם יוכלו להשתמש בנתונים בעצמם לטובת שירותי תחזוקה מונעת ושירותים אחרים, כמו גם לנצלם לטובת הצעה של מערכות משלימות, או יישומים מקושרים אחרים״.
אמיר מעריך כי טכנולוגיית הזיהוי הקולי, כמו גם טכנולוגיות אינטראקטיביות דומות, יהפכו אף ליותר שימושיות, כשהן פותחות מגוון אפשרויות עבור ספקי שירותים ויצרנים מתחומי ניטור הבריאות והאבטחה. ״כאמור, טרנד השימוש בקול והבאז שעשה התחום כולו, בלט במיוחד בתערוכת CES 2017 , כשהחברות הגדולות התחרו ביניהן על מוצרים הכוללים זיהוי והפעלה קוליים. הזיהוי הקולי יאפשר לצרכנים בכל גיל ליישם מודל חדש לגמרי של חיבור ואינטראקציה עם מערכות הבית החכם – ולהוריד את הצורך בסמארטפון״.
דבר אחד ברור: הצרכנים הולכים לאמץ את השימוש בטכנולוגיות קול. מדוע? כי השימוש בקול נוח וטבעי מכל דרך אחרת של תקשורת, ונכון, ניתן לעשות את השימוש בקול גם בזמן שאנו עושים דברים אחרים (נהיגה, עבודה, הליכה ברחוב). הקול יביא את כוח המחשוב גם לאנשים שמסיבה כזו או אחרת לא יכולים להשתמש במקלדות ומסכים. לקול יש גם יכולת להשאיר חותם דרמטי על תחום המחשוב, אלא גם ואולי לשנות את השימוש בשפה עצמה…
״הפוטנציאל פשוט עצום״, אומר סיימון בריאנט מחברת הייעוץFuturesource Consulting. ״ואנשים מבינים זאת. אחרי שהבנת שאתה יכול לכבות או להדליק את האורות בבית מרחוק, או להפעיל את מערכת האזעקה, להעביר תחנות ברדיו באוטו, או לבקש מסירי שתחייג לדודה, כל שאר היישומים כבר באים די בקלות… נכון, היישומים וההתקדמות המאוד מהירה שאנו עדים לה בשנים האחרונות מזכירים סצינות שלמות מהסרטים ״אודיסיאה בחלל״, או ״מסע בין כוכבים״, ונכון שבעבר חווינו לא מעט אכזבות מהטכנולוגיה, אבל כיום כבר ברור לכולם שמדובר במהפיכה של ממש. אין צורך בשימוש בידיים, זה מהיר, לא צריך לדפדף בתפריטים מתישים וכמו שזה נראה, לא רחוק היום בו ייעלמו השלטים לכבלים ולטלויזיות וייעלמו העכברים והמקלדות. ככל שהמכשירים בהם אנו משתמשים נעשים קטנים יותר ויותר ועל הדרך מאבדים את המקלדת והמסכים השליטה הקולית בהם תהפוך לאלמנט קריטי.