הסטארטאפ הישראלי aiOla משיק את Jargonic – מודל זיהוי הדיבור המדויק בעולם

הטכנולוגיה החדשה, שפותחה על ידי מומחי AI מהטכניון ו-Carnegie Mellon, עקפה במבחנים מתקדמים את OpenAI, ElevenLabs גם בסביבות עבודה רועשות ובמבחני שטח

חברת ה-Deep Tech הישראלית aiOla, המתמחה בפתרונות Conversational AI לארגונים, משיקה את Jargonic – מודל זיהוי דיבור (Speech-to-Text) פורץ דרך שמציג דיוק חסר תקדים בכל שפה ובכל ז’רגון, בסביבות אקדמיות ותעשייתיות כאחד. בניגוד למודלים קיימים שמציגים תוצאות טובות בתנאי מעבדה, Jargonic תוכנן להתמודד עם אתגרים אמיתיים, כולל רעשי רקע, איכות שמע ירודה, מבטאים, ושימוש בז’רגון מקצועי ייחודי לתעשייה. המודל מאפשר תמלול מדויק של שיחות ומונחים טכניים בכל תהליך עבודה, מפס ייצור ועד מוקד שירות, ומספק יכולות אינטגרציה מהירה באמצעות API.

היתרון המובהק הוא יכולת לזהות מילים מקצועיות, סלנג, ראשי תיבות וקיצורים – ביותר מ-100 שפות – בדיוק מירבי ובזמן אמת. המודל פותח על ידי צוות המחקר של aiOla בראשות פרופ’ יוסי קשת, המדען הראשי ולשעבר בצוות Alexa של אמזון, יחד עם ד”ר גיל חץ, סמנכ”ל מחקר ו-AI, ואסף אסבג, סמנכ”ל טכנולוגיות ומוצר, לשעבר מוביל תחום ה-AI ב-Playtika. הצוות כולל שישה חוקרי דוקטורט ופועל בשיתוף פעולה עם פרופ’ ביקשה ראג’ מאוניברסיטת Carnegie Mellon – מהמובילים בעולם בתחום הדיבור. עד כה נרשמו חמישה פטנטים בתחום, ביניהם Whisper-Medusa – טכנולוגיה המאפשרת זיהוי דיבור במהירות כפולה מזו של OpenAI.

Jargonic הוא חלק מפתרון רחב שפותח ב-aiOla, שמאפשר לארגונים להפוך כל תהליך ידני לתהליך קולי, מדויק ומבוסס דאטה בזמן אמת. הפלטפורמה כוללת מערכת לבישת מיקרופונים, אפליקציות מותאמות לצוותים בשטח, מנוע NLP מותאם לתעשיות ספציפיות, וכלי אינטגרציה חכמים למערכות הארגוניות. הפלטפורמה יודעת לנתח ולהבין שיח עסקי בזמן אמת, לשלוף מתוכו מילות מפתח, לארגן את המידע בטפסים ותהליכים ולהפוך את הדיבור של העובדים לדאטה תפעולי שנכנס מיד לתוך זרימת העבודה. התוצאה: פחות הקלדות, פחות טעויות, יותר מהירות, ויותר תובנות.

המודל אומן על יותר ממיליון שעות דיבור, כולל דאטה אמיתי מסביבות תעשייתיות, והשיג את התוצאות הבאות: דיוק של מעל 95% בזיהוי מונחים מקצועיים מתוך מאגר CommonVoice בשפות גרמנית, ספרדית, צרפתית, אנגלית ופורטוגזית – הגבוה ביותר מבין כלל המודלים שנבדקו. שיעור שגיאות ממוצע בזיהוי מילים (Word Error Rate) של 5.91% בארבעת מאגרי הדאטה האקדמיים המובילים באנגלית – טוב יותר מ-OpenAI (6.52%), ElevenLabs (6.14%), Deepgram (6.48%) ו-Assembly AI (6.25%). כן הוא הגיע ל-89.3% דיוק בזיהוי מונחי ז’רגון עסקיים ופיננסיים מתוך מאגר Earnings (הנחשב מאתגר ביותר למודלי שפה), לעומת 85.1% (ElevenLabs), 82.9% (Assembly AI), 80.1% (Whisper) ו-77.5% (Deepgram).

פרופ’ יוסי קשת, המדען הראשי: “האתגר האמיתי בזיהוי דיבור ארגוני אינו השגת תוצאות גבוהות על מאגרי נתונים אקדמיים נקיים, אלא שמירה על דיוק גבוה גם כאשר מתמודדים עם מונחים מקצועיים, מבטאים מגוונים ותנאי שמע מאתגרים. טכנולוגיית זיהוי המילים היא פריצת דרך משמעותית בדרך שבה מודלים של זיהוי דיבור מזהים ומעבדים מונחים מקצועיים וז׳רגון פנימי ארגוני”.

אסף אסבג, CTO ו-CPO: “במשך שנים, ארגונים צברו כמויות עצומות של מידע קולי – משיחות עבודה, תפעול, שירות ודיווח – אבל בפועל, המידע הזה נשאר תקוע בקבצים, במערכות סגורות או פשוט נעלם. עם Jargonic, אנחנו לא רק מזהים דיבור – אנחנו הופכים שיחה לפעולה, ודיבור לדאטה שנכנס אוטומטית לזרימת העבודה הארגונית.

החידוש הגדול הוא ביכולת לזהות ולהבין שפה עסקית אמיתית – עם כל הסלנג, הקיצורים, הז’רגון והמורכבויות שמאפיינים תקשורת מקצועית בשטח. כל זה קורה בזמן אמת, בכל שפה, ובדיוק שמאפשר לארגונים לקבל החלטות מהר יותר, לתעד בלי מאמץ, ולמנוע כשלים קריטיים שנובעים מאי-תיעוד. זו בעיניי לא רק קפיצה טכנולוגית – אלא שינוי תפיסתי באיך תקשורת קולית יכולה להפוך לנכס תפעולי, עסקי ואסטרטגי עבור כל ארגון והטכנולוגיה עכשיו בשלה מספיק כדי לאפשר זאת.”

אלון פלג, COO: “השקת מודל ייחודי כמו Jargonic היא תוצאה של שילוב נדיר של טאלנט, חזון וניסיון. מאחורי ההישג הזה עומד צוות יוצא דופן – החל מהובלה אסטרטגית של עמרי שי, מנכ”ל ומייסד שחתום על הצלחות ענק בעולמות הטכנולוגיה וה-AI, דרך הנשיא אמיר הרמתי, שמוביל את הקשר עם משקיעים מהשורה הראשונה ומנהלים בכירים בחברות Fortune 500, ועד החוקרים, המהנדסים ואנשי המוצר שפיתחו טכנולוגיה פורצת דרך עבור חברות גדולות. זו הוכחה לכך שעם צוות מדויק, אפילו לא גדול – אפשר לייצר חדשנות ברמה עולמית, שתאפשר לארגונים הגדולים בעולם לעבוד ולבצע תהליכים במהירות הקול.”


קרדיט: aiOla

מערכת ניו-טק מגזינים גרופ

תגובות סגורות