עברית ב-AI: למה סוכני צ'אט נכשלים בעברית ואיך פותרים
עברית ב-AI: למה סוכני צ'אט נכשלים בעברית ואיך פותרים
התקלה שגרמה לאביב להרים את הטלפון
אביב, בעל חנות רהיטים ברעננה, חיבר לפני שנה בוט לווטסאפ של החנות. הבוט היה עליו מארה"ב, הובטח שהוא יודע עברית. הפעם הראשונה שהוא התרסק בציבור הייתה כשלקוחה כתבה "סבבה אחי תסדר לי לשבת". הבוט הבין "שבת" כיום בשבוע, ענה "מה הזמן הרצוי לך לפגישה בשבת?", והלקוחה התעצבנה. אחי, אמרה, ביקשתי ממך לסדר לי משהו, לא לקבוע פגישה לסוף השבוע. אביב התקשר אלי למחרת, ואמר "תגיד לי, זה חזק בעברית או לא".
התשובה היא מורכבת. יש מודלים ש"יודעים עברית" במובן שהם יכולים לייצר משפטים בעברית תקינה. יש מעט מאוד מודלים ש"מבינים ישראלי", כלומר יודעים לפרש סלנג, הקשר דיבורי, מבנה משפט שבור, חילופי ה' ו-א', ומילים כמו "סבבה", "תפנוק", "אחושילוק". הפער בין השניים הוא מה שגורם לסוכני צ'אט ישראליים להישבר בחודש הראשון.
חמש הבעיות הליבה של עברית ב-AI
1. הטיות והתאמה דקדוקית
עברית היא שפה עם הטיה עשירה. מילה אחת יכולה להופיע בתשע צורות שונות, לפי גוף, מין, זמן ומספר. "הלך, הלכה, הלכו, הלכנו, ילך, תלך, ילכו". עבור מודל שאומן בעיקר על אנגלית, כל אלה הן מילים שונות. המודל לא תמיד מבין שכולן נגזרות מאותו שורש. וכשלקוח שואל "כמה זמן לוקח שהמחבת תגיע?", והמערכת מחפשת "הגעה", היא לא תמצא את המילה.
התוצאה היא חיפוש חלש, תשובות לא רלוונטיות, תחושה של חוסר הבנה. הפתרון הוא נורמליזציה לפני החיפוש, המרה של כל הצורות ההטויות לשורש, ואז חיפוש על השורש.
2. ניקוד וחוסר ניקוד
בעברית אין כמעט ניקוד בטקסט מודרני. "ספר" יכול להיות ספר קריאה, ספר שמספר סיפור, או הפועל "הוא סיפר". רק ההקשר מבהיר את המשמעות. מודלים בינוניים נתקעים כאן, ומנחשים לפי התדירות בבסיס הנתונים שלהם. אם הם אומנו בעיקר על ספרות, "ספר" יהיה אובייקט פיזי בברירת המחדל.
מודלים מתקדמים פותרים את זה בהקשר. הם מסתכלים על המילים הסובבות, ומחליטים "אם כתוב 'הוא סיפר לי'", כנראה מדובר בפועל. אבל זה דורש גודל מודל מסוים ואימון על עברית מספיק רחב.
3. סלנג וקיצורי לשון
"סבבה, תבוא נחשוב על זה" זה משפט שכל ישראלי מבין. המודל הגלובלי לא בטוח. "סבבה" באנגלית לא קיים. "תבוא נחשוב" זה מבנה משפט שאינו קיים באנגלית. צירופים כמו "תיזהר זה לוחץ", "אחלה, יאללה", "חבל על הזמן" דורשים הבנה ישראלית, לא הבנה של עברית ספרותית.
הבוטים שנכשלים הם אלה שאומנו על טקסטים פורמליים בלבד, ויקיפדיה עברית, עיתונות, ספרות. הם לא ראו וואטסאפ. כשהם מקבלים הודעת ווטסאפ של לקוח שכותב כמו שהוא מדבר, הם לא מבינים.
4. כיוון טקסט ו-RTL
עברית כתובה מימין לשמאל, אבל מספרים ומילים באנגלית בתוך הטקסט רצים משמאל לימין. "ההזמנה מיום 15/03 היא 2,400 שקלים" דורשת טיפול מיוחד בכיוון. בוטים שלא טופלו כראוי מוציאים הודעות עם כיוון שבור, מספרים שצצים באמצע מילה, אימוג'ים שמופיעים בצד ההפוך.
זה לא בעיה של המודל, זה בעיה של הפלטפורמה. אבל לקוח שרואה הודעה עם כיוון שבור חושב שהעסק לא מקצועי.
5. זכר ונקבה, מי מדבר עם מי
בעברית, כל פועל מוטה לפי מין. "תכתוב" לגבר, "תכתבי" לאישה. בוט שלא מזהה את המין של הלקוח פולט משפטים שרירותיים, ולעיתים מעליב. לקוחה מקבלת "תוכל להזמין ביום ראשון" כאשר היא ציפתה "תוכלי". זה לא טעות דקדוקית, זה טעות של נימוס.
בוט מקצועי בעברית שואל את המין בתחילת השיחה, או מזהה אותו מתוך השם והשימוש בכינויי גוף. ברירת המחדל של "לשון זכר נייטרלי" אינה מספיקה. זה מרגיש לחצי מהלקוחות שהבוט לא מתאים להן.
סצנה: הבוט של אביב אחרי השיפוץ
אביב החליף את הבוט הישן. המערכת החדשה אומנה על דיבור ישראלי, לא רק על עברית ספרותית. היא גם השתמשה ב-RAG, כך שהיא לא מנסה לזכור ראשונה על העברית, אלא שולפת מהקטלוג ומהשיחות הקודמות.
היום, כשלקוח כותב "סבבה אחי תסדר לי לשבת", הבוט מבין. "תסדר לי" הוא ביטוי לבקשה לסידור או משלוח, ו"לשבת" בהקשר של בקשה זה "לסוף השבוע, ביום שני או ראשון אחרי". הבוט עונה, "אחי, רוצה שאסדר לך את ההזמנה ליום ראשון הקרוב? יש לנו סיור משלוחים בבוקר". הלקוח עונה "כן, תסדר". עסקה נסגרת.
הנקודה היא שהבוט לא רק יודע עברית, הוא מבין ישראלי.
מה שעובד, ולמה
לפני שנה, הבוטים בעברית היו חלשים. היום יש כלים טובים. חלקם גלובליים, חלקם ישראליים. מה שמשתנה לטובה:
מודלים מקומיים. Dicta הוא מודל עברית שפותח בבר אילן עם נתונים ישראליים. הוא יותר חזק בעברית מודרנית. Heb-Lex של חברות ישראליות נוספות מציע אותה פונקציה. מודלים אלה מעולים לחיפוש סמנטי, לא תמיד לייצור טקסט.
מודלי שפה גדולים עם כיוונון עברית. Claude של Anthropic, GPT-4 של OpenAI, ו-Gemini של Google, עברו שיפור משמעותי בעברית ב-2024 ו-2025. עדיין לא מושלמים, אבל שימושיים ברמה מקצועית. הם טובים בדיאלוג, פחות בשליפה מדויקת.
ארכיטקטורה היברידית. הפתרון שעובד הכי טוב זה שילוב. מודל מקומי לשליפה סמנטית, מודל שפה גדול לייצור התשובה. Ottomatt משתמשת בדיוק בשילוב הזה. כל שאלה של לקוח עוברת שלושה שלבים: נורמליזציה של הטקסט, שליפה ממאגר הידע של העסק (תוצרת ישראל), ייצור תשובה על ידי מודל שפה שמכוון לעברית דיבורית.
הבדיקה שכל בעל עסק צריך לעשות
לפני שאתה סומך על הבוט שלך בעברית, תבדוק שלושה דברים:
הראשון, תשאל אותו שאלה בסלנג. לא "מה שעות הפעילות", אלא "אחי מתי אתם פתוחים". אם הבוט נכשל במעבר מפורמלי לדיבורי, אתה עובד עם בוט לא מוכן לישראלים.
השני, תשלח הודעה עם שגיאת כתיב. הלקוח הממוצע בוואטסאפ כותב עם שתי שגיאות כתיב בכל הודעה. בוט שדורש כתיבה מדויקת מכשיל את הלקוח.
השלישי, תבדוק הטיית מין. שלח מהחשבון שלך ומהחשבון של אשתך. אם הבוט מדבר אל שניכם בגוף זכר, הוא לא מתאים.
אמינות בפועל, לא בהדגמה
הדגמות של בוטים עברית תמיד נראות מרשימות. השיווק מראה דוגמאות מתוזמרות, עם שאלות מדויקות ותשובות מדויקות. בפועל, הלקוחה שולחת "היי תגידו לי יש לכם משהו לגיל 8 מתנה ל-45 שקלים כזה". הבוט צריך להבין שמדובר בחיפוש מוצר, לגיל שמונה, בתקציב של 45 שקלים, מתנה. זה שלוש מימדים באותו משפט שבור.
אמת המבחן של בוט עברית טוב היא בדוגמאות כאלה, לא בשאלות יפות. תדרוש מהספק שלך לראות דוגמאות אמיתיות של וואטסאפ של לקוחות אמיתיים, לא תסריטים.
עברית זה גם עניין של טון
מעבר להבנה, יש את החלק של הטון. עברית ישראלית דיבורית היא קצרה, ישירה, לפעמים חמה, לפעמים קרה. בוט שמשיב ב"תודה רבה על פנייתך הנעימה" נשמע כמו חברת ביטוח משנות התשעים. בוט שמשיב "היי, קיבלתי, אני בודק ומגיב לך תוך דקה" נשמע כמו חבר.
הטון מגדיר את הזהות של העסק בעיני הלקוח. Ottomatt מאפשרת התאמה של הטון לכל תחום. סלון יופי מדבר קצת יותר חם, מוסך מדבר קצת יותר ישיר, רופאה מדברת קצת יותר מקצועי. הטון הוא קונפיגורציה, לא קוד.
למה עברית זה לא "עוד שפה"
הרבה חברות גלובליות מסתכלות על עברית כ"עוד שפה" ברשימה. הן מאמנות על תרגומים מאנגלית, מקבלות עברית טכנית לא משכנעת. הסיבה לכך שהשיטה הזאת נכשלת היא פשוטה. עברית בפועל, היום, בווטסאפ, היא מרוסקת. היא מעורבת. היא מלאה בסלנג ישראלי, ובאנגלית באמצע משפט ("תשלח לי על הווטסאפ, OK"), בשמות מקומות שלא קיימים בשום מאגר, בקיצורים של ירושלים, קריית אונו, פתח תקווה.
מודל שלא ראה את זה לא יצליח. נקודה.
Ottomatt משקיעה בעברית ישראלית, לא בעברית ספרותית. כל הסוכנים שלנו אומנו על שיחות וואטסאפ של עסקים קטנים, לא על ויקיפדיה. התוצאה, בוט שלא נשבר כשהלקוח כותב "סבבה אחי".
לסיכום, עברית דורשת כבוד
הלקוחות הישראלים הם קהל סלחני ברבים דברים, אבל לא בעברית רעה. בוט שמשבש את השפה, שמשיב במבנה תרגום, שמפספס סלנג, מאבד את הלקוח תוך הודעה אחת. בוט שמדבר כמו ישראלי, מרוויח את הלקוח.
זה אומר שהבחירה של מערכת ה-AI לבית העסק שלך חשובה הרבה יותר ממה שמיידעים אותך. הבדיקה צריכה להיות לא בצ'אט של הפגנה, אלא בשיחת וואטסאפ אמיתית, בסלנג, בהקשר שלך.
רוצה לראות איך סוכן AI ישראלי נכון נראה בעסק שלך? היכנס ל ottomatt.co.il/he/agents והזמן הדגמה חיה. נראה לך את הבוט עובד על הלקוחות שלך, בעברית שלך, בלי שבת במקום סידור.