סוכן AI לשירות לקוחות בעברית — איך בונים בעצמך? מדריך צעד אחר צעד
מדריך צעד-אחר-צעד לבניית סוכן AI שעונה ללקוחות בעברית טבעית: Claude API + MCP + Supabase + Webhook. כולל System Prompt בעברית, חיבור לוואטסאפ וטלגרם, ושמירת שיחות ב-CRM.
הידעת?
66% מארגוני השירות כבר מפעילים סוכני AI ב-2026 — עלייה חדה מ-39% ב-2025 (Salesforce, State of Service).
סוכן AI לשירות לקוחות הוא מערכת מבוססת מודל שפה שמקבלת הודעה מלקוח, שולפת מידע ממקורות הידע של העסק, ומחזירה תשובה בעברית טבעית — או מבצעת פעולה כמו בדיקת סטטוס הזמנה. בניגוד לסוכן AI מבוסס תסריטים, הוא מבין ניסוח חופשי ויודע מתי להסלים לנציג אנושי. המדריך הזה מראה איך בונים אחד בעצמך, צעד אחר צעד.
הביקוש לסוכן שמדבר עברית טבעית גדל מהר בקרב עסקים קטנים-בינוניים וסטארטאפים ישראליים, אך תוכן מעשי בעברית בנושא עדיין מועט. כאן תמצאו ארכיטקטורה ברורה, קוד אמיתי, וצעדים שאפשר ליישם עוד היום — בלי תלות בצ'אטבוט מוכן, עם שליטה מלאה בטון ובמקורות הידע.
לפי Google Cloud ("The ROI of AI 2025"), 88% מהמאמצים המוקדמים של סוכני AI מדווחים על החזר השקעה חיובי, ושירות לקוחות מוביל את האימוץ. לפי Salesforce, 66% מארגוני השירות כבר מפעילים סוכני AI ב-2026 — עלייה מ-39% ב-2025.
מה צריך כדי לבנות (הסטאק המלא)
סוכן AI לשירות לקוחות בעברית בנוי מארבעה רכיבים: מנוע שפה (Claude API), בסיס ידע (Supabase או Airtable), שכבת פעולות (MCP), וערוץ תקשורת המחובר ב-Webhook. כל רכיב נגיש דרך קריאות API פשוטות, וההפרדה ביניהם היא מה שמאפשר להחליף ספק או ערוץ בלי לשכתב את כל המערכת.
| רכיב | תפקיד | אופציה מומלצת |
|---|---|---|
| מנוע שפה | הבנת השאלה וניסוח התשובה בעברית | Claude API (Haiku 4.5 / Sonnet 4.6) או OpenAI (GPT-4o mini / GPT-4.1 nano) |
| בסיס ידע | אחסון FAQ, מדיניות ושיחות | Supabase (או Airtable למתחילים) |
| שכבת פעולות | חיבור הסוכן ל-CRM ולמערכות חיצוניות | MCP (Model Context Protocol) |
| ערוץ תקשורת | קבלת ושליחת הודעות ללקוח | Green API (וואטסאפ) / Bot API (טלגרם) |
מה זה MCP? MCP (Model Context Protocol) הוא תקן פתוח של Anthropic לחיבור מודלי שפה למקורות מידע ולכלים חיצוניים. במקום לכתוב אינטגרציה ייחודית לכל מערכת, מגדירים "שרת MCP" שחושף פעולות (כמו "שמור שיחה" או "בדוק הזמנה") שהסוכן יכול לקרוא להן בעצמו במהלך השיחה.
שני מנועים, אותה ארכיטקטורה: הסטאק זהה בין אם בוחרים Claude או OpenAI — מחליפים רק את קריאת ה-API. ב-Claude התחילו עם Haiku 4.5 (מהיר וזול) ושמרו את Sonnet 4.6 לשיחות מורכבות. ב-OpenAI, GPT-4o mini זול אך כיום דגם legacy, והזול ביותר הוא GPT-4.1 nano. בשני המקרים, אסטרטגיית "מודל זול כברירת מחדל + הסלמה לחזק רק כשצריך" חוסכת הכי הרבה.
שלב 1: הסדרת בסיס הנתונים — FAQ ומדיניות
צרו ב-Supabase שתי טבלאות לפחות: אחת לשאלות נפוצות (שאלה + תשובה + קטגוריה) ואחת למדיניות (החזרות, משלוחים, שעות פעילות). זהו ה"מקור האמת" שהסוכן שולף ממנו, ולכן הוא הגורם מספר אחת לדיוק התשובות. לפני שכותבים שורת קוד — ארגנו את התוכן בפסקאות קצרות וברורות.
-- טבלת שאלות נפוצות
create table faqs (
id bigint generated always as identity primary key,
question text not null,
answer text not null,
category text,
updated_at timestamptz default now()
);
-- טבלת מדיניות העסק
create table policies (
id bigint generated always as identity primary key,
topic text not null, -- 'returns' / 'shipping' / 'hours'
content text not null
);
- שמרו על תשובות קצרות ועצמאיות. כל שורה ב-FAQ צריכה לעמוד בפני עצמה.
- הוסיפו קטגוריות. הן עוזרות מאוחר יותר לנתח אילו נושאים חוזרים הכי הרבה.
- Airtable כחלופה. רוצים להתחיל בלי SQL? Airtable נותן ממשק טבלאי ידידותי עם API מובנה — מצוין ל-MVP.
שלב 2: כתיבת System Prompt בעברית
ה-System Prompt הוא ההנחיה הקבועה שמגדירה מי הסוכן, באיזה טון הוא מדבר, ומה מותר ואסור לו. כתבו אותו בעברית, הגדירו במפורש מתי להסלים לאדם, ואסרו על המצאת מידע שלא נמצא בבסיס הידע. לפי Salesforce, 89% מהלקוחות רוצים לדעת אם הם מדברים עם אדם או עם AI — אז אל תתחזו לנציג אנושי.
אתה "נועם", נציג שירות הלקוחות של חנות [שם העסק]. אתה עונה בעברית בלבד, בטון חם, מקצועי ותמציתי.
- ענה רק על סמך המידע שנשלף מבסיס הידע (FAQ ומדיניות). אם אין לך תשובה — אמור זאת בכנות והצע להעביר לנציג אנושי.
- אל תמציא מחירים, תאריכים או מדיניות. עדיף "אבדוק ואחזור אליך" מאשר תשובה שגויה.
- הסלם לנציג אנושי כשהלקוח כועס, מבקש החזר כספי, או שואל משהו מחוץ לתחום.
- שמור על תשובות של 2–4 משפטים. אל תציף את הלקוח בטקסט.
- אל תתחזה לבן אדם — אם נשאלת, ציין שאתה עוזר AI של [שם העסק].
- הזרקת ידע דינמית. בכל הודעה, שלפו את ה-FAQ הרלוונטי מ-Supabase והוסיפו אותו להקשר השיחה — כך הסוכן עונה לפי מידע עדכני ולא לפי "זיכרון" המודל.
- הגדירו את גבול ההסלמה. תנאי ברור ("כועס", "החזר כספי", "מחוץ לתחום") שמפעיל העברה לאדם — זה מה שמונע תסכול.
שלב 3: חיבור לוואטסאפ/טלגרם
חברו את הסוכן לערוץ דרך Webhook: כל הודעה נכנסת מפעילה את הקוד שלכם, שמעביר אותה למנוע השפה ומחזיר תשובה. בוואטסאפ נפוץ להשתמש ב-Green API; בטלגרם — ב-Bot API הרשמי. בישראל רוב הלידים מגיעים מוואטסאפ, ולכן זה הערוץ הטבעי להתחיל ממנו.
זרימת ההודעה: הלקוח שולח הודעה → Green API שולח Webhook לשרת שלכם → הקוד שולף FAQ רלוונטי ושולח את השיחה למנוע השפה → התשובה נשלחת חזרה דרך sendMessage.
// תשובת הסוכן חוזרת ללקוח דרך Green API
import whatsAppClient from "@green-api/whatsapp-api-client";
const restAPI = whatsAppClient.restAPI({
idInstance: process.env.ID_INSTANCE,
apiTokenInstance: process.env.API_TOKEN_INSTANCE,
});
await restAPI.message.sendMessage(
"972500000000@c.us", // chatId של הלקוח
null,
replyFromAI // הטקסט שחזר מ-Claude או מ-OpenAI
);
טיפ: ב-Green API מזהים נמענים בתבנית
<number>@c.us(לדוגמה972500000000@c.us). בטלגרם, ה-Bot API הרשמי נותן Webhook מובנה ללא צורך בסריקת QR.
שלב 4: הוספת MCP ל-CRM לשמירת דיאלוגים
הגדירו שרת MCP שחושף פעולה כמו "שמור שיחה" ל-CRM (Notion, Airtable או טבלה ב-Supabase). כך הסוכן מתעד כל דיאלוג אוטומטית — בסיס לניתוח, לאיטרציה ולמעקב אחר פניות שדורשות טיפול אנושי. בלי לוג מסודר אי אפשר לדעת אילו שאלות הסוכן נכשל בהן.
// הגדרת כלי (tool) שהסוכן יכול לקרוא לו
{
"name": "save_conversation",
"description": "שומר דיאלוג לקוח ב-CRM לצורך מעקב וניתוח",
"input_schema": {
"type": "object",
"properties": {
"customer_id": { "type": "string" },
"summary": { "type": "string" },
"needs_human": { "type": "boolean" },
"topic": { "type": "string" }
},
"required": ["customer_id", "summary"]
}
}
- סמנו פניות להסלמה. השדה
needs_humanמאפשר לסנן אוטומטית שיחות שדורשות נציג אנושי. - Notion או Airtable כ-CRM קל. לעסקים קטנים, טבלה ב-Notion/Airtable מספיקה כ-CRM ראשוני — ושתיהן מתחברות דרך MCP.
- שדה נושא (topic). תיוג הנושא בכל שיחה בונה תמונה אילו שאלות חוזרות הכי הרבה — מידע זהב לשיפור ה-FAQ.
שלב 5: בדיקה ואיטרציה לפי שיחות אמיתיות
אספו את השיחות שנשמרו, סמנו תשובות שגויות או "קרות", ועדכנו בהתאם את ה-System Prompt ואת ה-FAQ. סוכן לא "מסיים" להיבנות בהשקה — הוא משתפר עם כל גל שיחות, והנתונים ששמרתם בשלב 4 הם בדיוק החומר לכך.
- אסוף. קחו 50–100 שיחות אמיתיות מה-CRM.
- סווג. סמנו כל תשובה: נכונה / שגויה / טון לא מתאים / הוחמצה הסלמה.
- תקן. כל כשל חוזר → שורה חדשה ב-FAQ או תיקון ב-System Prompt.
- חזור. הריצו שוב על אותן שיחות וודאו שהתיקון עבד בלי לשבור דברים אחרים.
הנתונים תומכים: לפי Gartner/Freshworks סוכני AI מסננים מעל 45% מהפניות הנכנסות (בקמעונאות ותיירות מעל 50%), ולפי McKinsey העלות לשיחה יורדת בכ-50% במוקדים שהטמיעו סוכנים. אך לפי ISG, כ-75% מהלקוחות עדיין מעדיפים נציג אנושי בנושאים מורכבים — לכן הסלמה חלקה לאדם היא חלק מהמערכת, לא תקלה בה.
טעויות נפוצות שכדאי להימנע מהן
- לתת לסוכן "להמציא". בלי הנחיה מפורשת נגד זה, מודל ינסה לענות גם כשאין לו מידע. אסרו זאת ב-System Prompt.
- לשכוח את נתיב ההסלמה. סוכן בלי "כפתור מילוט" לאדם מתסכל לקוחות ברגעים הרגישים.
- להשיק ולשכוח. בלי לולאת איטרציה על שיחות אמיתיות, איכות הסוכן נתקעת ברמת ההשקה.
שורה תחתונה
סוכן AI לשירות לקוחות בעברית הוא היום בהישג יד של כל עסק קטן-בינוני: ארבעה רכיבים (Claude, Supabase, MCP, Webhook), חמישה שלבים, ולולאת איטרציה שמשפרת אותו עם הזמן. הסוד הוא לא הטכנולוגיה אלא איכות בסיס הידע, טון נכון ב-System Prompt, ונתיב הסלמה חלק לאדם. התחילו קטן: FAQ בסיסי, ערוץ אחד (וואטסאפ), והרחיבו לפי השיחות האמיתיות.
להמשך: מה זה סוכן AI ואיך בונים אחד · המדריך המלא ל-MCP בעברית · אוטומציות AI לעסקים · קורס Claude Code בחינם