ניהול מכסות Gemini ב-Google Workspace - המדריך המלא לשיטת המכסות החדשה

בזמן האחרון ייתכן שנתקלתם בחשבון ה-Workspace בהודעות על הגעה למגבלת שימוש ב-Gemini, או שהרגשתם שה-AI 'נעצר' באמצע משימה. זה לא תקלה ולא משהו שעשיתם לא נכון - מדובר בשינוי מהותי באופן שבו גוגל מנהלת את השימוש ב-Gemini. במדריך הזה נסביר בדיוק מה היה, מה השתנה, איך המערכת באמת עובדת, ומה אפשר לעשות כדי לעבוד בצורה חכמה ולא להיתקע.

מה היה עד עכשיו

כשגוגל השיקה את יכולות ה-Gemini בתוך Workspace, היא הגדירה את השימוש תחת מדיניות 'שימוש הוגן' (Fair Use). בפועל, בתקופת ההטמעה גוגל לא אכפה מגבלות בצורה קשיחה - כדי לאפשר לעסקים להתנסות ולהכיר את הכלים. התוצאה הייתה תחושה של שימוש כמעט בלתי מוגבל, וזה בדיוק מה שיצר ציפייה שקשה היה לעמוד בה לאורך זמן.

מה השתנה (מאי 2026)

במהלך מאי 2026 גוגל עברה לשיטת מכסות חדשה לחלוטין - מודל מבוסס משאבי חישוב (Compute-based). במקום לספור 'כמה פעמים השתמשת', המערכת מודדת כמה משאבי חישוב כל בקשה צורכת בפועל. בקשה פשוטה צורכת מעט, ובקשה כבדה (קובץ גדול, מסמך ארוך, ניתוח וידאו, משימת קוד מורכבת) צורכת הרבה יותר.

בנוסף, המודלים שודרגו לדור Gemini 3 - מודלים חזקים בהרבה שמסוגלים לעבד כמויות מידע עצומות, אבל גם 'צורכים' מכסה בקצב מהיר יותר כשמטילים עליהם משימות כבדות. השילוב הזה הוא הסיבה שמשתמשים שהיו רגילים לשימוש חופשי פתאום נתקלו בקיר.

איך המכסה באמת מחושבת

חשוב להבין שלוש נקודות מרכזיות שמפזרות אי-הבנות נפוצות:

  • המכסה היא אישית, לא משותפת לארגון. בניגוד למה שלפעמים חושבים, אין 'קופה אחת' שכל המשתמשים בארגון חולקים. המגבלה מחושבת לכל משתמש בנפרד. כלומר משתמש אחד שמבצע משימות כבדות לא 'שורף' את המכסה של כל השאר.
  • שלושה גורמים קובעים את הצריכה: מורכבות הבקשה, המודל שבו משתמשים, ואורך השיחה (כמה הקשר המערכת צריכה לקרוא מחדש בכל פנייה).
  • המכסה מתאפסת כל 5 שעות, עד תקרה שבועית. כלומר גם אם הגעתם למגבלה, היא מתחדשת באופן מתגלגל - אין צורך לחכות ימים.

ההתאמות שגוגל הכניסה אחרי תלונות

השינוי הראשוני יצר תסכול אצל משתמשים כבדים, וגוגל הגיבה עם כמה תיקונים חשובים:

  • הגבלת צריכה לבקשה בודדת: גוגל הגבילה כמה מכסה בקשה אחת יכולה 'לשרוף' (במודל Gemini 3.1 Pro), כדי שמשימה כבדה אחת לא תרוקן את הכל בבת אחת.
  • בקשות שנכשלו לא נספרות: אם בקשה נכשלת, היא כבר לא נגרעת מהמכסה שלכם.
  • המודל הקל הפך לחינמי: בקשות במודל Gemini 3 Flash-Lite אינן נספרות במכסה כלל. זו נקודה קריטית לייעול, כפי שנפרט בהמשך.
  • יותר שקיפות: גוגל הוסיפה פירוט שימוש והתראות ברורות יותר.

המודלים הזמינים וחלונות ההקשר

כל הדרגות (כולל החינמית) ניגשות לאותה משפחת מודלים: Gemini 3 Flash-Lite (קל ומהיר), Gemini 3 Flash (מאוזן), ו-Gemini 3 Pro (החזק). ההבדל המרכזי בין הדרגות הוא גודל המכסה וגודל חלון ההקשר (כמות המידע שאפשר להזין בבת אחת):

  • ללא חבילת AI: מכסה בסיסית, חלון הקשר עד 32K טוקנים.
  • AI Plus: מכסה כפולה, חלון הקשר עד 128K טוקנים.
  • AI Pro: מכסה גדולה פי 4, חלון הקשר עד מיליון טוקנים.
  • AI Ultra: מכסה גבוהה משמעותית (פי 5 עד פי 20 מ-Pro), חלון הקשר עד מיליון טוקנים.

שיטות עבודה מומלצות - איך לא להיתקע

1. הפרידו בין משימות פשוטות למורכבות

לא כל שאלה דורשת את המודל החזק ביותר. לשאלות כלליות, ניסוח מיילים פשוטים או סיעור מוחות - השתמשו ב-Gemini 3 Flash-Lite. מאחר שהוא אינו נספר במכסה, זה החיסכון המשמעותי ביותר שתוכלו לעשות. שמרו את המודל החזק (3 Pro) למשימות שבאמת דורשות אותו: ניתוח קבצי Sheets של החברה, סיכום מסמכים ארוכים, שליפת מידע מ-Gmail הארגוני או עבודה על קוד.

2. פתחו שיחות חדשות לעיתים קרובות

כל פנייה בשיחה ארוכה גורמת למערכת לקרוא מחדש את כל היסטוריית השיחה - וזה צורך מכסה משמעותית. סיימתם משימה? פתחו שיחה חדשה (New Chat). אל תנהלו מספר פרויקטים שונים באותו חלון צ'אט.

3. צמצמו קבצים מצורפים

כשאתם מעלים קובץ Sheets או מסמך, העלו רק את הלשוניות או העמודים הרלוונטיים למשימה הנוכחית. קובץ ענק עם מידע היסטורי מיותר צורך מכסה הרבה יותר גדול - גם אם אתם שואלים שאלה קטנה.

אפשרויות ברמת הניהול

אם אחרי יישום ההמלצות העסק עדיין מגיע לגבול באופן קבוע, יש שני צעדים אפשריים:

  • בדיקת ניצול ב-Admin Console: מנהל המערכת יכול לראות דוחות שימוש לפי אפליקציה ולפי משתמש, ואף היסטוריית פעילות פר-משתמש. כך אפשר לזהות מי צורך את רוב המכסה ולייעל את העבודה מולו. אנחנו ב-Koogler יכולים לבצע עבורכם את הבדיקה הזו.
  • שדרוג מכסה: ניתן להוסיף את תוסף ה-AI Expanded Access, שמרחיב את המכסות, מוסיף יכולות הפקת תמונות מתקדמות (Nano Banana Pro) ויכולות היסק משופרות. שימו לב: תוסף ה-AI Ultra Access הישן הופסק ולא ניתן לרכישה חדשה, והוא יוסר מחשבונות Workspace החל מ-7 ביולי 2026.

שורה תחתונה

המעבר למודל מבוסס חישוב אינו 'הרעה' - הוא פשוט דורש עבודה חכמה יותר. שימוש במודל הקל למשימות פשוטות, פתיחת שיחות חדשות וצמצום קבצים מיותרים יחזירו לכם את תחושת השימוש החופשי, גם תחת המכסות החדשות. לכל שאלה או לבדיקת נתוני השימוש שלכם בחשבון - אנחנו כאן.

icon

לסיכום

הסיפור בקצרה: בתקופת ההטמעה גוגל לא אכפה מגבלות על Gemini ב-Workspace, וזה הרגיש בלתי מוגבל. במאי 2026 עברה גוגל לשיטת מכסות מבוססת משאבי חישוב (Compute-based) - בקשות כבדות צורכות יותר. המכסה אישית (לא משותפת לארגון), מושפעת ממורכבות הבקשה, המודל ואורך השיחה, ומתאפסת כל 5 שעות עד תקרה שבועית.

מה לעשות: השתמשו במודל הקל Gemini 3 Flash-Lite (לא נספר במכסה) למשימות פשוטות, שמרו את Gemini 3 Pro למשימות כבדות, פתחו שיחות חדשות לכל פרויקט, והעלו רק קבצים רלוונטיים. ברמת הניהול - ניתן לבדוק ניצול ב-Admin Console או להוסיף את תוסף AI Expanded Access.

WhatsApp