דוגמאות לעקרונות המשחק האופטימלי ומילה על פשטות

ציינו בעבר שמבחינת המחשב, כל המידע שנדרש על מנת לייצר אסטרטגיה בלתי שבירה הוא הפוזיציה, ה-SPR, והטווחים של כל שחקן וגם נגענו בעקרונות של כיצד כל אחד מהמרכיבים בנוסחה עשוי להשפיע על הפתרון, כדי להמחיש זאת נקח סיטואציות מאוד דומות כאשר בכל פעם נתמקד במשתנה אחר במשוואה ונראה כיצד כל אחד מהשינויים משפיע על הפתרון שהסולבר מספק לנו מבחינת תדירות ההימור וגובה ההימור.

כאמירה כללית חשוב לציין שהפתרונות שמייצרים לנו המחשבים יכולים להרתיע ובשלב הזה אין צורך להתעמק בפתרון עצמו אלא רק להבין כיצד העקרונות עליהם עברנו באים לידי ביטוי בדוגמה פרקטית, אז אם לא מבינים את כל הפתרון וההסברים או שדברים מסוימים נראים לנו מוזר זה ממש בסדר גמור.

בפוסט קודם ראינו כיצד על אותו לוח עם אותו טווח ידיים תדירות ההימור משתנה משמעותית בהתאם להאם אנו נמצאים בפוזיציה על היריב או שאנחנו מחוץ לפוזיציה. כעת נראה כיצד טווח הידיים שאיתם נכנסנו משפיע על תדירות ההימור בפלופ.

השפעת הטווח על האסטרטגיה

בצילומי מסך הבאים אנחנו רואים את הסיטואציה הבאה: אנחנו מעלים 2.5 בליינדים, הביג בליינד משווה, הפלופ נפתח 3s4s6c, הביג בליינג נותן צ'ק ועכשיו תורנו. מה שמשתנה הוא הטווח איתו אנו משחקים, פעם אחת נבחן את התשובה של הסולבר לטווח של השחקן UTG ופעם אחת לטווח של השחקן בכפתור. כלומר בשני המקרים ה-SPR זהה ועומד על 17.7, בשני המקרים אנחנו בפוזיציה ליריב שנמצא בביג בליינד ומה שמשתנה זה הטווח איתו פתחנו והטווח איתו משווה השחקן בביג בליינג.

כך נראים טווחי הפתיחה מעמדת UTG (מימין) ומעמדת הכפתור:

השחקן UTG פותח עם טווח מאוד מצומצם של כ-17% מהידיים ואילו השחקן בכפתור פותח עם טווח של כ-46% מהידיים.

זוהי תדירות ההימורים של שני הטווחים השונים מול אותו פלופ:

ההבדלים שאנו רואים הם שמבחינת תדירות הימור יש הבדל של פחות מאחוז (50.7% לעומת 49.6%, למעשה זהה) אך מעמדת הכפתור יש מיקס כמעט זהה בין גודל הימור קטן לגדול ולעומת זאת כאשר עם הטווח של השחקן UTG הסולבר מהמר כמעט אך ורק בקטן. מדוע?

נגענו בקצרה בפוסטים קודמים בקונספט של Nut Advantage וכיצד הוא קשור לקביעת גודל ההימור ובוודאי עוד נתעמק בנושא בעתיד אך לבינתיים תזכורת קצרה:

Nut Advantage הוא קונספט שבודק לאיזה שחקן יש יותר ידייים סופר חזקות בטווח שלו בהתאם לקלפים המשותפים שנפתחו. לשחקן שיש יותר ידיים סופר חזקות יש את ה-Nut Advantage וכלל אצבע ככל שהיתרון שלנו בידיים הסופר חזקות גדול יותר כך נבחר גודל הימור גבוה יותר.

בפלופ הספציפי הזה הידיים החזקות ביותר הן 57, 25 , זוג 6, זוג 4 וזוג 3. יש גם כמה Combo Draws עם אקוויטי מאוד גבוה כמו A5 עלה אבל נתעלם מהן כרגע.

השחקן UTG מגיע לפלופ הזה כשמבין כל הידיים החזקות ביותר יש לו חלק מהקומבינציות של זוג 4 ואת כל הזוג 6, וזהו. לעומת זאת לשחקן בכפתור יש את כל הזוג 6, ה-4 וה-3 ובנוסף 4 קומבינציות של הנאטס בפלופ – 57s. יש לציין שלא התחשבנו כרגע בטווח של השחקן בביג בליינד ולא ביצענו ניתוח מעמיק של ה-Nut Advantage שכולל גם לבדוק את שיעור הידיים החזקות מכלל הטווח וגם ידיים עם אקוויטי מאוד גבוה כמו A5s אבל בהחלט ניתן לראות כי עצם העובדה שבכלל יש לנו מבחינה מספרית יותר ידיים סופר חזקות בטווח שלנו זה מאפשר לנו להגדיל את גובה ההימור. במילים אחרות, במצב שבו כל התנאים האחרים זהים (SPR, פוזיציה ופלופ) הסולבר התאים את האסטרטגיה שלו בהתאם לטווחים השונים.

השפעת ה-SPR על האסטרטגיה

נתחיל עם כוכבית קטנה – בסולבר בו אני משתמש אין אפשרות לכפות טווחים לבחירתי החופשית אלא הטווחים מוכתבים מראש בהתאם לפוזיציה וכמות הבליינדים אך בחרתי בדוגמה שבה ההבדלים בין הטווחים ההתחלתיים היא זניחה (פחות מאחוז בודד). נבחן מצב שבו השחקן ב-Cutoff מעלה ל2.5 בליינדים, השחקן בביג בליינד משווה והפלופ יוצא TcJd8d. השחקן בביג בליינד נותן צ'ק ועכשיו תורו של השחקן בפוזיציה.

בחלק הימני של התמונה אנו רואים את הפתרון ל-200 בליינדים (כלומר SPR של 197.5/5.5 = 35.9) ובחלק השמאלי את הפתרון ל-100 בליינדים (SPR של 17.7).

כאשר מתחילים עם מאה בליינדים הסולבר מהמר בתדירות של כ-60% מהפעמים כאשר כמחציתם בגודל הימור קטן. לעומת זאת כאשר ה-SPR גבוה יותר הסולבר מקטין את תדירות ההימור ל-50% אבל במקביל גם בוחר לרב בהימורים גבוהים יותר. כלומר ככל שה-SPR גבוה יותר אנחנו נוטים להמר בתדירות נמוכה יותר ומנגד להמר יותר בגדול, ככל שה-SPR נמוך יותר אנחנו נהמר בתדירות גבוהה יותר ונבחר בגובה הימור נמוך יותר.

כדי להמחיש עוד את הנקודה הזו לקחתי דוגמה של טווח מאוד קרוב לטווח של הדוגמה למעלה במצב של 20 בליינדים (SPR נמוך מאוד של 3.2) וזוהי התשובה של הסולבר:

המגמה ממשיכה, ב-SPR נמוך מאוד תדירות ההימור גדלה וגודל ההימור שנבחר קטן. נכון שיש מעט הבדל בטווחים (פחות מאחוז) ונכון שהדוגמה הזו היא מטורניר ולא קאש ולכן הרייק אינו נלקח בחשבון אבל המגמה כל כך מובהקת שזה יותר ממספיק כדי להמחיש את הנקודה ולהבין את העיקרון המאוד חשוב של כיצד SPR משפיע על תדירות וגובה ההימור.

לסיכום הדוגמאות, כבר למדנו את העקרונות החשובים הבאים:

בפוזיציה נהמר בתדירות גבוהה יותר ובקטן יותר, מחוץ לפוזיציה נקטין את תדירות ההימור ונגדיל את גובה ההימור.
ככל שה-SPR גדל נקטין את תדירות ההימור ונבחר בהימורים גדולים יותר. ככל שה-SPR קטן נהמר בתדירות גבוהה יותר אך בקטן ביותר.
ככל שהטווח שלנו מכיל יותר ידיים מאוד חזקות נבחר להמר יותר בגדול, ככל שהטווח שלנו מוגבל יותר נהמר בקטן יותר.

כמובן שזוהי רשימה חלקית ויש המון מקרים בהם יש התנגשות בין העקרונות אך מספיק שתתבוננו סביבכם ביום חמישי הקרוב במשחק השבועי עם החבר'ה ותשימו לב עד כמה רובם משחקים בניגוד גמור לעקרונות יסוד הללו וזה ייתן לכם מושג איזה יתרון ענק ניתן להשיג על ידי לימוד המשחק לעומק.

מילה על פשטות

כפי שכבר ניתן לשים לב, זה בלתי אפשרי לשחק בצורה אופטימלית במאה אחוז. לא ניתן לשנן או לחשב בראש למשל שבלוח 975 תדירות ה-C-bet צריכה להיות 48 אחוז וב974 54% או שבאותו לוח צריך להעלות עם A2 יהלום 78% אחוז מהפעמים ועם A3 יהלום 32% משום מה. ומה קורה כנגד הימור של חצי קופה לעומת 67% קופה? ומה אם יש לנו 145 בליינדים ולא 100 או 200? ובכלל עוד לא ראינו איך התדירות הזו מתחלקת לידיים ספציפיות שזה בכלל אלוהים ישמור.

לא רק שאף בן אנוש לא מסוגל לשחק ככה אפילו המחשבים לא משחקים אסטרטגיה אופטימלית במאה אחוז – בכולם מריצים סימולציות עם כמות מוגבלת של גודל הימורים, בחלקם מריצים סימולציות רק על מדגם מייצג של הקלפים המשותפים בצורה שתספק תוצאה מספיק טובה ועוד כל מיני פשרות קטנות למיניהן.

כל פשרה כזו משפיעה על הדיוק וזה ניתן למדידה באובדן EV. ככל שמתרחקים יותר מהאסטרטגיה האופטימלית כך אובדן ה-EV גבוה יותר (ההפרש נקרא לעיתים Nash Distance). לרב, הסולברים מגיעים לאובדן EV של שברירי אחוזים או שברירי BB/100 hands, ובסולברים המתקדים יותר אף ניתן לבחור אסטרטגיה משלנו והסולבר יגיד לנו מהו אובדן ה-EV שלנו לעומת האסטרטגיה האופטימלית.

כפי שאנחנו עושים הנחות לסולבר ומפשטים לו חלק מהנתונים אנחנו צריכים לעשות אותו דבר ובצורה יותר גסה כאשר אנחנו בונים לעצמנו אסטרטגיית משחק. המטרה בלימוד תוצאות הסולבר היא לנסות להבין את הסיבות לכך שהסולבר עושה מה שהוא עושה ואז לייצר שילוב של עקרונות וכללי אצבע שניישם בפועל.

למשל דיברנו בפוסט קודם בקצרה על הדונק-בט בפלופ. זהו מהלך שהסולבר מבצע בתדירות של פחות מ-2% מהמקרים ב-SPR בינוני וכמעט אף פעם ב-SPR גבוה. במקום להשקיע בללמוד את מקרי הקצה שבהם כדאי לבצע דונק בט בפלופ אנו יכולים להגדיר כלל אצבע מאוד פשוט והוא – לעולם לא לבצע דונק בט בפלופ במשחק קאש של מאה בליינדים ומעלה. אובדן ה-EV יהיה שברירי אחוזים לעומת מחשב ולמעשה אפס כנגד כל בן אנוש.

לא תמיד נוכל לפשט את האסטרטגיות GTO לכללי אצבע מאוד חדים וברורים אך העקרון זהה. קיים מתח מובנה בין רמת הדיוק בלימוד פתרונות הסולבר מצד אחד לבין יכולת היישום של האסטרטגיה מצד שני. מכיוון שאין לנו יכולת לשנן פתרונות אינסופיים אנחנו תמיד נדרש לפשרות לאורך הדרך, אסטרטגיה פשוטה יותר שנדע ליישם באפקטיביות בזמן אמת עדיפה עשרות מונים על אסטרטגיה מדויקת יותר שאנחנו מיישמים באופן חלקי לכן כאשר אנחנו נבחן פתרונות ננסה לא בהכרח לשנן את הפתרון אלא:

לבחון את הפתרון לאור העקרונות אשר דיברנו עליהם עד כה ונדבר עוד בעתיד על מנת לנסות ולהבין את הפתרון ולא לשנן אותו.
לזהות דפוסים שחוזרים על עצמם ולאורך זמן לצבור ארסנל של כלים חדשים.
לבנות אסטרטגיה משלנו, קרובה ככל האפשר לפתרון האופטימלי אך פשוטה מספיק על מנת שנדע ליישם אותה בזמן אמת.

גם ליישם אסטרטגיה פשוטה באופן יחסי זה אתגר קשה ביותר בפני עצמו, אין צורך להפוך את זה לבלתי אפשרי.

כתיבת תגובה ביטול התגובה