GTO Vs Exploitative
יש שתי גישות מרכזיות למשחק הפוקר, הגישה הנצלנית והגישה האופטימלית (GTO = Game Theory Optimal).
בגישה הנצלנית אנו נתרכז בלאתר חולשות באסטרטגיה של היריב ונתאים את האטסרטגיה שלנו על מנת לנצל את חולשות אלו בצורה המירבית.
בגישה האופטימלית אנו נשחק אסטרטגיה שאינה מושפעת כלל מהיריב ושאינה ניתנת לניצול. במילים אחרות לא מעניין אותנו מה היריב עושה, אנחנו בכל מקרה לא נפסיד.
מבלי להכנס לעומקה של תורת המשחקים יש כמה מושגי מפתח שקל להבין וכדאי מאוד להכיר:
משחק סכום אפס
משחק שבו רווח של צד אחד בא על חשבון הפסדו של הצד האחר. שחמט, דמקה ושש-בש הם משחקי סכום אפס. פוקר הוא גם משחק סכום אפס עם כוכבית קטנה ושמה רייק. כאשר גובים רייק פר יד (נפוץ באונליין ובבתי קזינו) או פר שעה (נפוץ בבתי קזינו, כמעט ולא קיים אונליין) פוקר הופך למעשה למשחק עם ערך נטו שלילי, כלומר אם שני שחקנים מושלמים ישחקו אחד נגד השני בסופו של דבר שניהם יפסידו כסף והמרוויח היחידי יהיה הקזינו.
נקודת שיווי משקל נאש
כאשר שני שחקנים (או יותר) בוחרים באסטרטגיה אשר כל שינוי ותזוזה מאסטרטגיה זו יניב תוצאות פחות טובות מתקיימת נקודת שיווי משקל. לדוגמה נקח בועט פנדלים ושוער כדורגל ולצורך הפשטות נניח שלבועט יש רק שתי אופציות, לבעוט ימינה או שמאלה, ולשוער יש רק שתי אופציות, לזנק ימינה או שמאלה. נניח שאם השוער מזנק נכון הוא עוצר את הכדור. במידה והכדור נכנס לשער בועט הפנדל זוכה בנקודה ובמידה והשוער הודף השוער זוכה בנקודה.
האסטרטגיה הטובה ביותר מנקודת מבטו של הבועט היא לבעוט באופן רנדומלי 50% מהזמן ימינה ו50% מהזמן שמאלה ומנקודת מבטו של השוער האסטרטגיה הטובה ביותר תהיה לזנק 50%/50% ימינה ושמאלה באופן רנדומלי.
במידה ובועט הפנדלים יבחר באסטרטגיה בה הוא בועט 60% מהפעמים שמאלה הוא פותח את עצמו לניצול על ידי השוער שיכול לזהות את הנטייה של בועט הפנדלים להתאים את האסטרטגיה שלו על ידי זינוק שמאלה בתדירות גבוהה יותר ובכך לעצור יותר בעיטות לשער.
באותה מידה, במידה והשוער יבחר באסטרטגיה שבה הוא מזנק לאחד הצדדים בתדירות גבוהה יותר הוא חושף את עצמו לניצ…….. קיצר הבנתם את הרעיון.
אסטרטגיה אופטימלית כפי שאני מכנה אותה בבלוג הזה, או GTO כפי שמכונה באנגלית, אלו פשוט מושגים שונים לתאר את מה שהוא למעשה נקודת שיווי המשקל של נאש.
עקרון האדישות
כאשר שחקן בוחר באסטרטגית שיווי משקל הוא אדיש לחלוטין למה היריב עושה. כאשר השוער שלנו מזנק באופן רנדומלי 50%/50% ימינה ושמאלה לא אכפת לו האם הבועט שמולו משחק באסטרטגיה אופטימלית או לא, ולא אכפת לו אם השחקן שמולו בעט ימינה או שמאלה, השוער פשוט לא יכול להפסיד עם האסטרטגיה הזו. באותה מידה השחקן שמנגד אדיש לפעילותיו כי לא משנה אם יבעט ימינה או שמאלה בסופו של דבר הוא יגיע לאותו מספר נקודות.
במשחק הפוקר האסטרגיה האופטימלית כמובן הרבה יותר מורכבת אך העקרונות זהים. במידה ובריבר למשל נשמור על תדירות נכונה של בלופים והימורי ערך אנחנו נהיה אדישים להאם היריב השווה לנו או קיפל כי לכל היותר מעשיו של היריב יובילו אותו לשוויון מולנו וכל סטייה של היריב מהאסטרטגיה האופטימלית תוביל אותו להפסד ואותנו לניצחון. במילים אחרות, אם אנחנו משחקים פוקר אופטימלי, בין אם היריב השווה לנו או קיפל הוא כבר הפסיד.
איזון
איזון הוא מונח שקשור ישירות לעקרון האדישות. על מנת להבטיח אדישות על השחקן לרכז את מאמציו בלהבטיח שהוא מאוזן בכל פעולותיו, בתדירות הנכונה ובצורה רנדומלית שאינה ניתנת לניצול. במשחק אבן נייר ומספריים למשל על מנת לשחק בצורה אופטימלית על השחקן לוודא שהוא מחלק את בחירותיו בין אבן נייר ומספריים ל-33.33% לכל בחירה ובצורה רנדומלית על מנת שהיריב לא יוכל לזהות דפוסים ולחזות את הבחירה הבאה.
במשחק הפוקר, על השחקן לוודא שהוא מעלה, משווה, מקפל או מצ'קצ'ק עם הקלפים הנכונים מתוך הטווח שלו, משלב יחס נכון של בלופים והימורי ערך ובנוסף במקרים בהם יש אסטרטגיה משולבת עליו לאזן בין המהלכים הנכונים בתדירות הנכונה.
אסטרטגיה משולבת מתבצעת במקרים בהם עומדות בפנינו שתי אופציות עם תוחלת זהה, למשל אנו מחזיקים זוג נסיכים, העלינו לפני הפלופ, הכפתור השווה והפלופ הוא J44 ריינבאוו. אנחנו יושבים עם יד מפלצת, נשאר עוד נסיך אחד בחפיסה, אין לשחקן בכפתור הרבה רביעיות בטווח הידיים שלו וגם אין לו זוגות גבוהים. במצב כזה יש לשלב בין בחירות שונות של רייז או צ'ק, לכל אופציה יש את התדירות הנכונה שלה (במקרה הזה, תלוי בפוזישן בערך 75% רייז ו25% צ'ק). אף על פי שלשתי האופציות יש תוחלת זהה אנחנו חייבים לשחק באסטרטגיה משולבת על מנת שלא לחשוף את עצמנו לניצול. במידה ולעולם לא נעלה בנקודה הזו היריב שלנו ידע שכאשר אנחנו בוחרים ברייז אנחנו מוגבלים בחוזק היד שלנו כי לא יכול להיות שיש לנו זוג נסיכים ביד, במידה ותמיד נעלה אז ליריב שלנו יהיה הרבה יותר קל לתקוף אותנו כאשר נעשה צ'ק.
איך יודעים מהו המהלך הנכון ומה התדירות הנכונה? עוד נגיע לזה.
עוד כמה נקודות ששווה לציין בשלב הזה:
- אסטרטגיה אופטימלית מונעת ניצול ומבטיחה ניצחון כנגד יריב שאינו אופטימלי, היא אינה מבטיחה ניצחון מקסימלי. האסטרטגיה שתביא לתוצאות מירביות היא דווקא אסטרטגיה שמנצלת למקסימום את שגיאות היריב.
- מנגד, כאשר סוטים מהאטסרטגיה האופטימלית על מנת למקסם תוצאות אנו חושפים את עצמנו לניצול על ידי היריב. תאורטית, יריב משוכלל יתאים את עצמו לשגיאות שלנו, אנו נתאים את עצמינו לשגיאות שלו וחוזר חלילה עד ששני השחקנים יתכנסו לאסטרטגיה אופטימלית ולא יסטו ממנה.
- על כן יש שרואים בגישה האופטימלית אסטרטגיה הגנתית ובגישה הנצלנית כאסטרטגיה התקפית.
- אסטרטגיה אופטימלית בפוקר היא דבר מורכב ביותר וגם המחשבים החזקים ביותר לא משחקים בצורה אופטימלית במאה אחוז אלא בקירוב מספק כך שמבחינה פרקטית אף בן אנוש לא יכול לנצח אותן.
- באסטרטגיה נצלנית מתרכזים בלאתר חולשות באסטרטגיית היריב ולנצל אותן, באסטרטגיה אופטימלית מתרכזים באיזון.
אז איזו שיטה טובה יותר?
אין כזו ומומלץ שלא לחשוב בצורה של מי טובה יותר. מדובר בשיטות שמשלימות זו את זו ולכל אחת יש את הזמן והמקום שלה. מול שחקן לא מוכר ייתכן ונכון להתחיל באסטרטגיה אופטימלית ובמידה ומזהים חולשות ניתן לעבור לאסטרטגיה יותר נצלנית. עם זאת מול ביריב ברמה גבוהה ובעל יכולת לאתר חולשות באסטרטגיה אותה אנו מיישמים ולנצל אותן ייתכן ועדיף לדבוק באסטרטגיה האופטימלית. מבחינת תורת המשחקים, אסטרטגיה נצלנית מקסימלית (אסטרטגיה שמטרתה למקסם תוצאות ולא למנוע ניצול) היא בעצם האסטרטגיה האופטימלית כנגד החולשות הספציפיות של היריב, וכדי לדעת כיצד לבנות אסטרטגיה נצלנית מקסימלית צריך לדעת קודם מה היא האסטרטגיה האופטימלית כנגד יריב אופטימלי.
כאשר בוחנים את השחקני הפוקר המובילים בעולם רואים שהטובים ביותר משחקים מאוד מאוד קרוב לאסטרטגיה אופטימלית, במיוחד כאשר הם נאבקים אחד בשני יש שחקנים בטופ שמסתפקים בזה וזהו ויש שחקנים שמשחקים אסטרטגייה אופטימלית ועדיין סוטים ממנה כאשר הם רואים הזדמנות טובה לניצול.