פוקר הוא משחק מאוד מורכב, כמה מורכב?
בדמקה למשל יש 500 קווינטריליון (18 אפסים) מהלכים אפשריים, נשמע הרבה אבל בעידן המחשוב הנוכחי זה לא אתגר אמיתי למחשב עם כח עיבוד משמעותי. בשחמט מנגד, יש 10 בחזקת 47 מהלכים אפשריים, הרבה יותר מורכב מדמקה כמובן והמשחק, בדומה לפוקר, לא פוצח לחלוטין אך כבר בסוף שנותה-90 המחשבים הפכו לטובים יותר מהשחקנים הטובים ביותר. כמה מהלכים אפשריים יש בפוקר?
זה תלוי איך סופרים, כמה שחקנים ואיזו ווריאציה של פוקר משחקים. בווריאציה יחסית פשוטה של Heads up no-limit holdem יש 10 בחזקת 160 מהלכים אפשריים. כל שחקן נוסף מגדיל את המספר הזה בצורה משמעותית.
הסיבה המרכזית למורכבות הרבה זו האפשרות להמר בכל סכום שהוא החל מבליינד אחד ועד אול אין בכל צומת החלטה במשחק.
כדי לצמצם את כמות האפשרויות ולהפוך את משחק ה-No Limit לפתיר משתמשים בטריק קטן והוא הגבלת מספר אפשרויות ההימור בכל סיבוב. במקום לתת למחשב אפשרות להמר כל סכום החל מבליינד אחד ועד סך הבליינדים בערימה מגבילים את המחשב לשתיים עד ארבע אופציות בלבד. זה מייצר כמובן תוצאות שאינן ברמת מאה אחוז דיוק אך עדיין ברמה מספיק גבוהה שאף בן אנוש לא יכול לנצח.
איך הכל התחיל
בשנת 2005 פוצח משחק הדמקה באופן סופי וחד משמעי, כלומר שבכל צומת החלטה המחשב ידע לתת את המהלך האופטימלי ביותר וגם אם ניקח את המחשב המשוכלל ביותר שקיים היום, לא יהיה לו שום יתרון מול המחשב שפיצח את המשחק לפני 17 שנים.
נלך אחורה כמה שנים לשנת 1997, השנה בה המחשב כחול עמוק ניצח את גארי קספרוב בשחמט. החל מרגע זה למעשה ניתן לומר שמשחק השחמט פוצח בפועל גם אם לא באופן אבסולוטי. כלומר כבר מעל ל25 שנה קיימים מחשבים שמנצחים את מיטב המוחות האנושיים אך המחשבים עדיין ממשיכים להשתכלל וסביר להניח שלא מעט סולברים למשחק השחמט שזמינים היום חינם באינטרנט ינצחו את כחול עמוק שהיה קצה הטכנולוגיה לפני 25 שנה.
פיצוח משחק הפוקר גם התבצע בשלבים. בשנת 2015 פורסם הסולבר הראשון לווריאציית הלימיט הולדם שהוא כאמור משחק שיותר קרוב במורכבותו לדמקה. בשנת 2017 אוניברסיטת קרנגי מלון פיתחה סולבר ל- HUNLH שהיה מספיק טוב לנצח כל יריב אנושי באתגר של מעל מאה אלף ידיים.
מאז התחום ממשיך להתפתח ועוד ועוד סולברים יצאו לשוק כאשר גם רמת הפיצוח שלהם השתכללה וגם העלויות ירדו בצורה משמעותית מה שגרם לכך שכל שחקן מקצועי שמכבד את עצמו וגם חובבנים רבים משתמשים בסולבר כדרך קבע על מנת ללמוד ולשפר את רמת המשחק שלהם.
יש היום מספר סולברים פופולרים, המוביל הוא Pio Solver שמאפשר להריץ סימולציות מאוד מורכבות וגם לנעול אסטרטגייה שאינה אופטימלית כדי לחשב מהי האסטרטגיה הנצלנית הטובה ביותר.
רב הדוגמאות שאני פה הם מתוכנה שנקראת Solver+, זהו סולבר עם מיליוני פתרונות על בסיס Pio Solver על בסיס טווחים וגדלי הימורים קבועים מראש ושאינם גמישים על מנת להאיץ את קבלת התשובה.
ב-pio למשל ניתן לשחק עם הטווחים, כמות הבליינדים ואפשרויות ההימור ולקבל את הפתרון הטוב ביותר בהתאם למשתנים אלו, אנחנו נדבק עם הטווחים המומלצים וגדלי ההימור המומלצים ונתמקד במאה בליינדים על מנת לפשט את המורכבות הגבוהה של תוצאות המחשב.
אם המחשבים טובים יותר מבני אדם האם זה לא הסוף של משחק הפוקר?
מגנוס קרלסון שחקן השחמט בעל הרייטינג ELO (שיטת הדירוג בשחמט) הגבוה ביותר אי פעם (בערך 2900) לא מתקרב ביכולותיו למנוע השחמט סטוקפיש שמוערך ב-ELO של 3500. זהו הבדל עצום. אם כך, מחשבים הרבה יותר טובים מבני אדם בשחמט כבר שנים רבות ועדיין משחק השחמט פופולרי יותר מאי פעם. בסופו של דבר בני אדם מתחרים מול בני אדם והמחשב מאפשר לנו להשתפר ולהגיע לרמות חדשות במשחק שלא יכלנו להגיע אליהן לפני כן.