Deze AI-bot laat poker professionals folden in Texas Hold’em (Dutch Cowboys)

Bron: 

Eerder dit jaar hebben een heel aantal professionele poker spelers deelgenomen aan een ongewoon potje Texas Hold’em. Ze namen het op tegen een nieuwkomer: een door kunstmatige intelligentie aangedreven poker-spelende bot.

AI Pokerbot

Eerder al hebben we gezien dat AI niets heel laat van professionele spelers van ondermeer schaken en Go. Deze bordspellen beschikken over duidelijke regels. Dat heeft Poker ook. Maar daar komt toch wat meer bij kijken. Zo weet je (zolang je niet Daniel Negreanu bent) niet de hand van je tegenstander. En er is de mogelijkheid om je tegenstander weg te bluffen. Daarnaast kan een potje ook bestaan uit meer dan twee of meer spelers, zes zelfs in dit geval.

Voor de poker-spelende bot Pluribus was dit geen probleem. De tegenstanders, waaronder World Series of Poker & World Poker Tour winnaars hadden geen schijn van kans. Onderzoekers noemen de prestaties van de bot nu dan ook bovenmenselijk.

Facebook schrijft hierover in een blogpost: “Dit is de eerste keer dat een AI-bot in staat is om topprofessionals te verslaan in een belangrijk benchmarkspel met meer dan twee spelers (of twee teams).”

Dat is al erg tof voor het spel poker, maar zulke kunstmatige intelligentie kan natuurlijk veel breder worden toegepast. Denk bijvoorbeeld aan politieke campagnes of online veilingen. Ook daar is er sprake van meerdere betrokkenen en een groot gapend gat aan onbekende informatie. Volgens wetenschappers kan kunstmatige intelligentie bedrijven helpen om met de beste strategie per situatie te komen.

Twee experimenten

Er zijn voor het poker-onderzoek uiteindelijk twee experimenten opgezet. Eentje waarin één persoon pokerde tegen vijf kloons van Pluribus en eentje waarin het juist vijf mensen waren die het opnamen tegen één Pluribus. De onderzoekers konden er niet omheen: beide partijen werden gewonnen door Pluribus.

De kunstmatige intelligentie nam het bovendien niet op tegen de minste spelers: Darren Elias en Chris “Jesus” Ferguson. Dit zijn beide Amerikaanse pro-spelers die elk 5.000 handen speelden tegen vijf kopieën van de bot. Ze speelden vanaf hun thuis-pc’s en konden ook echt wat winnen: 2.000 euro werden ze betaald om mee te doen en ze konden ook nog 2.000 euro winnen als ze van de bot wisten te winnen. Helaas: Pluribus won met een gemiddelde van 32 milli big blinds (dit is een maatstaf binnen het poker om te bepalen wie het beste presteert).

In het andere experiment werden 13 spelers die allemaal wel eens meer dan 1 miljoen dollar hadden gespeeld, uitgedaagd. Pluribus speelde 12 dagen op een rijtje tegen vijf menselijke spelers tegelijk en speelde daarin meer dan 10.000 handen. Hier won Pluribus gemiddeld 48 milli big blinds per spel. Die lange speelduur was nodig om echt te kunnen vaststellen dat het niet om geluk ging.

Oefening baart kunst

Pluribus had wel wat geoefend: het ontdekte de beste strategie voor Texas Hold’em door tegen kopieën van zichzelf te pokeren. Dankzij een nieuw algoritme kon de kunstmatige intelligentie bovendien steeds een paar stappen van tevoren bedenken wat het zou doen, in plaats van achteraf. De bot speelde daardoor ook echt anders. Het gedroeg zich daardoor op een andere manier dan mensen zouden doen, waarop de menselijke spelers maar moeilijk konden anticiperen, zo bleek. En dat is uiteindelijk de kracht: zo willekeurig zijn en toch zo consistent, dat kunnen niet veel mensen voor elkaar krijgen.