木原直哉オフィシャルブログ

プロポーカープレーヤー、木原直哉が、思ったことを書いていきます。道場やってます。https://lounge.dmm.com/detail/308/

GTOとエクスプロイット

ポーカー界では、GTOという概念が今、急速に進化、普及してます。

大ざっぱに言うと、相手がどんなプレーをしてきても、こちらは相手にやられこまれてしまうことがない戦略、です。

これだと何を言っているのかわからないかもですが、具体的に言うと、オンラインでじゃんけんをすることを想定して下さい。そこで、相手は心理学のスペシャリストだとします。普通に勝負をしたらトータルではほぼ勝ち目がない。その時、時計の秒針を見て、3で割り切れたらグー、3で割って余りが1ならチョキ、余りが2ならパーを1出す、という戦略を取ったとすると、相手がどんなに格上のプレーヤーであってもイーブンの勝負に持っていくことが出来ます。

じゃんけんでこの戦略を使ったら相手が弱くてもトータル引き分けですが、ポーカーの場合相手がミスをすると、その分こちらの利益になり、ミスをしなかったらイーブン、というような戦略になりえるのです。

必勝法的な理想的な戦略に聞こえますよね?

それを完璧にこなせるのなら事実上ほぼ負けないでしょう。

でもそれって、将棋ソフト「ポナンザ」と全く同じ指し手を選ぶことが出来たらプロ棋士にも勝てる、というような話と全く一緒なのです。

自分は、そういう意味で、GTOプラトンが唱える「イデア」のようなものだと思うのです。

 

一方、GTOと対を成す考え方が、エクスプロイット(exploit)です。

ポーカーは(手数料を考慮しなければ)ゼロサムゲームなので、相手がミスをしてくれたらその分こちらの利益になります。

GTOは、こちらがひたすらミスをしないようにプレーし、相手がミスをした時にその分の得がトータルでプラスになるという考え方です。

一方エクスプロイトは、相手から積極的にミスを引き出そうとします。

例えばあるシチュエーションで、GTOは、AQ+、ATs+、KJs+、A5s、A4s、88+で3倍に3ベットしなさいと主張するとしましょう。

しかし、相手が3ベットへの対応が下手だとすると、もっとたくさんのハンドで3ベットをしても利益が出るのではないでしょうか。

相手の弱点をとことん突こう、というのがエクスプロイットです。

 

 

ところで最近、一部の人たちに、自分はかなりのエクスプロイット志向のプレーヤーであると思われているような気がします。

しかし、これは完全な誤解で、自分はむしろかなりのGTO側のプレーヤーです。古くからひゃっほう掲示板のハンドレビューやQ&Aなどを見ている人は分かるかと思いますが、自分はずっと(恐らく2010年くらいから)「ABCポーカーが基本」と言い続けて来てます。これは今の言い方なら、ちょっとタイト目のGTOに相当します。それがポーカーの基本であって、いつでもそれをしようとしたら出来る、そういう状態になることが一番大切である、と。

その上で、どちらを選んでもGTO的にそこまで差がない場合、相手によってプレーを変えるのが正しい、と主張しつづけているのです。

さらに言えば、多く(海外のプロの大多数)のプロは、エクスプロイットを過大評価してます。そして、無理にエクスプロイットしようと本来のレンジから外れすぎたプレーをしているプロを狙って大きなポットを狙うのが自分が得意としているプレーです。

 

しかし、GTOが主張するレンジを盲信するのも考えものだと自分はまた思うのです。

先程あげたシチュエーションでの3ベット(AQ+、ATs+、KQs+、A5s、A4s、88+)がGTOの推奨するレンジだとしましょう。

その状況で、KQoや66、9Tsを3ベットに組み込むのはそれぞれどの程度期待値を失うと見積もっているのか、具体的な数字を評価出来ているのでしょうか。

また、ATsとKQsをレンジから外した場合はどの程度期待値を失うと見積もっているのでしょうか。

自分は、それらの見積もりがある程度の正確さの数字で言うことが出来ないのであれば、数学の公式の丸暗記みたいなもので、本当に価値が低いと思うのです。

一方、それらをしっかり考察出来ているとすると、

「相手のレンジがGTOレンジより3%ほど緩いからKQoとKJsと77も3ベットに組み込もう」

と考えていくのが正しいエクスプロイットだと自分は思うのです。フロップ以降で更にエッジがあると確信出来る場合は、そこからもう少しだけ広げてプレーすることも正当化されます。

 

一方、エクスプロイット志向が強いプレーヤーは、フロップ以降のエッジを過大評価してしまうのです。

100bbのポットに130bbのブラフオールインを打って相手を降ろしたらスキルで100bb稼いだような錯覚に陥ってしまうのです。

しかし、相手がナッツを持っていたら降ろせないし、たまたまブラフに適するボードになってそこで適切にブラフを出来たというだけであって、それですらたまたまなのです。

フロップ以降で0.5bbのスキルエッジを平均で出せるとしても、プリフロップでGTOから0.8bbのミスをしていたら、トータルで損なのです。

その上、多くのライブプロは自信過剰なところがあります。フロップ以降で0.5bbのエッジがあると向こうは思ってるけど、実際はこちらが0.2bbのエッジがある、ということはザラです。そうすると、相手は二重のミスをしてくれるわけで、自分が良く言う

「弱めのプロを食う」

というのはこういうことなのです。

 

精度が悪くても、GTO志向のプレーヤーから取れるのは限られてます。

ポーカーに限らず、基本がしっかりした上で応用、というのはほぼすべてのことに共通の考え方だと思います。