Hearthstone環境考察

使用率をまとめたり環境予測をしたりします。Hearthstoneに関連するトピックをゲーム理論や統計学の視点から取り上げ…たりもできればいいですね…

デッキの当て方を考えるのは難しいとかそういうレベルじゃないという話

HCT夏季選手権がもうすぐそこに迫ってきました。なので、これまでこのブログで二度取り上げた話の続きをすることにしました。

一部この記事だけで完結しない部分があるため、理解できない点があれば以前の記事を参照していただけると幸いです。

ta9e2hs.hatenablog.com

ta9e2hs.hatenablog.com



なお、今回は具体的な計算をしていません。なぜなら非常に面倒臭いからです。
今から、皆さんにその面倒臭さの片鱗をお見せしたいと思います。



ご存知の通り、夏季選手権は4hero1banのBO5で行われます。今回はこのルールに則り、「banから勝敗が決するまで」のプロセスを記述していきます。


例として、以下のような組み合わせを考えます。
プレイヤーTとプレイヤーXが対戦します*1
Tのデッキは挑発ドルイド、招集ハンター、ミラクルローグ、偶数ウォーロックの4種類、Xのデッキはミラクルローグ、偶数ウォーロック、招集ハンター、性悪ドルイドの4種類です*2
各デッキの組み合わせによるTの勝率*3は以下のようになります。*4

↓T/X→ ミラクル 偶ウォロ 招集ハン 性悪ドル
挑発ドル 35% 57% 49% 54%
招集ハン 48% 45% 50% 52%
ミラクル 50% 65% 52% 53%
偶ウォロ 35% 50% 54% 51%


ここから、まずお互いが相手のデッキを同時に1つ選び、banします。banに関しては前回の記事(https://ta9e2hs.hatenablog.com/entry/2018/06/10/095514)を参照下さい。


このゲームの解を探すことが目的の場合、banを考慮するのは一番最後のステップになります*5。今回はそこまで行いません。

お互いのbanするデッキの組み合わせは4*4=16通り存在します。ここでは簡単のため、それぞれ相手の4番目のデッキをbanしたと仮定します*6

banが終わったら、BO5が開始されます。
前々回の記事でも触れた通り、BO5の流れは以下のようになります。


①お互い自分のデッキの中で、これまで勝ったことのないものを1つ同時に選ぶ。この段階で相手の選んだデッキはわからない。

②お互いデッキを見せあい、対戦をする。対戦の結果は勝率によって決定される。

③①~②を、どちらかの使えるデッキが0になるまで続ける。


この行程をゲームツリーにまとめます。まず1戦目は以下のようになります。

f:id:ta9e2hs:20180627023917p:plain

前々回説明した通りですが、黄色く囲ってある部分は、自分が今どちらにいるか認識できない状況を意味します。同時に行動を決める状況を書き出すための措置です。
また、「自然」はどちらの意思も介入せず確率的にどちらに進むかが決定されるということを意味します。今回も、お互い最善手をプレイした結果勝率に従って勝敗が決まると仮定します。


いきなりややこしい絵面ですが、要するに「1戦目ではどちらかが勝ち、1-0か0-1になる」ということです。当然ですね。
1戦目の結果は18通り存在するので、banと組み合わせるとこの時点で16*18=288通りの結果に分かれます*7


続いて2戦目のゲームツリーを考えますが、非常に見辛いため繋げて表記することはしません。実際には以下の表と同じものが各々の端点にそれぞれ繋がっていると考えています。
ここでは、「1戦目にTが挑発ドルイド、Xがミラクルローグを選択し、Tが勝利した」場合(一番左の端点)を考えます*8

f:id:ta9e2hs:20180627025040p:plain

敗者の方が選択肢が多くなるため、敗者の選択から先に考えるべくXの選択肢を上に表記しました。当然ですがデッキは同時に選出するため、どちらを先に考えても結果は同じです。
1戦目の結果を所与とした2戦目の結果は12通りです。1戦目の結果それぞれにつき12通りなので、banから2戦目の結果までは16*18*12=3456通り存在します。


これまた当然の話ですが、2戦目終了時の状況は2-0または1-1の二通りしか存在しません*9
このうち1-1になった場合、その状況はBO3と全く同じになります。
BO3の流れに関しては、前々回の記事(https://ta9e2hs.hatenablog.com/entry/2018/06/08/071016)で取り上げた通りです。
ちなみに、BO3開始から勝敗決定までには8*6=48通りあります。

ここからは、2-0になった場合を考えます。今回は例として「上の続きで2戦目を行い、Tが招集ハンター、Xがミラクルローグを選出し、Tが勝利した」という状況(一番左の端点)を考えます。
ゲームツリーは以下のようになります。

f:id:ta9e2hs:20180627033446p:plain

見て分かる通り、2-0になった後、勝っている側(ここではT)は最早デッキの選択権がありません。Xが3連勝すればXの勝ち、1敗でもすればTの勝ちとなります。
2-0に陥ってから勝敗決定までには21通りあります。


ここまでの過程で、どちらかの勝利が必ず定まります。



さて、最終的にbanから勝敗決定までどれくらいのルートが存在するかというと、
3456通りのうち半分がBO3、もう半分が2-0の状況であることを考えて、
3456/2*(48+21)=119232通りです。




……




うん。やばい。






恐ろしいのは、これが1対戦で起こり得る結果ということ。
つまり彼らは、1回につき119232通りの結果があるゲームを1日に何度も、何度も繰り返してプレイし続けるというわけです。常人に為せる技とは到底思えません。

選手権だけに限った話ではありませんが、大会を勝ち抜く選手に求められるのは、プレイの技術や平常心を保つ精神力、それに加えて長時間の頭脳労働をものともしない忍耐力なのである、ということを再認識させられました。



今一度、出場される16人に敬意を表しつつ、Tansoku選手への4パックの期待を込めて、この記事の結びにしたいと思います。

*1:TはTansoku選手、XはXiaoT選手の頭文字を拝借しました。彼らが実際に大会に持ち込んだデッキをここでは取り上げます。

*2:デッキの並び順がおかしいことに気付きましたが、大目に見てください。

*3:ta9e2hsはTansoku選手に投票したので、以下の議論では常にTansoku選手視点で物事を考えることにします。無論、glory選手も応援しています。日本ファイト。

*4:HSReplay(http://hsreplay.net/) の6/25時点でのレジェンドラダー過去1週間の勝率を参考にしました。小数点第一位を四捨五入しています。例によって、理解する上で数字は何でも構いません。

*5:学術的な話になりますが、こういった形のゲーム(展開形ゲーム)では、最終端で得られる結果から逆算して最も良い終端に到達できるルートを探します(後ろ向き帰納法)。

*6:直感的にお互いローグをbanするのが間違いなく最善だ、ということに後から気付きましたが、今後の議論では用いないためそのままにしておきます。

*7:全く同じ状況も存在しますが、過程が異なるためここでは区別します。

*8:実際に起こったらだいたい勝ちなんじゃないですかね。

*9:当然ですが、0-2は2-0と同じ形になります。