Hearthstone環境考察

使用率をまとめたり環境予測をしたりします。Hearthstoneに関連するトピックをゲーム理論や統計学の視点から取り上げ…たりもできればいいですね…

【振り返りコオオナアア】環境予測は環境を予測できたのだろうか

弊ブログでパッチ11.2適用の次の日に行った環境予測を振り返ります。

 

ta9e2hs.hatenablog.comta9e2hs.hatenablog.com

 

前提として

・中の人はプレイヤーとしては下の中である

ランク15になれなかった頃の私を下の下と定義した場合、今の私は下の中です。

・予測はあくまで客観的事実に基づいて行ったものである

結果のインプリケーションには主観的な表現が含まれてしまいますが、あくまで結果は客観的なものです。

・使用率目線で予測を行っている

「どのデッキが強いか」ではなく、「どのデッキが使われるか」に着目した予測です。強いデッキが使われるのは当然ですが、「強さ」を定義するのはとても困難です*1。「使われているか」は使用率を見ればいいだけなので、使用率に着目しています*2

ということを念頭に置いていただけるとありがたいです。

 

 

というわけで、言及した内容について見ていきます。「だいたいあってる」か「あんまりあってない」で評価します*3

※基本的にリトライの内容を振り返りますが、結果の変わらなかった予測に関してはリトライ前に言及することがあります。

 

 

1.残るデッキが多い

大抵の環境では、2~3種類のデッキがじゃんけんを繰り広げる結果になる場合が多いです。しかし現環境では、これまで以上に多様なデッキタイプがチャンスを持っていると言えます。

ヒールズーが増える前は使用率3%以上のデッキが10種類以上存在していたので、群雄割拠という予測はだいたいあってると思います。

 

2.偶数パラディンは弱い

弱いです。はい。

 弱かったので、この予測はだいたいあってると思います。

 

3.偶数シャーマンの一時的な流行

予測によると、偶数シャーマンは一時期増えたのち、減るという結果になりました。実際には完全消滅するとは考えにくいですが、Tier1にはならない、という解釈ができます。

 そもそもこれに言及したのは初回の予測で「偶シャマは増える」という結果が出たからです。実際に偶数シャーマンは使用率15位前後に位置していたので、この予測はだいたいあってると思います。

 

4.テンポメイジ、性悪ドルの脆弱性

これは前回の予測と同じ結果になりました。引き続き、これらのデッキは勝ち抜くのが難しくなると予測します。

テンポメイジの勝率はそこまで高くないものの一定数存在しました。ただ、予測を出した段階ではテンポメイジが使用率1位だったことを考えると、この予測はだいたいあってると思います。

 

5.プリーストデッキの伸び悩み

今回の予測では、コントロールプリーストだけでなく、クエストプリーストも伸び悩むという結果になりました。

 初回の予測では「コンプリは減るがクエプリは増える」という結果になったのでこのような表現がなされています。現環境でプリーストは非常に少ないので、この予測はだいたいあってると思います。

 

6.ローグデッキの明暗

ラクルローグは環境上~中位に一定数存在するという予測になります。また、奇数ローグも同様に環境に残り続けるという結果になりました。

一方で、今回の予測ではクエストローグは消滅しました。

 後述しますが、ズーが増えるまではミラクルローグ(+逃げ足テンポローグ)の使用率は非常に高く、奇数ローグの使用率は高いが今ほどではないという状況でした。当時は言及していませんでしたが、予測データの使用率の平均をとった場合ミラクル>奇数>>(越えられない壁)>>クエストという順番になります。この予測はだいたいあってると思います。

 

7.トークドルイドの台頭

前回の予測で「ドルイドに強いデッキがある可能性」を示唆しましたが、恐らくこれのことだと思います。現段階で上位のデッキの多くに有利なため、数を増やすと考えられます。

 「ドルイドに強いデッキがある可能性」は正解で、トークドルイドが強いというのも正解ですが、マリゴスドルイドはこの段階ではOther Druidとして処理されていました。

リトライではotherデッキを省いて予測していますが、otherデッキを含めて予測した場合Other Druidが増えるという結果になります(未発表の結果)。この"Other Druid"がマリドルの可能性が高いと思います。

なんにせよ、パッチ適用前にはほとんど存在しなかったトークドルイドが"Tier 1"と呼ばれるまでになったので、この予測はだいたいあってると思います。

 

8.偶数ウォーロックの流行

ドルイド同様ウォーロックにも強いデッキがある可能性を示唆しましたが、恐らくこれだと思います。偶数シャーマンや奇数パラディン等の初期に流行するデッキを餌に勝率を稼ぐ、という予測です。

偶数ウォロは増えましたね。初期に流行するデッキを餌に勝率を稼いだかどうかは微妙ですが、これは主観的な解釈が含まれる表現であり、私の考えが微妙だっただけで偶ウォロが増えるという結果自体は変わりません。この予測はだいたいあってると思います。

 

9.新・環境に食い込む可能性のあるデッキ

上で挙げた以外に、スペルハンター、コントロールウォリアー、マーロックパラディン、奇数パラディン、キューブロック、挑発ドルイドにはワンチャンスがあるという結果になりました。

さらに、ビッグスペルメイジ、招集ハンターも(上記のデッキには劣りますが)環境に食い込む可能性あり、という結果が出ました。

 スペルハンターはパッチ適用後すぐはとても多く、その後減ったもののある程度使われました。

ウォリコン(ウォリコンとあるが恐らくクエウォリのことを指している)は6月上旬に使用率が増え、その後落ち着きました。

マロパラは消えました。奇数パラディンはこの枠ではなく、「強いデッキ」として評価されるべき立ち位置になったと思います。

キューブロックはナーフ後も継続的に一定数の使用者が存在しました。

挑発ドルイドはズーの登場前に非常に高い使用率を出していたため、奇数パラディンと同じくこの枠で語るべきデッキではないと思います。

コンメ、招集ハンターに関しては、このあたかもTier3であるかのようなコメントに反して高い使用率を出しました。

総合的に見て、この予測はあんまりあってないと思います。

 

 

次に、「予測できなかった事実」に関していくつか触れ、どうして予測できなかったかについて軽く考察します。

 

①ズー(とエッグハンター)が増えた

これらのデッキタイプは、予測を行った段階ではほとんど存在すらしていないレベルでした。予測モデルは既存のデッキの勝率と使用率のみに着目するため、新しくデッキが出現するか、それが強いかを判断することはほぼ不可能である、と言って良いと思います。これはモデルの限界なので、どうしようもないです。

 

②シャダウォックシャーマンが非常に多い

これは本当によくわかりません。予測段階では即死するレベルの弱いデッキです。実データでも総合勝率は悪く、環境に多いデッキに対して極端に強いわけでもありません。

「難しいからデータ上の勝率が悪い」ということはよく言われますが、例えばランク1や2のみの戦績に絞って見た場合も、シャダウォックは勝率が低いにも関わらず使われています。これは「ランク1や2のプレイヤーはシャダウォックを使いこなせておらず勝率も低い。それにも関わらず使い続けている」ということの証左になってしまいます。

こういったデッキを数値から正しく評価するのは非常に難しいです。

 

※当たっているとは考えにくいですが「シャダウォック使いはシャダウォックしか使わない」みたいな仮説を立てた場合、勝率に依らず一定数のシャダウォック使いがいることの説明はできます。予測モデルは「勝率の低いデッキを使っている人は、勝率の高いデッキに変える」という仮定のもとで成り立っているので、この仮説が正しければモデルの前提が崩れているから結果がおかしいといえます。当たっているとは考えにくいですが。

 

③9番目の予測があんまりあってない

殆どの場合これは「モデルでは使用率が0%になるデッキにも、実際には数%の使用者が存在する」ことに起因しています。

予測は、プレイヤーが①「勝率の最大化」を目的に②「常に最善のプレイが可能」で③既存のデッキタイプのみを選択する という仮定の下で行っています。

実世界では、全員がそのような行動原理で動いているわけではありません。好きなデッキで勝ちたい、資産がない、ドルイドが嫌い、テックカード入れればええやんなど諸々の理由で、プレイヤーは仮定と異なるデッキの選択を行います。そのため、現実世界ではノイズが生じます。

モデルの上で「残ったデッキ」に対して強いだけのデッキの使用率が伸び悩む、「残ったデッキ」の中では不利だが、多くのデッキに対して強いデッキが使われる、といった理由から、モデル上の評価と実際の評価が食い違う場面が出るのは仕方ないと思います。

 

 

振り返りはこれで終わりです。

 

Boomsday環境も予測も行います。

パッチ適用後の予測は「だいたいあって」ましたが、既存のデッキがほとんどを占める状況と異なり、全く新しいデッキが大量に出現する新環境の予測はもっと精度が低くなると思います。

記事にはしていませんが、ウィッチウッドの時は環境から3日後くらいの予測が安定していたように感じるので、そのあたりに出せればと思います。

*1:強さの定義に関してああでもない、こうでもないという話を垂れ流す記事を書こうと思いましたが、未完です。いずれ書き上げるかもしれないし、書き上げないかもしれない

*2:「強い」「弱い」という表現を使うことがありますが、これは勢力として強い弱いという意味で、必ずしも勝率が高いということを意味するわけではありません

*3:どうしてこんなふざけた評価をするのかという理由ですが、予測結果を定量的に評価することが難しいからです。これに関しては私の努力不足です。いい方法があれば教えてください