数学モデル適用のための確率ゲーム化

3.2 数学モデル適用のための確率ゲーム化 †

用語定義 †

勝率
現在行っている試合や未来に行われる試合にて、勝利する確率。0.0（必ず負ける）～1.0（必ず勝つ）の間で変動する推測値である。自分の勝率と相手の勝率の合計は必ず1.0になる。
選択肢の選択確率
相手が選び得るある選択肢に関して、その選択肢を選択する確率。0.0（必ず選ばない）～1.0（必ず選ぶ）の間で変動する。
相手が選び得る全ての選択肢についてこの値を算出し、合算した場合は、計算結果は必ず1.0になる。
加重平均利得
期待利得のことである。自分が選択肢を選んだ結果得られる利得に対して、相手の各選択肢の選択確率で重み付けし、加重平均をとったもの。

3.2.1 勝率の導入 †

「2.5 運要素と読み」では、選択肢を選んだ結果得られる利得を、自然言語（数式やプログラミング言語ではなく、人間が使用する言語）で表現していました。
しかし、自然言語で利得が表現されている限り、有用な数学モデルをポケモンバトルへ応用することができません。
数学モデルをポケモンバトルへ応用する上では、利得を数値で表現することで、数学モデルを応用できるようにする必要があります。

利得の数値化は、「１つの対戦の中で、目指すべきゴールに到達できる確率」を求めることで実現可能です。
「最終的に自分が勝利条件（自分が選出したポケモンが全滅するよりも先に、相手が選出したポケモンを全滅させる）を満たすこと」がゴールなのであれば、
最終的に勝利条件を満たせる確率、つまり「勝率」が利得となります。

しかし、「勝率」を計算する手法は現在のポケモン界では確立しておらず、ごく簡単な状況を除いて勝率を正確に計算することは不可能です。
そこで、実際には、下記に示す目安を参考に、勘によって概算することになります（※）。
　※勘による概算には誤りが発生することがあり、
　　その誤りには一定の傾向があると考えられます。
　　このことについては、「4. 読みの概念」で解説します。

表３：勝率の目安

～実例51～

【自分のポケモン（場）】
ガブリアス　持ち物：いのちのたま　特性：すながくれ　性格：ようき　
　技：ダブルチョップ　じしん　ストーンエッジ　げきりん
　努力値　HP：4　攻撃：252　素早さ：252
　実数値　HP：184　攻撃：182　防御：115　特攻：90　特防：105　素早さ：169

【自分のポケモン（控）】
ハピナス　持ち物：たべのこし　特性：しぜんかいふく　性格：ずぶとい　
　技：れいとうビーム　かえんほうしゃ　でんじは　タマゴうみ
　努力値　防御：252　特攻：252　特防：4
　実数値　HP：330　攻撃：27　防御：68　特攻：127　特防：156　素早さ：75

【自分のポケモン（控）】
クレセリア　持ち物：たつじんのおび　特性：ふゆう　性格：ずぶとい　
　技：サイコキネシス　こごえるかぜ　でんじは　つきのひかり
　努力値　HP：76　防御：252　特攻：116 特防：4　素早さ：60
　実数値　HP：205　攻撃：81　防御：189　特攻：110　特防：151　素早さ：113

【相手のポケモン（場）】
メタグロス　持ち物：ラムのみ　特性：クリアボディ　性格：いじっぱり　 
　技：コメットパンチ　れいとうパンチ　しねんのずつき　バレットパンチ 
　努力値　HP：252　攻撃：76 特防：180　 
　実数値　HP：187　攻撃：181　防御：150　特攻：103　特防：133　素早さ：90 

【相手のポケモン（控）】
ゴウカザル　持ち物：いのちのたま　特性：もうか　性格：むじゃき　
　技：インファイト　だいもんじ　めざめるパワー　しんくうは
　努力値　攻撃：12　特攻：244　素早さ：252
　実数値　HP：151　攻撃：126　防御：91　特攻：155　特防：81　素早さ：176

【相手のポケモン（控）】
ラティオス　持ち物：こだわりメガネ　特性：ふゆう　性格：おくびょう　
　技：りゅうせいぐん　サイコショック　なみのり　トリック
　努力値　防御：4　特攻：252　素早さ：252
　実数値　HP：155　攻撃：99　防御：101　特攻：182　特防：130　素早さ：178

　・最終的な勝敗を考えて利得を求めた利得表
　　※「2.5 運要素と読み」の「2.5.3 利得を求める上での注意点」
　　　の実例46を参照
　　　利得表（技は必ず命中、追加効果や急所は無いと仮定）
　|―――――――｜――――――――――――｜――――――――――――｜
　|自分＼相手　　｜　れいとうパンチ　　　　｜　ラティオスに交代　　　｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|じしん　　　　｜　自分が大きく有利になる｜　自分が若干不利になる　｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|ダブルチョップ｜　自分が大きく不利になる｜　自分が大きく有利になる｜
　|―――――――｜――――――――――――｜――――――――――――｜
　
　・利得として勝率をおく利得表
　　「最終的な勝敗を考えて利得を求めた利得表」を参考に概算する。
　　　利得表
　|―――――――｜――――――――――――｜――――――――――――｜
　|自分＼相手　　｜　れいとうパンチ　　　　｜　ラティオスに交代　　　｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|じしん　　　　｜　自分の勝率0.9         ｜　相手の勝率0.4       　｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|ダブルチョップ｜　自分の勝率0.1         ｜　自分の勝率0.9         ｜
　|―――――――｜――――――――――――｜――――――――――――｜

↑

3.2.2 ルール特有の価値基準の考慮 †

ルールによっては、（１つの対戦の中での）目指すべきゴールが「最終的に自分が勝利条件を満たす」ではなくなる可能性があります。

例えば、大会では度々「勝利数が同じプレイヤーの順位を、各試合での残りポケモン数の合計で決める」というルールが適用されます。
このルールの下で高順位を狙う場合は、単に勝つだけではなく、「自分が勝利した時、できる限り多くのポケモンを残す」「自分が負けた時、できる限り多くのポケモンを倒す」
ということも目指すべきゴールになります。
利得の数値化は、「１つの対戦の中で、目指すべきゴールに到達できる確率」で実現されるため、目指すべきゴールが変わるのであれば利得の概算方法もそれに応じて変える必要があります。

～実例52～

　・前提条件
　　-自分の残りポケモンは「ヒヒダルマ」（残りＨＰ：１）である。
　　-相手の残りポケモンは「ウルガモス」（残りＨＰ：満タン）である。
　　-自分は決勝進出を目標としている。
　　-自分は残りポケモン数１以上で勝つことができれば、
　　 決勝に進出することができる。
　　-「ウルガモス」に対して「ヒヒダルマ」で「フレアドライブ」を使えば、
　　 確実に勝つことができる。この時の残りポケモン数は０である。
　　-「ウルガモス」に対して「いわなだれ」を行った場合は、
　　 0.9の確率で勝つことができる。
　　 この時の残りポケモン数は１である。
　　-「ヒヒダルマ」は「ウルガモス」に対して先手を取るとする。
　
　・利得として勝率をおく利得表
　　「前提条件」より、下記の利得表が求められる。
　　利得表
　　|―――――――｜―――――――――｜
　　|　自分＼相手　｜　むしのさざめき　｜
　　|―――――――｜―――――――――｜
　　|フレアドライブ｜　自分の利得1.0　 ｜
　　|―――――――｜―――――――――｜
　　|いわなだれ　　｜　自分の利得0.9　 ｜
　　|―――――――｜―――――――――｜
　
　　以上より、「フレアドライブ」を選択するべきである。
　　
　・利得として「決勝に進出する確率」をおく利得表
　　（決勝に進出する確率→残りポケモン数１以上で勝つ確率）
　　「前提条件」より、下記の利得表が求められる。
　　利得表
　　|―――――――｜―――――――――｜
　　|　自分＼相手　｜　むしのさざめき　｜
　　|―――――――｜―――――――――｜
　　|フレアドライブ｜　自分の利得0.0　 ｜
　　|―――――――｜―――――――――｜
　　|いわなだれ　　｜　自分の利得0.9　 ｜
　　|―――――――｜―――――――――｜
　
　　以上より、「いわなだれ」を選択するべきである。

↑

3.2.3 選択肢の選択確率 †

何らかの形で相手の各選択肢の選択確率を推測できるのであれば、その推測した結果を利得表に反映させることで、ポケモンバトルへ応用することができる（数学モデルに基づく）手法の幅が広がります。
　※相手の各選択肢の選択確率を推測する方法は、「4. 読みの概念」で解説します。
情報が多ければ多いほど、より高い勝率を狙える手法を適用できるため、相手の各選択肢の選択確率を推測できるのであれば推測した方が良いでしょう。
（ただし、情報に誤りがある場合はこの限りではありません。相手の各選択肢の選択確率を推測する際は極力正確に推測することを心がけ、それができない場合は推測結果を無理に情報として使わないことを検討した方が良いでしょう）

↑

3.2.4 加重平均法の適用による選ぶべき選択肢の算出 †

ここで、加重平均利得（期待利得）を求めることで、自分が選ぶべき選択肢を算出する手法を実例を用いて解説します。

まず、自分の選び得る各々の選択肢に対して、下記の計算を行い加重平均利得を算出します。
　計算：自分が選択肢を選んだ結果得られる利得に対して、
　　　　相手の各選択肢の選択確率で重み付けし、加重平均をとる
その後、加重平均利得が最も高くなる選択肢を選択します。

この計算を式にして表すと、下記のようになります。
（双方共に２択の場合）
　　　　　　　　　利得表

自分＼相手	選択肢ａ	選択肢ｂ
選択確率	p	q
選択肢Ａ	Ａａ（勝率）	Ａｂ（勝率）
選択肢Ｂ	Ｂａ（勝率）	Ｂｂ（勝率）

　-選択肢Ａを選ぶ場合
　 (Ａａ * p) + (Ａｂ * q) = x
　-選択肢Ｂを選ぶ場合
　 (Ｂａ * p) + (Ｂｂ * q) = y
　
　「x > y」なら選択肢Ａを選択し、「x < y」なら選択肢Ｂを選択する。
　
非常に単純な手法ですが、利得表上の情報が正確なのであれば、この手法により読みの場面でできる限り高い勝率を確保することができます。
読みの場面を攻略する上で基礎となる重要な手法なので、覚えておいて損は無いでしょう。
　※心理的な要素を考慮し、利得表上の情報を正確にする方法は、
　　「4. 読みの概念」で解説します。
　

～実例53～

【自分のポケモン（場）】
ガブリアス　持ち物：いのちのたま　特性：すながくれ　性格：ようき　
　技：ダブルチョップ　じしん　ストーンエッジ　げきりん
　努力値　HP：4　攻撃：252　素早さ：252
　実数値　HP：184　攻撃：182　防御：115　特攻：90　特防：105　素早さ：169

【自分のポケモン（控）】
ハピナス　持ち物：たべのこし　特性：しぜんかいふく　性格：ずぶとい　
　技：れいとうビーム　かえんほうしゃ　でんじは　タマゴうみ
　努力値　防御：252　特攻：252　特防：4
　実数値　HP：330　攻撃：27　防御：68　特攻：127　特防：156　素早さ：75

【自分のポケモン（控）】
クレセリア　持ち物：たつじんのおび　特性：ふゆう　性格：ずぶとい　
　技：サイコキネシス　こごえるかぜ　でんじは　つきのひかり
　努力値　HP：76　防御：252　特攻：116 特防：4　素早さ：60
　実数値　HP：205　攻撃：81　防御：189　特攻：110　特防：151　素早さ：113

【相手のポケモン（場）】
メタグロス　持ち物：ラムのみ　特性：クリアボディ　性格：いじっぱり　 
　技：コメットパンチ　れいとうパンチ　しねんのずつき　バレットパンチ 
　努力値　HP：252　攻撃：76 特防：180　 
　実数値　HP：187　攻撃：181　防御：150　特攻：103　特防：133　素早さ：90 

【相手のポケモン（控）】
ゴウカザル　持ち物：いのちのたま　特性：もうか　性格：むじゃき　
　技：インファイト　だいもんじ　めざめるパワー　しんくうは
　努力値　攻撃：12　特攻：244　素早さ：252
　実数値　HP：151　攻撃：126　防御：91　特攻：155　特防：81　素早さ：176

【相手のポケモン（控）】
ラティオス　持ち物：こだわりメガネ　特性：ふゆう　性格：おくびょう　
　技：りゅうせいぐん　サイコショック　なみのり　トリック
　努力値　防御：4　特攻：252　素早さ：252
　実数値　HP：155　攻撃：99　防御：101　特攻：182　特防：130　素早さ：178
　
　・利得として勝率をおく利得表
　　実例51で提示した利得表とほぼ同様であるが、
　　相手の各選択肢の選択確率の仮定を追加している。
　　　利得表
　|―――――――｜――――――――――――｜――――――――――――｜
　|自分＼相手　　｜　れいとうパンチ　　　　｜　ラティオスに交代　　　｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|選択確率　　　｜　0.3　　　　　　　　　 ｜　0.7　　　　　　　　　 ｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|じしん　　　　｜　自分の勝率0.9　　　　 ｜　自分の勝率0.4　　　　 ｜
　|―――――――｜――――――――――――｜――――――――――――｜
　|ダブルチョップ｜　自分の勝率0.1　　　　 ｜　自分の勝率0.9　　　　 ｜
　|―――――――｜――――――――――――｜――――――――――――｜
　
　・選ぶべき選択肢の算出
　自分の選択肢（「じしん」、「ダブルチョップ」）に対し、
　加重平均利得を算出する。
　加重平均利得は
　（れいとうパンチを選んだ場合の自分の勝率 * れいとうパンチの選択確率）
　＋
　（ラティオス交代を選んだ場合の自分の勝率 * ラティオス交代の選択確率）
　より
　
　-「じしん」を選ぶ場合
　 (0.9 * 0.3) + (0.4 * 0.7) = 0.55
　-「ダブルチョップ」を選ぶ場合
　 (0.1 * 0.3) + (0.9 * 0.7) = 0.66
　
　以上より、ダブルチョップの方が加重平均利得が高くなるため、
　ダブルチョップを選択するべきである。

添付ファイル: