WARは単位が勝利数であるため、WAR4.0の選手はチームの勝利数をリプレイスメントレベルと比較して4増やしたこととなるはずです。では、全員リプレイスメントレベルのチーム、要するにWAR0.0のチームは何勝できるのでしょうか。ざっくり調べただけですが、MLBではリプレイスメントレベルのみのチームの勝率は有名なWAR算出サイトのfangraphs、baseball referenceともに.294で2013年の段階では統一されているそうです。約48勝です。もしかしたらアップデートされてるかもしれませんが、当方は英語力がないので、日本語で探しましたが、最新版の文献を見つけられませんでした。知ってる方がいたら教えてください。
では、NPBではどうでしょうか。これも不勉強なだけかもしれませんが、WAR0.0のチームがどれだけの勝率を見込めるのかを勝利数や勝率としてきっちり定義されたものは見つかりませんでした。.260(143試合中37勝)など、.300など色々みつかりましたが、算出会社自身が定義しているものは特にありませんでした。ですが、簡易的に算出する方法はあります。あるチームの勝利数が90だとして、チームの合計WARが45だとすれば、90から45を引けばWAR0.0のチームの勝利数が求まるはずです。当然WAR順に勝利数が並ばないことがほとんどなのですから、サンプルは大きくする必要があります。今回は2014~2021年のNPBの全チームの勝利数-チームWARを計算することで、WAR0のチームが何勝できるのかを検証しました。ただ、MLBにはなくてNPBにはある大きな問題があって、引分の扱いです。表を載せるのでそちらを見れば分かることですが、引き分けが多ければ多いほど勝利数-WARが小さくなりますし、これの影響で2021年は明らかに他の年と比べ乖離した結果がでました。この問題をどうするかですが、今回は引分を0.5勝として扱うことにしました。
ただ、チームWARの数値とはいえ打撃別投手別全部載せると規約違反になりそうなので2014~2021の勝利数-WARの数値だけを載せることにします。チームの合計WARは勝利数からW-totalを引けば分かっちゃいますが、直接載せてないですし、それだけでも面倒くさいのでセーフなことを祈ります。ちなみに2020年はかなり試合数が違うので除外しました。2014年も1試合多いですが、そこまで問題はないと思うので気にしないことにしました。
2014年
2015年
2016年
2017年
2018年
2019年
2021年
参考:引き分けをそのまま処理した21年
ちなみにチームは何順で並べてるかというとWAR順です。これだけでも色んなことが想像できますね。今回の本題とは異なるのであまり触れませんが。チームごとのバラつきは大きいですが、平均を取れば基本的に32~34程度に収まっているようです。この平均値のさらに平均を取ると、33.18になりました。僕が事前に調べた値はかなり異なりますね。勝率にすると0.23程度になります。そもそもこの算出方法が正しいのかという疑問はちょっとあるのですが。また、引き分けが多すぎると21年のようになります。引き分けのさらに厄介なところはチームによって数が違うため、この平均勝利数25.825を単純な試合数で割るのができない点です。引き分けの平均値を試合数から引くことで一応対処できますが、その方法で算出した試合数で25.825を割ると0.205と明らかに他の年と離れた値が出てきてしまいました。そのため、全ての年で引き分けは0.5勝としています。
なるほど、これを見るに年度によるバラつきも小さく、NPBのリプレイスメントレベルだけの選手で構成されたチームは平均33勝、勝率.230程度を見込めるようです。意外と勝てますね。ところで、今のところ全く説明してませんでしたが、そもそもリプレイスメントレベルがどのようなものなのかを理解しなければなりません。
当サイトでも適当にしか紹介してませんでしたが、結構長い話になるので、かなり分かりやすい文献がこちらなのでぜひご一読ください。
一応めちゃくちゃざっくり説明しようと思います。例えば打者評価をする場合で、ある年のリーグ平均OPSが.700だったとします。その場合、OPS.700のある打者Xの平均と比べて生み出した価値は0です。(厳密には打者評価はwRAAですが、あんまり今回の話と関係ないので気にしないで大丈夫です)ですが、このままWARの打撃評価を行うとXのWARが0ですと言われることにはかなり違和感を覚えるはずです。この違和感を埋めるためにリプレイスメントレベルという基準を作り、その基準との比較で評価をしようという考えです。紹介した記事とほぼ同じ内容になってしまうので詳しく理解したい方はリンク先を見ることをおすすめします。
リプレイスメントレベルを理解できたところで、DELTAさんの用語集のリプレイスメントレベルの概要にこのような一文がありました。
日本では打者がwOBAで平均の0.88倍、投手は失点率で平均の1.39倍(先発投手)あるいは1.34倍(救援投手)程度となる。参考
リンク先に飛べば分かりますが、投手のリプレイスメントレベルはアップデートが行われており、現在採用されているのは
先発リプレイスメント・レベル=リーグ失点率×1.37+0.35
救援リプレイスメント・レベル=リーグ失点率×1.37+0.35-0.92
となっています。これを使えば、リプレイスメントレベルの野手とリプレイスメントレベルのみの先発、救援投手のみで構成されたチームの勝率をピタゴラス勝率の計算式をベースとして計算できるはずです。
どうやって導出するのかというと、リーグ平均得点が4.50、リーグ平均失点が4.50の架空のリーグが存在するとします。議論の簡略化のために交流戦など他リーグとの試合をしないのでリーグ平均得点=平均失点です。平均得点、平均失点に上記の式などを使って補正をかけることでそれぞれこのチームの平均得点と平均失点がわかるので、これをピタゴラス勝率の式に当てはめることでWAR0.0のチームの期待勝率が求まるはずです。
ただ、平均失点に関しては上記の式をそのまま当てはめればいいのですが、wOBAによって得点数が決まるわけではありません。DELTAさんのツイートによるとwOBAと得点との相関係数は0.960は非常に高いものの完璧ではありません。そこは問題ですが、ここまで高ければ大きな破綻がないと判断してとりあえずこのまま計算してしまいましょう。
なお、平均失点は先発、救援がイニングをどれくらい食うのかを知らなければなりません。今回は2018~2021のNPBのデータを使って先発投手の平均イニングと救援投手の平均イニングを算出します。2018~2021年の合計守備イニングは58405 1/3イニングでした。その内先発投手の守備イニングは37139イニングで、リリーフは21266 1/3イニングでした。つまり、平均的な先発投手は5.72イニング投げ、平均的な救援投手は3.27イニング投げることとなります。
平均失点4.50のリーグにおいて、リプレイスメントレベルの先発は平均失点率が6.515で、リリーフは5.595です。投げるイニングを割合になおすとそれぞれ63.59%と、36.41%になり、これを分配することとなるので、このチームの先発は平均4.14失点し、リリーフは2.04失点することとなります。よって、このチームの平均失点は6.18点です。得点はそのまま4.50に0.88をかければ良いので、平均得点は3.96となります。
これをそのままピタゴラス勝率の式に当てはめてみます。
ピタゴラス勝率=3.96^2/(3.96^2+6.18^2)=0.291
勝率.291ということで最初に勝利数からチームWARを引くことで求めた値よりも大きな値が出てきてしまいました。ピタゴラス勝率には指数を1.83にしたバージョンがあるので、こちらで計算してみても、逆に大きい値が出てきますのであまり意味はないです。そもそもピタゴラス勝率でWAR0.0のチームの勝率を計算すること自体や、wOBAだけで得点が決まらないことなどこの算出自体に問題点があるなど結構ガバガバなのは承知です。それでも、予想された数値(.230)よりもかなり大きいのは確かです。wOBAでは問題があったので、次はwRAAを使って打者評価をしてみましょう。平均得点がリーグ平均と同じチームのwRAAは0で、今回求めたいのは平均の0.88倍です。これをwRAAの式に当てはめたいのですが、wRAAは以下のように打席が必要となります。
wRAA=(チームwOBA-リーグ平均wOBA)/1.24*打席
これは、試合数や延長有り無しのルールによって年度によって影響を受けるので、2017~2019のデータを使用します。すると、3年間の合計打席数は196289となり、これを3で割って、さらに12で割ることで5452.472打席あることが分かります。打席は求まりました。ただ、wOBAを適当に設定するわけにはいきません。リーグ平均wOBAに0.88をかけた値からリーグ平均wOBAを引けば分かりますが、wOBAの設定によって値が全然違います。値が違うと、wRAAは積み上げ指標なので、打席が増えれば増えるほど本来求めたい値と乖離した結果が出てしまいます。そのため、どのようにwOBAを決めるかは慎重にならなければいけません。
この問題を克服するために、リーグ平均得点を4.50から、4.00得点として、計算を行うことにしました。なぜこれで克服できるのかというと、2016年12球団の平均得点が4.0069点だからです。つまりこの年の12球団の平均wOBAを疑似的にこの今回使う架空のリーグのリーグ平均wOBAとみなすことにしました。これによってwRAAが計算できるようになったので計算してみると、
wRAA=(0.88*2016年12球団wOBA-2016年12球団wOBA)/1.24*5452.472
=-171.313
これによって、この球団の得点は平均である572点から171点低い401点とみなすことができます。(wOBAの平均は伏せさせてください)つまり、この平均得点=平均失点4.00のリーグにおいてWAR0.0のこのチームは得点401です。失点は先ほどと同じ考えで算出して、失点786であると考えられます。これを再びピタゴラス勝率の式に当てはめてみます。
ピタゴラス勝率=401^2/(401^2+786^2)=.206
かなり値が小さくなりました。これをピタゴラス勝率改良版である指数1.83の方に当てはめると、
ピタゴラス勝率=401^1.83/(401^1.83+786^1.83)=.226
勝率.226ということで、32.318勝が期待できるという数値になりました。今までの計算の中で最も勝利数-合計WARの平均値に近い数値となりました。検証が成功したかもしれません。WAR0.0のチームの平均勝利数が33勝という当初の結果と見比べても、あまり違和感のない結果となりました。ガバガバ計算でここまで近い値が出ているので、恐らくNPBのリプレイスメントレベルだけのチームは勝率.230と設計されているとみなすことができそうです。
ここまでやっておいてなんですが、この数値が勝利数-合計WARに近いからと言ってなにかあるわけではありませんし、なんなら僕が.230に近づくように都合の良い数字を使って式を操作している感は否めません。なにか僕が認知できていないバイアスがあって、正しい導出ではないのかもしれませんし、そもそも問題DELTAさんが設計しているリプレイスメントレベル自体が本当にリプレイスメントレベルなのかなど今考えられるだけで問題点はたくさんあります。そして、議論を簡単にするためにすっ飛ばした話もたくさんあるので、厳密な計算をすればまた全然違う値が出るでしょう。
じゃあ、なんでこれやったんだと言われると僕が数字遊びが好きだってだけです。まあなんか無理矢理理由つけるならNPBのリプレイスメントレベルは何勝と設計されてるのかが明確にされてなかったので、自分なりのアプローチで検証したかったってところですかね。
では、チームWARと勝率を回帰分析してみましょうか。そもそも問題勝利数-チームWARの平均値がリプレイスメントレベルの勝利数とみなすことは結構問題があります。表を見れば分かると思いますが、チーム単位での分散は大きいです。やはり、近年のチームの中でもかなり弱い部類の2017年ヤクルトも、チームWARは18ですが、勝利数は46勝ということで、引くことで求められる勝率.230とはおおよそ離れた数値が出てきます。それでも、WARと勝率にはそれなりの相関があります。2014~2021の相関図がこちらです。
決定係数は正直あまり大きくない気がしますが、決定係数が大きければ良いってものでもないのでこれだけの相関があれば十分なのかなとは思います。係数の大きさだけで良いなら、ピタゴラス勝率と勝率がかなり強い相関がありますから。(相関係数0.940)
で、当初の目的である勝率の推定ですが、この近似曲線によると、WAR0のチームは平均.267の勝率が見込めるようですね。文字のついてない方が切片なので、そうなるはずです。また違う数値が出てきてしまいました。ただ、これが一番厳密な計算をしているはずなので、これが真にWAR0のチームの期待勝率なのかもしれません。すると、僕が最初に調べてでてきた勝率.260というのが一番近いということになりましたね。
正直僕は統計学のプロでもアナリストでもないので、どれが一番妥当な計算方法なのか、どれが一番妥当な結果なのか分かりませんが、まとめてみましょう。
リーグ平均得点をそのまま0.88倍したピタゴラス勝率:.291 もしくは .319(指数1.83)
得点をwRAAのマイナス分引いた場合のピタゴラス勝率:.206 もしくは .226
WARと勝率の相関の回帰分析した場合の期待勝率:.267
勝利数からWARを差し引いた場合の平均勝率:.232
色んな結果が出ましたが、個人的な意見としては.300近い勝率よりも.226、.232、.267のどれかがNPBにおけるリプレイスメントレベルの勝率と予想しています。結局結論が出ませんでしたが、数字オタクの誰かの暇つぶしになれば幸いです。今後もなんか研究してみようと思います。
コメント