Advanced Stats xxFIP!!!Part1

セイバー関連

こんにちは。暇なので今回はxxFIPについて解説します。日本での認知度はかなり低い気がしますし、言及されている日本人の方もほとんど見たことがないのですが、面白く優秀な指標なので紹介します。

ちなみに今回の記事は”ほとんど”この記事の焼き直しで日本人向けに解説と紹介しようと思っただけなので、英語が読める方はこちらを読んでもらった方が誤解なく理解できるかもしれません。僕も100%理解しているという自信はないので。

※英語が読めなくても素晴らしい記事なので興味があるなら目通してもらいたいです!

・One Estimator to Rule Them All: xxFIP – Part 1: xK%

・One Estimator to Rule Them All: xxFIP – Part 2: xBB%

・One Estimator to Rule Them All: xxFIP – Part 3

xxFIPっていうのはExpected Expected Fielding Independent Pitching っていうことなんですけど、まぁ英語だけ聞いても意味分からないと思うのでちょっとずつ解説していきます。

FIPやxFIPがそもそもなんなのか分からない方はこちらのリンクからどうぞ。

1.02 FIP

1.02 xFIP

xxFIPの目的

インプレー打球がヒットになるかアウトになるかは投手の実力では少ししかコントロールできないが、三振や四死球はコントロールできるとかなんとか。

このFIPの説明を初めて聞いたときに疑問に思ったことはありませんか?

「いやいや三振や四死球も投手がコントロールできない要因あるでしょ」って。

昨今話題のフレーミングや、審判の判定などが思いつく代表例でしょう。この弱点を克服するのがxxFIPであり、この指標の最大の目的はFIPの計算に用いる三振や四死球をフレーミングや審判などの投手がコントロールできない要因から独立させることです。

また、xFIPは短期的には被本塁打は運によって揺らぎやすいのでそこに補正を加えた指標です。xxFIPではxHR/FBという指標を用いてここにも補正を加えます。この辺に関しては後で詳しくやるので、とりあえず「捕手と審判の影響を排除することが目的」と捉えてもらえれば大丈夫です。

xK%の計算

まず、xK%という指標を実装します。

審判や捕手から三振数や四球の数を独立させるためにこの指標を構築する上で必要な要素は5つあります。

まずは、BIP(Balls In Play)です。BIPの増加は対戦する打者を増加させることと同義なので、K%の低下に大きな影響を持っています。フェアグラウンドに飛んだ全ての打球が分子に来ます。ライナー、ゴロ、外野フライ、内野フライ。もちろん、ファールフライも含みます。これらの打球を足し合わせ、その投手のシーズン投球数で割ってあげることでBIP/Pitchというものが得ることができます。

二つ目は空振りの数です。空振りの数は三振を多く取る上で最も重要な要素です。これもシーズン全体の空振り数をシーズン投球数で割ることでSwStr/Pitchが得られます。

三つ目はファウルの数です。ファウルを取れるのはピッチャーのスキルであり、ストライクカウントを増やすことができるので、三振を取ることに関係があるはずです。これも今までの二つと同様にFoul/Pitchを得ます。ただ、最初から分かることとして、三振を取る上では空振りほど重要ではないということです。

ここまでの三つの要素は打者がスイングした場合のみに起こるイベントです。打者と投手の間の勝負で起こるのはスイングするかしないかの二択であるため、打者がスイングしない場合を考える必要があります。打者がスイングを試みない場合、起こりうる結果は見逃しストライクか、ボールです。しかし、実際にコールされるストライクかボールかは審判、捕手のフレーミングによって影響されるため、今回は見逃された球がゾーン内を通過したか、ゾーン外であったかに注目します。

今回はこれらをZL(Zone-Looking)とOL(O-Zone-Looking)と名付けます。これらも今までと同様に投球数で割ることでZL/Pitch、OL/Pitchを得ます。

ここで分からない部分があるのですが、ここまでで登場した指標はスイングした場合に起こりうる全ての結果とスイングしない場合に起こりうる全ての結果を想定しているわけですが(HRを除く)、BaseballSavantのデータでZL+OL+Foul+BIP+HR+SwStrを全て足しても微妙にシーズン全体の投球数とずれるんですよね。原因がよく分からないので分かる方がいれば教えていただきたいです。

ここで、各指標に重み付する係数を決定するためにテストをした結果(多分多重回帰分析から得られた数値?だと思います)で、xK%は次のように決定されます。

(-0.98*BIP + 1.3*SwStr + 0.43*Fouls + 0.72*ZL + 0.11*OL)/Pitches

重み付された係数はシーズンによって微妙に異なるのでしょうが、恐らく無視できる差らしいので、どのシーズンでも明らかに見当違いな結果を生む可能性は低いはずです。ただし、10年近く前に書かれた記事であるため、指標の再検討は必要かもしれません。そこまでやる体力がないので僕はやりませんが。

イメージをもってもらうために今回2021年のMLBで最低でも200人以上と対戦した投手のxK%とK%の関係をプロットした図を見てもらいます。決定係数は.90なのでかなり当てはまりが良いことが分かりますね。

 

 

 

 

 

 

 

また、xK%とK%では将来のK%に予測に向いているのはどちらなのかという議論がありますが、参照元の記事に書いてあるものを参考にしていただくのが良いですね。

この表の意味が分からない方のために解説すると、Nがサンプル数(投手の数)で、TBFは対戦した打者の数、RMSEは二乗平均平方根誤差です。二乗平均平方根誤差に関しての解説は面倒くさいので省きますが、小さければ小さいほどそのモデルが説明できる能力が高いということです。

この表では、殆ど場合でxK%は実際のK%よりもK%の予測において優秀であるということが分かりますね。

長くなってしまったので、今回はここまでです。次回はxBB%とxHR/FBとxxFIPを計算していきます。

 

 

コメント

タイトルとURLをコピーしました