久しぶりに。
2023年のアクーニャはxwOBAとwOBAの乖離がそこそこ大きい状態がシーズン序盤からずっと続いていたが、もうシーズンも終わりかけ。特にこのギャップが埋まる気配もないままシーズンが終わろうとしている。ここで、彼の今年の打球割合をのぞいてみると、GB%が49.1%とBBEのほぼ半分がゴロとなっている。これはリーグ平均である42.4%を大きく上回っている。説明するまでもないが、ゴロの打球価値(wOBA価値)は高くない。それでもアクーニャのxwOBAがここまで高い理由は三振率の異常なまでの低さと打球速度の速さにある。まぁここまでは良いのだが、個人的な感覚の話として、ゴロが多ければ上振れも小さくなる(良くてシングル程度にしかなりづらいが、フライならば上振れればホームランにもなり得るの意味)し、良くてシングルの打球をどんなに速い打球速度で飛ばしていても実際の結果としてのwOBAとxwOBAに乖離が出るのは普通なのでは?と考えていた。これはこの調査をする前段階の話なので、本当に直感的な話だ。今回はこの疑問を解消するための記事。
まず、この疑問は何を調査すればいいのか、何をすれば解消するのかを考えることにした。しかし、よくわからなかったのでとりあえず手を動かそうということで、ゴロとなった打球だけで構成されたwOBAとxwOBAをBaseballSavantから取ってきて比べてみることとする。2023年とそれ以前では多少ルールが、特にシフト関係で変わっているため、多少傾向に違いがあるかもしれない。シーズン途中ではあるが、一旦2023年のデータのみを使ってみる。
この図は2023年におけるゴロ打球のみのwOBAとwOBA期待値の分布を表している。縦軸はその数値の登場頻度である。woba_valueは一定の値しかとらないのに対し、右側は連続的な数字のため見た目が違うのは当然である。そして、これは事前から分かっていたことだが、woba_valueの方は基本的にアウトかシングルの二つしか返さない。稀にそれより大きい値を返しているがほぼ誤差のようなもの。一方でxwOBAに関しても大きい期待値は返さない。基本的にはシングル一本よりもすこし低い値からほぼ0の期待値を返す。その中で幅があるというイメージだ。
左の図で0.0つまりはアウトになる確率を計算すると、約72.7%である。7割でアウトとなり、残りの3割弱もほぼシングルにしかならないとなるとやはりゴロが増えればwOBAは小さくなるだろう。
しかし、アクーニャの打球は基本的に速い。現地9/1の試合が終わった時点での平均打球速度は94.7mphである。最近はあんまり試合をじっくり見ることはないが、彼の打球はゴロだろうがフライだろうが打球は速いので速い打球なのであればxwOBA期待値、woba_valueの分布も多少なりとも変わるはずである。なので、今度は速いゴロに絞ってこの分布を見てみる。
上が95mph以上のゴロによる分布で下が100mph以上のゴロでの分布。
明らかに分布が違っているのが一目でわかると思う。左の図は縦軸の数字もしっかり見ないと変化を視覚的に感じにくいかもしれないが、それぞれ実際にアウトとなった割合も95mph以上の場合が約59.6%、100mphの場合が約55.5%となっている。上振れも小さいが、速い打球でさえあればそれなりの割合でシングルにもなり、期待wOBAもそれなりにはついてくるようだ。まぁ当然だが。ここで、2023年のリーグ全体の打球別のwOBA,xwOBAを、適当な打球速度で分けてそのwOBAの期待値とxwOBAの期待値(紛らわしい言い方だが要は平均)とアクーニャ自身の成績と比較すれば思った結果が得られるかもしれない。
指標に精通してる方は「ん?」と思ったかもしれないが、一旦ここでは飲み込んでおいてほしい。ということで結果はこちら。
+----------+------------+-------------+ | | woba_value | xwoba_value | +----------+------------+-------------+ | GB | 0.2542 | 0.2205 | | 95mph GB | 0.3777 | 0.334 | | FB | 0.4427 | 0.4527 | | 95mph FB | 0.8521 | 0.8805 | | LD | 0.6653 | 0.6512 | | 95mph LD | 0.7473 | 0.7297 | +----------+------------+-------------+
この表は各打球区分を95mph以上と全体に分け、それぞれのwobaとxwobaを計算した表である。傾向としては既知のものである。これと2023年のアクーニャと比較していきたいと思う。結果は以下。
+----------+------------+-------------+ | | woba_value | xwoba_value | +----------+------------+-------------+ | GB | 0.3022 | 0.243 | | 95mph GB | 0.3937 | 0.3575 | | FB | 0.552 | 0.7751 | | 95mph FB | 0.7607 | 1.0707 | | LD | 0.7418 | 0.7246 | | 95mph LD | 0.8093 | 0.8267 | +----------+------------+-------------+
予想とは逆の結果となった。GBで平均よりも多くのwOBAを稼いでいるものの、95mph以上のFBで相当に損をしている。平均よりも95mph以上のフライかつそれに見合った打球角度で打球を打っているのがxwoba_valueを見比べても明らかだが、wobaは平均の期待値を0.1ポイント程度損している。アクーニャ自体のフライのwOBAとxwOBA自体も大きく乖離している。当初の予想とは反対で、やはり運は悪いのであろう。
話は変わるが、全体の傾向も個別の成績もゴロ打球についてxwOBAがwOBAと比較してかなり過小評価気味だ。正直なぜかは良く分からない。xwOBAはゴロを過小評価するなんてことは特に聞いたことがない(自分の勉強不足かもしれないが)ため、データを整形する過程で何か見落とししているかもしれないが、他のデータではそれが見られない。xwoba_valueを与えているMLBAMが、2022年以前のゴロの傾向を使用していて、それに見合う成績を2023年でも出しているが(という仮説、どう与えているのか詳しいことは知らない)、シフト関係などでゴロのwoba_valueに何か変化があったのかもしれない。2022年以前のデータも使用して、この仮説が正しいかを一度確認しておきたい。なお計算式やデータ加工が間違っていた場合は何の意味もないのだが。。。
ということで2022年のゴロのwobaとxwoba。
+----+------------+-------------+ | | woba_value | xwoba_value | +----+------------+-------------+ | GB | 0.2477 | 0.2145 | +----+------------+-------------+
やはり低い。仮説は間違っていたようだ。理由が分かる方、もしかしたらこうじゃないかみたいなのがあったら教えてほしい。wOBAに比べてxwOBAの算出は面倒くさいのだが、BBEに絞れば結構簡単なので計算式が間違ってることは考えにくいが。後考えられるのはxwOBAは打球方向を無視するため、シフトの穴を狙った打球はxwOBAよりも良いwOBAが期待されるはずだが、それをxwOBAは反映しない。そのためのギャップなのかもしれない。あくまで説なので良く分からないが。
話はアクーニャに戻る。xwOBAとwOBAの乖離の大きな原因となっているフライに関してもう少し詳しく見ていこう。ここで、アクーニャのフライのwOBAとxwOBAの分布を見る。
wOBAは見事なまでに二分化している。図が少し見づらいのだが、フライのwOBAの具体的な数値は0、0.9、1.25、2.0のみである。それぞれ、アウト、シングル、ダブル、ホームランだが、0.9,1.25、つまりはシングルとダブルの数はどちらも2本ずつのみだ。本来であればもう少しシングル、ダブルを期待してもいいのだろう。
ここで、この打球を分解して運が良いか悪いかを論じることに意味があるのかを少しふれておきたい。結論、意味がなくはないのだろうが、あまり大きな意味はないと思っている。そもそも、xwOBAは打球速度+角度を考慮してそれに最適なwOBAを与えているものである。今回はその角度の部分はさらに大雑把にわけ、速度は95mph以上とその全体に分けただけであるため、xwOBAのしょうもない廉価版でwOBA、xwOBAを計算したにすぎない。じゃあこの記事でしたことはなんだったのかというと、アクーニャはどの打球でどの程度損をしているのかをなんとなく把握したという記事である。
どうでもいいが、なぜか野球データ界隈ではRが人気だが、Pythonの方が楽だと思うので、個人的にはこっちを推したい。今回の記事で使用したグラフもそれぞれ一行で終わるコードのため。
xwOBAとwOBAの乖離は単純に運の悪さで起きるものと、理由があって起こっているものの2パターンある。後者のよくある原因は、打者のスピードを考慮できていないというもの。これに関しては有名であるが、例えば、打者のスピードが速い場合は内野安打の期待値がxwOBAで期待されるものよりも高くなるはずだがそこを考慮していないというもの。逆のケースでxwOBAではツーベースに近い数値が期待されるはずであるが、打者のスピードがないため、現実的にはシングルになってしまうケースなど、他にもアレナドはなぜかwOBAの方がxwOBAを常に上回っている有名な打者だが、正直この理由は私は良く分からない。(追記:ToppedとWeakに分類される打球にSprintSpeedを含まれるように以前アップデートが入ってるので内野安打云々は前の話、ツーベース云々に関してはその後の情報はないので勝手にアプデされてるかもしれないがよく知らん。)
ちなみにこれが欠陥だとは思わない。解釈次第では、打者の走力などを無視した純粋な総合的打力を表す指標であると解釈もできるためである。なのでxwOBAは打者の走力を無視しているからダメと考えるのではない方向で指標を拡張した方が良いと思っている。
最後にFBで大きなバリューを出している打者の分布と数値を見てアクーニャと比較したいと思う。
+--------+------------+-------------+ | | woba_value | xwoba_value | +--------+------------+-------------+ | Ohtani | 0.8171 | 0.8629 | | Seager | 0.692 | 0.6747 | | Olson | 0.6837 | 0.6555 | +--------+------------+-------------+
アクーニャと比較すると非常にロスが少ないという結果となった。当たり前だが、wOBAの0はxwOBAに比べると極端に多くなる。ただし、Matt OlsonはxwOBAでも価値の低い打球が他の打者にも比べるとかなり多い。極端な分布を取っているようだ。
以上終わり。
コメント