第18回 セ・パの強さを比較する〜ブラッドリーテリーモデル(BTモデル)〜(2019.7.1)


 ホームページを移転して初めての更新だ。
 今回はプロ野球のデータ分析を扱った『スポーツの数理科学 -もっと楽しむための数字の読み方-』(共立出版)という本の話をする。かなり古い本(1988年4月発行)で、プロ野球や大相撲のデータを使っていろいろな角度から分析がおこなわれている。ただし、簡単に読めるような内容ではなく、一般化された数式が数多く載っており、数学が相当に得意な方でないと読み進められないと思う。
 私が大学生の時(20年以上前)に、大学の図書館から借りたが、ほとんど理解できなかった。一般化された数式の意味がわからなくても、実際のデータを使った計算手順が示されていれば少しはわかったかもしれないが、途中過程がほとんど載っておらず、最終的な答えがあるだけだった。本を借りた目的がExcelに数式を入れて数字遊びをすること、あわよくば卒業論文の題材にすることだったが、そんな簡単なことではなかった。

 1988年(昭和63年)当時、パソコンはまだ高価で各家庭には普及していない。数式を理解できて、プログラム化できる環境があった方というのはかなり少なかったはずだ。そういう意味ではハードルが高く、対象がかなり絞られた本と言える。
 私は第2章の 「強さ」をはかる で紹介されているブラッドリーテリーモデル(Bradley-Terry model、BTモデル)に興味があって、10年ほど前に古本屋で購入して久しぶりに読んだが、やはり理解できなかった。そこで、数学とプログラミングの得意な友人にお願いして解析ツールを作ってもらった。

 下の表は1986年ペナントレースの対戦成績(引分は除外)で、本に載っているデータだ。1988年発行なので、載っている事例もその時代のものになっている。


 ペナントレースでは勝率で順位が決まるので、この表の上から1位、2位、・・・6位になっている。順位がついているのだから強さもこの順番だと思われるかもしれないが、そのような単純に決めるのではなく、対戦カード間の相性(カモと苦手)も考慮しましょうというのがBTモデルの核だ。本では難しいことがいろいろと書かれているが、それらを全て飛ばして計算結果をお見せしよう。

 BTモデルで求めるのは強さを表す「πi」だ。各球団に50(合計300)を与え、強さの平均が50になるようにしている。強いチームほど50より大きくなり、弱いチームほど50より小さくなる。πiの合計は300になる。


 セ・リーグは実際の順位とπiは一致しているが、パ・リーグは4位と5位が入れ替わった。本には「日本ハムと上位チームとの引分を除いた対戦数がロッテよりも多かったためと考えられる」と書かれていた。

 続いて、カモと苦手の関係だ。下の表でプラスが大きいほどカモ、マイナスが小さいほど苦手を意味する。わかりやすくするために、絶対値が0.6以上に色をつけた。


 広島とヤクルトの関係に違和感があるかもしれない。対戦成績は広島から見て14勝12敗で勝ち越しているのに、ヤクルトが苦手になっているからだ。
 ここでのカモと苦手というのは単純な勝敗成績で決まるのではない。全体の対戦成績から個々の対戦成績の期待値を算出し、その差の大小から計算している。

 下の表は期待値(期待される勝利数)と差(実際の勝利数と期待値との差)で、本には載っていない。期待値というのはカイ2乗検定で知られる独立性の検定適合度の検定で出てくる期待値と同じだ。横に合計すると、実際の勝数に一致する。


 広島(優勝)とヤクルト(最下位)の期待値(期待される勝利数)を見ると、広島から見て17.76勝8.24敗となっている。広島の成績を考えると、ヤクルトには17〜18勝しているべきで、実際の14勝だと期待に満たない→誤差よりも大きい→ヤクルトが苦手と判定される。一方、ヤクルトから見れば、この弱さの割に広島に善戦したと言える。
 このような関係を見ることができるのがBTモデルの良い点だ。

 30年前は交流戦がなかったので、セ・パを比較することはできなかった。現在は交流戦があるので、12球団の強さを同時に算出することができる。
 下の表は今年ペナントレースの対戦成績(6月30日終了まで)で、引分は0.5勝0.5敗として含めている。特に、交流戦は3戦しかないので、引分を勝敗から除外するのは勿体無いように思う。


 πiを見ると、50を超えたのはパ・リーグが上位5球団に対し、セ・リーグが上位2球団だ。
 πiの順位を見ると、セ・リーグ1位の巨人は3位、広島は6位だった。セ・リーグにとって交流戦の対戦成績(負け越し)が響いていると言えそうだ。

 続いて、カモと苦手の関係だ。先ほどよりも基準を緩くして、絶対値が0.7以上に色をつけた。


 巨人は負け越している広島に-0.709、1つ勝ち越しているヤクルトに-0.734となっているのが目を引く。
 機会があれば、2005年の交流戦実施以降のデータでも12球団の順位付けとカモ・苦手を紹介したいと思う。


プロ野球記録回顧部屋に戻る