井山弘幸

井山弘幸

Jan Collaert I, after Jan van der Straet, called Stradanus|New Inventions of Modern Times [Nova Reperta], The Invention of the Compass, plate 2, ca. 1600

(写真:メトロポリタン美術館 / The Metropolitan Museum

データは何も語らない。意思決定に寄与するのは、仮説ばかりである

データは語るのだろうか。もちろんデータを擬人化した表現だから、文字通りの意味での数値や記録が声を出すわけではない。データが隠された事実や有用な知識を自ずと教えてくれるようにも感じられる。おそらく、そのような意味で「データは語る」が書名や記事のタイトルに使われるのだろう。だが膨大なデータの蓄積がある一方で、そこから何らの情報も得られないケースもある。データから有意な知見を引き出すメカニズムに焦点を当てて、とくに先のところでは死人に関するデータが何かを語ってくれるのか、それとも「死人に口なし」で何も語らないのか、考えてみよう。

Updated by Hiroyuki Iyama on July, 11, 2023, 5:00 am JST

巧妙な仮説があった、野村克也監督のID野球

まずは野球の話題。Thinking Baseball 「考える野球」をブレイザー監督から受け継いだプロ野球の名監督故野村克也はID野球を提唱した。Import Data、データ重視野球、チーム編成や選手のプレイ上の判断は、経験や勘に頼るのでなく「客観的データを取り込んで科学的に進める」べきだ、と考えた。「勘ピュータ」と揶揄された直感や勘に頼る、野村の生涯のライヴァルである長嶋茂雄巨人軍終身名誉監督の野球と好対照をなす、とされる。野球のデータにも種々あるが、実際の試合の記録であるスコアブックのデータならば、どのように生かすのか。例を示そう。

1)初球から強振する傾向のある外国人打者に、投手はボール球から入れと指示する。
2)内角に死球すれすれのボールで打者に意識づけをすると、外角低めの変化球で打ち取りやすい。
3)打球方向に偏りのある打者には、それに応じた大胆な守備シフトを敷く。他にも投手・打者の相性や風向きなどのデータが利用される。(左打者は左投げ投手を打ちあぐねるとか、甲子園球場は浜風が吹くためライト方向のホームランが出にくいとか)。

ここには落とし穴がある。以上挙げた事例はどれも頻度分析に基礎を置くものだ。ものごとは頻度の高い方向に動く、すなわち統計的に生起確率の高い事象が予測される。だから、それに応じた行為を選択すれば成功すると考えるのだが、相手もまた同じデータを共有していることを忘れてはならない。1)初球のボールも、2)内角の意識づけの後の外角変化球も、そして3)守備シフトも読まれて逆用されカウンターを蒙る恐れがある。そうでなくとも、作戦に成功することも確率事象なのだから、失敗する可能性を常に残している。

データを活かしてゲームを勝利に導くことはそう簡単ではないとしても、意思決定の材料であることは確かだ。利用する者を選ばないという意味で、不偏で中立であることもデータの特徴である。意思決定に至らない場合でも、データは現象に潜む規則性や自然の法則性を知るうえで重要である。例えば、新型コロナウイルス感染症(COVID‑19)の流行初期の感染者数に対する死亡者の比率は約5%であったが、2023年までに0.2%程度まで下がった。ここまでが現象に関する客観的データの一部だが、各自が感染を心配することなく自由に活動できるかどうか、その意思決定や判断にはこのデータ以外の要件、仮説が必要となる。例えば「0.2%の死亡率ならば用心するほどの感染症ではない」と言った仮説が。ID野球の特質は、実はその仮説の立て方の巧妙にあったのである。仮説は暗黙のうちに前提とされていることが多いので注意を要する。