井山弘幸

井山弘幸

Jan Collaert I, after Jan van der Straet, called Stradanus|New Inventions of Modern Times [Nova Reperta], The Invention of the Compass, plate 2, ca. 1600

(写真:メトロポリタン美術館 / The Metropolitan Museum

データは何も語らない。意思決定に寄与するのは、仮説ばかりである

データは語るのだろうか。もちろんデータを擬人化した表現だから、文字通りの意味での数値や記録が声を出すわけではない。データが隠された事実や有用な知識を自ずと教えてくれるようにも感じられる。おそらく、そのような意味で「データは語る」が書名や記事のタイトルに使われるのだろう。だが膨大なデータの蓄積がある一方で、そこから何らの情報も得られないケースもある。データから有意な知見を引き出すメカニズムに焦点を当てて、とくに先のところでは死人に関するデータが何かを語ってくれるのか、それとも「死人に口なし」で何も語らないのか、考えてみよう。

Updated by Hiroyuki Iyama on July, 11, 2023, 5:00 am JST

確率という物理量が存在する、という仮説

ブレスラウの住民データからの死亡表を経て生命表の導出まで、この一連の思考の流れは自然なもののように考えられがちだが、グラントやハレーが暗黙の前提とした仮説がなければ、実際思うようにならなかった。死者のデータは永遠に眠ったままだったろう。そもそも一定の年齢xのときに来年の誕生日までに死ぬ確率nqxは存在するのだろうか。もし定められた寿命が10年先ならば、それまではnqx=0でなければおかしい。つまり運命論者にとって死ぬ年だけがnqx=100%で、それ以前はnqx=0%なのだ。運命論を含む決定論の考え方が優勢であった時代には、確率という概念は誤謬や迷妄として思考の埒外に追いやられていたのである。もちろん「人間には神または悪魔によって定められた死期が存在する」という運命論も、あるいは「すべての現象はラプラスの方程式にしたがって必然的に起きる」という決定論も、「人間は年齢xのとき翌年までにnqxの確率で死ぬ」という確率論も、いずれも仮説であることに変わりはない。

長らく数学教育のなかで自明とされてきた確率。思い出して欲しい。ものごとや出来事に対して一定の確率が存在することを、先生は証明してくれただろうか?答えはノーだ。「確率という未来にある出来事が起きる可能性を表わす《量》が存在すると仮定しているだけですよ」とは生徒に教えるわけにはいかないだろう。信じなければ試験のとき困るだろう、と言うくらいだ。それに先生自身その信念の虜になっているかもしれない。

それに数学の授業で教わる確率は、死亡率のような統計的な確率ではない。骰子の目やコインの裏表の順列組合せの比率から得られる、論理的な可能性であって異なる性質のものである。

確率論と運命論。どちらが真実なのかは確かめようがない

保険制度の場合、未来にまで拡張した死亡率の存在を受け入れたのは、掛け金が適切で説得的だと感じられ、利用者を維持し拡大できたからだ。だが商業的成功は科学的な証明と無関係である。死亡率は貴方がいつ死ぬのか正確に予言するものではない。冒頭の野球の話でも同じようなことが言える。3割打者とは過去のヒット率3割の実績をもつ者のことを言い、次の打席でヒットを打つ可能性が3割という意味ではない。ただプロ選手の成績評価に役立つという意味では保険と似ている。

もちろん貴方が死ぬ年齢やXデーが存在するという運命論も、そう信じる人がいる一方で、その存在は証明できない。三遊亭圓朝がグリム童話を翻案した落語「死神」ではあらゆる人間の寿命は残されたロウソクの長さで表される。Xデーは人生のロウソクが燃え尽きたときである。植物の命名法の基礎を築いた18世紀の博物学者リンネは『神罰』という本を書いていて、天網恢恢疎にして漏らさず、人間の犯した罪を神は見逃すはずはなく、必ず定められたときに神罰を下していると説いた。これもまた別の形の運命論である。最大の欠点はロウソクが尽きる日も、神罰の下る日も誰もあらかじめ知ることができない、というところにある。

確率論と運命論(あるいは決定論)。どちらが真実なのかは確かめようがない。言えることは、産業革命以降に第二次科学革命が起き、国家運営の強力な手段として統計調査が世界中で行われるようになって以来、われわれは確率論の世界を信じ、そのなかで生きている、ということだ。

データは語らない。自ずと知識が読めてしまう(read off)ことはない。データは仮説をもって読み込み(read in)語らせなければならない。

参考文献
『データは語る』米山高範(日科技連出版社 2000年)
データが語る日本財政の未来』明石順平(集英社 2019年)
野村克也 野球論集成』野村克也 (徳間書店 2017年)
「春と修羅」『宮澤賢治詩集』宮澤賢治(岩波書店 1950年)
『偶然を飼いならす―統計学と第二次科』イアン・ハッキング 石原英樹、重田園江訳(木鐸社 1999年)
神罰』C.v.リンネ W.レペニース編 小川さくえ訳(法政大学出版局 1995年)
『確率論史』アイザック・トドハンター 安藤洋美訳(講談社 2002年)