井山弘幸

井山弘幸

Jan Collaert I, after Jan van der Straet, called Stradanus|New Inventions of Modern Times [Nova Reperta], The Invention of the Compass, plate 2, ca. 1600

(写真:メトロポリタン美術館 / The Metropolitan Museum

データは何も語らない。意思決定に寄与するのは、仮説ばかりである

データは語るのだろうか。もちろんデータを擬人化した表現だから、文字通りの意味での数値や記録が声を出すわけではない。データが隠された事実や有用な知識を自ずと教えてくれるようにも感じられる。おそらく、そのような意味で「データは語る」が書名や記事のタイトルに使われるのだろう。だが膨大なデータの蓄積がある一方で、そこから何らの情報も得られないケースもある。データから有意な知見を引き出すメカニズムに焦点を当てて、とくに先のところでは死人に関するデータが何かを語ってくれるのか、それとも「死人に口なし」で何も語らないのか、考えてみよう。

Updated by Hiroyuki Iyama on July, 11, 2023, 5:00 am JST

死亡率がわかるから、生命保険の掛け金が設定できる。データが意思決定につながるとき

ビッグデータに恐れをなす必要はない。第一の意味での客観的な数値データが膨大に蓄積されたとしても、そこから有益な結論を引き出す仮説がなければ、説得力のある論拠が見つからなければ、宝の持ち腐れで何も使われずに眠ったままでいるだろう。生命保険の成立を例にとって考えてみよう。

どの社会にも記録され眠っているデータの一つに死亡記録がある。欧米の墓標には故人の誕生年と死亡年が刻まれているが、長らくそのデータは何も語らないでいた。1603年12月7日。ロンドンで『死亡表』Bills of mortalityなる冊子が発行されるようになった。前の一週間にロンドン市内で何人死んだのか。死因別にその年齢と人数が書かれていた。早産、老衰、咳病、黒死病、歯熱、梅毒、自殺、驚愕、などの原因があがっていた。驚愕というのが面白い。特に疫病やFumifugium即ち大気汚染との関連を知るために調査員を派遣して作成された。職業や家柄と寿命の関係に興味をもつ者もいただろう。だがこの段階でもデータから意思決定までの道のりは遠い。データはなかなか語ってくれないのだ。

この英国教会の過去帳をもとに作成された死亡表というデータ素材をもとに、人口統計上の仮説を設け、自然法則として整理したのが商人のジョン・グラント(John Graunt)だ。1662年に『「死亡表」にもとづく自然および政治的考察』Natural and Political Observations Made Upon the Bills of Mortality を発表した。この書物は学会で高く評価された。その成果の一つがロンドンの人口の推計である。出生と死亡、移民や逃亡があって今とは違いなかなか掌握しかねていたものに、統計分析から光明が得られる結果となった。当時人口は200万人と過大に見積もられていたが、グラントは死亡表から38万4千人と推算した。出生率から死亡率を引いた増加関数の歴年の積分値を人口とする仮説を用いたことになる。

死亡数と出生数のデータから更に有益な結論を引き出したのが、ハレー彗星の予測で名を残したエドマンド・ハレー(Edmund Halley)である。王立協会の会員として南半球の恒星の観測や貿易風の研究を仕上げた後、当時ドイツ領のブレスラウ(現ポーランド領ヴロツワフ)の死亡表の統計データを元に、1693年に初めて生命表を作成した。生命表とは誕生日から、翌年の誕生日までに死ぬ確率(死亡率)と平均余命を年齢ごとに表わしたもののことである。もっと正確に言えば、x歳で存命中の人間の総数Lx人のうち、x+1歳になる前に死んだ人をndx人とした場合、ndx÷Lxで表される数値nqxのことだ。この中でハレーは生命保険料の算定について提案を行う。支払うときの年齢での死亡率にもとづいて決めるべきだと。生命保険や年金の起源は職人ギルドや聖職者などの互助的制度で、死亡時に家族が受け取る、あるいは退職後に本人が受けとる仕組みになっていたが、保険料は入会時の年齢とは関係なく一律に決められていた。これでは若い人は入会を渋り、老齢に達してから入ろうとする。原資が不足し赤字になることもあった。

ハレーの考案した生命表では年齢ごとに死亡率が異なる。その点は今も同じである。参考までに、現在使われている令和4年のわが国厚生労働省公表の生命表における死亡率を掲げる。60歳男性で0.627%、65歳1.0%、70歳1.68%、75歳2.67%、80歳4.5%、85歳8.08%、90歳14.4%、95歳24.1%、100歳37.0%。高齢になっても半数以上翌年まで生き続けることになるから、われわれの直感に反するようで不思議に感じるかもしれないが、80歳を過ぎても加入できる保険があるのは、これに従い掛け金を決められるからである。ブレスラウの住民のデータから作られた生命表は異国のロンドン市民に対して成り立つ、という推論には無理があるように思われるが、「それぞれの年齢において固有の死亡率の実績値は未来も同じである」という仮説が汎用性の高い優れたものであったことに注目すべきだ。それでも仮説は仮説である。上述の厚生労働省の生命表は当然ながら、日本の過去の人口統計データから引き出されたものとなるが、これも同一の仮説を用いている。過去の統計法則は未来予測に用いることができる。この重要な発見によって、購入者の年齢に応じた適切な価格で、即ち保険業者が破綻せず制度が持続できる年金サービスを供給することができるようになったのである。