井山弘幸

井山弘幸

Jan Collaert I, after Jan van der Straet, called Stradanus|New Inventions of Modern Times [Nova Reperta], The Invention of the Compass, plate 2, ca. 1600

(写真:メトロポリタン美術館 / The Metropolitan Museum

データは何も語らない。意思決定に寄与するのは、仮説ばかりである

データは語るのだろうか。もちろんデータを擬人化した表現だから、文字通りの意味での数値や記録が声を出すわけではない。データが隠された事実や有用な知識を自ずと教えてくれるようにも感じられる。おそらく、そのような意味で「データは語る」が書名や記事のタイトルに使われるのだろう。だが膨大なデータの蓄積がある一方で、そこから何らの情報も得られないケースもある。データから有意な知見を引き出すメカニズムに焦点を当てて、とくに先のところでは死人に関するデータが何かを語ってくれるのか、それとも「死人に口なし」で何も語らないのか、考えてみよう。

Updated by Hiroyuki Iyama on July, 11, 2023, 5:00 am JST

長嶋監督の勘ピュータもまた「データ」を活用していたのかもしれない

実を言うと、データにはもう一つ別の用例がある。知識の根源をもとめる論考で、哲学者ラッセルが用いたもとの意味は sense data すなわち感覚所与であった。感覚として個々人に与えられたもの。知識の構成にとって基本的な情報単位である「与えられた感覚体験」のことをデータと呼んだのである。感覚与件とも訳す。自らに与えられたという意味であって、他人からは知りようのないものである。これはID野球のデータとは根本的に異なる。スコアラーや公式記録員が作成するデータは全てが客観的な数値データであり、誰もが利用できるのに対して、感覚所与で言うところのデータは、時にはきわめて個人的で私秘的な感覚体験で得られる情報となる。

例えば、発熱や寒気を感じるときのいつもとは異なる不快な感覚は、本人にとって第二の意味の「所与で私秘的なデータ」であるのに対して、体温計で測定した体温37.0℃は、第一の意味の「客観的なデータ」となる。だから長嶋監督の勘ピュータは第二の哲学的な意味での、感覚所与のデータを活かしていたのかもしれない。監督時代に一点差で負けているゲーム、最終回二死一塁で走者に盗塁を命じたことがあったけれども、投手のモーションやランナーの走力から「盗塁できる」という状況感覚を得ていた可能性がある。それが長嶋監督以外の誰も知り得ないものであることは、言うまでもない。スピードメーターで測定した球速160km/hは第一の、打者が感じる球の「重さ」は第二のデータである。

宮澤賢治にとってのデータとは。「青空に無色な孔雀が居た」という仮説もデータに基づいていた

データがそれ自体では何も語らず、推論の材料として使われるときには仮説が必要となることを、科学者でもあり詩人でもあった宮澤賢治が書いているので、少々寄り道となるけれど触れておこう。処女詩集「春と修羅」の序詞で賢治はこんな風に語る。

…けだしわれわれがわれわれの感官や/風景や人物をかんずるやうに/そしてたゞ共通に感ずるだけであるやうに/記録や歴史 あるいは地史といふものも/それのいろいろの論料(データ)といっしょに/(因果の時空的制約のもとに)/われわれがかんじてゐるのに過ぎません/おそらくこれから二千年もたつたころは/それ相当のちがつた地質学が流用され/相当した証拠もまた次次過去から現出し/みんなは二千年ぐらゐ前には/青ぞらいつぱいの無色な孔雀が居たとおもひ/新進の大学士たちは気圏のいちばんの上層/きらびやかな氷窒素のあたりから/すてきな化石を発掘したり/あるいは白堊紀砂岩の層面に/透明な人類の巨大な足跡を/発見するかもしれません…

賢治にとってデータは共通に感じる「論料」、つまり議論の材料ということだ。論理学のトゥールミンモデルではデータを「根拠」あるいは「事実」と訳すことに対応している。歴史や地質学史も一つのデータであって、それを材料あるいは拠りどころとして、仮説が推論されてゆく。だがその仮説は二千年後には「相当違った」ものになるだろう、と賢治は断ずる。捨てられてしまうこともあると言う。「青空に無色な孔雀が居た」という仮説はデータに基づいたものであっても、いずれ誤りとされる日がくる。トゥールミンモデルではデータだけでは何も分からず、それを活用するには論拠(warrant)が必要とされる。論拠は大概仮説のことである。