久野愛

久野愛

(写真:Stock Holm / shutterstock

歴史家は、データを歴史化する

データを根拠にして判断を下す、あるいはデータを基に戦略を立てていくデータ駆動社会は今後もしばらくは続くことになるだろう。しかし、データは私たちが生きている世界をフラットに網羅するものではない。その収集方法や分析方法には必ず人間の意図が介在するからだ。

Updated by Ai Hisano on December, 8, 2023, 5:00 am JST

データに依拠する「データカルチャー」

「子どもの心、データで見る意味は」
先日、朝日新聞のこんな見出しが目についた。AIをはじめデジタル技術が発達し、大量かつ多様なデータ、いわゆる「ビッグデータ」の利用がますます活発化している。この記事が紹介するように、ビジネスや政治のみならず、教育現場においても、教育効果の向上や子どもの行動・心理状態の理解を助けることを目的としたデータの利用が試みられている。「ビッグデータ」や「データフィケーション」「データマイニング」のような言葉をニュースなどで度々耳にするようになり、「データ」は比較的身近なものになっているように思う。

このようなデータ志向の現状は、技術開発の結果としてのみ現れたのではない。数学者クリス・ウィギンスと歴史学者マシュー・ジョーンズが、共著『How Data Happened: A History from the Age of Reason to the Age of Algorithms(データはどのように起こったのか—啓蒙時代からアルゴリズム時代までの歴史)』で論じるように、客観的にみえる(・・・)データが理論的根拠として用いられ、データがこれほどまでに重視されるようになったのは、社会的・政治的・経済的な要因が深く絡んでもいる。そして、デジタル技術やソーシャルメディアなどの利用拡大のみならず、様々な場面でデータに依拠するというその姿勢こそが、「データカルチャー」とも呼べるような一つの文化として表れているといえる。

歴史家は、データそのものや分析自体に人間の意図が介在することを前提とする

一般的に「データ」とは、対象を客観的に捉え理解するための材料として認識されることが多いのではないだろうか。しかし、データとの向き合い方、そしてそれが社会にもたらす影響は他にもある。以下では歴史家の仕事を例に取り、改めて「データ」とはなんなのか、データを分析する・活用する、とは何を意味するのか考えてみたい。

(写真:beeboys / shutterstock

『広辞苑』によると、データとは「①立論・計算の基礎となる、既知のあるいは認容された事実・数値。資料。与件。②コンピューターで処理する情報。」のことである。『大辞林』では、「①判断や立論のもとになる資料。②コンピューターの処理の対象となる事実。」と記載されている。細かな違いはあるものの、データとは、「判断や立論のもとになる資料」「コンピューターで処理する情報・事実」を指す。

これらの辞書の定義に従えば、データは、計量的な数値のみならず、何かしらの判断や立論の材料になる質的な資料も含まれる。その意味では、分野を問わず研究者が扱う資料は全て「データ」ということになる。一方で、資料をデータと呼ぶか否かは、人によってその判断は異なる。例えば、私が専門とする歴史学研究では(おそらく他の多くの人文系研究分野でも)、私自身も含め、研究に用いる資(史)料のことをデータと呼ぶことはほとんどない。一方で、社会学や人類学などの社会科学分野では、個人差はあるだろうが、歴史家と同じような資料を扱っていたとしても、それをデータと呼ぶことはそれほど珍しくないようである。

なぜ歴史研究者(を含む多くの人文系研究者)は資料をデータと呼ばないのか。一つには、データが統計資料など計量的な資料というイメージを喚起させることが理由かもしれない。歴史研究では、統計などを資料として用いることはあっても、主な分析対象となるのは文書史料(質的資料)が多く、それらを計量的資料と同一視することに違和感があるのかもしれない。それに関連したもう一つの(より重要な)理由は、歴史家の資料分析の態度にある。統計資料や計量的な資料、いわゆるデータという言葉で想起される材料が、「客観的・中立的な」分析を目指したものである一方で、歴史家は、データそのものにも、そのデータの分析にも、人間の何かしらの意図や解釈が介在することを前提とする。つまり、統計などの計量的資料の分析にも言えることだが、完全な客観的・中立的なデータの生成も分析も不可能であることを認識した上で、政治的・社会的・経済的文脈の中にその資料を位置付け読み解くことが仕事である。

歴史家の関心は、データがいかに生み出されたのかということにある

以上のことを踏まえると、歴史家にとってデータとは史料の一部である。誰がいかなる歴史的背景の中で実験なり調査なりをして出てきた数値なのか、その数字が意味することは何なのか。つまりデータを歴史化するのである。したがって、数的データも質的データも客観的な事実として用いるのではなく、その数字なり文字なりの裏側にあるものを解き明かすのが歴史研究である。換言すれば、歴史家は、データをいかに用いるかということよりも、データがいかに生み出されたのかということにより強い関心があるともいえる。そして、ある社会的コンテクストの中で作られたデータが、誰によって・どのように用いられたのかを分析することで、そのデータが社会にとっていかなる意味を持つのかを明らかにするのだ。つまり、歴史家にとってデータは所与のものでもなければ、一般化して利用できるものでもなく、ある時間的・空間的枠組みの中で存在するのだ。

データが出現させた「大衆社会」

データを歴史化し分析した研究の一つに、アメリカ史研究者のサラ・イゴによる2008年の著作『The Averaged American: Surveys, Citizens, and the Making of a Mass Public(平均化されるアメリ人—調査、市民、大衆の形成)』がある。これは、1910年代以降の米国で、世論調査や市場調査、国勢調査など、人々の属性や嗜好、政治的信条などを測定する手法がいかに発展したのか、つまり国民・消費者に関するデータの収集・分析・活用がどのように広まり、いかなる社会的影響があったのかを明らかにした研究である。イゴは、こうした様々な測定技術は、近代社会科学の発展に貢献しただけではなく、アメリカ人自身の考え方も大きく変えたと主張する。世論調査などの結果を知ることで、国民の「マジョリティ」がどのような人々であるかを統計的に知ることができるようになり、アメリカ人という国民がどういうものなのかを自分たちが意識するようになったのである。様々なデータは、「大衆」なるものに具体的なイメージを付与することで、「大衆社会」というものを誕生させたのだ。ベネディクト・アンダーソンが「想像の共同体」と呼んだ国民国家は、統計などのデータが社会で共有されることでも作り出されてきたといえるだろう。

データは、国民国家や(想像された)市民の構築だけでなく、大衆消費社会の出現にも大きく関与してきた。イゴの議論に倣うならば、20世紀前半以降にその利用が拡大した市場調査は、単に企業が消費者の消費パターンや嗜好に関するデータを収集するだけではなく、「平均的な」消費者像を作り出すこととなった。そして、「大衆消費者」に向けた商品やサービスを企業が作り提供すると同時に、消費者側もそうした大衆消費者またはマジョリティ像を想像することが容易となり、自らもその大衆の一人となって流行のものを購入したり、一方で大衆に交わらないよう敢えて流行に乗らないことも可能となったのである。以前の論考で触れたように、かつてヴァルター・ベンヤミンは、19世紀末のパリで「百貨店の創立とともに、歴史上はじめて消費者が自分を群衆と感じ始める」と述べたが、20世紀以降の市場調査などに基づくデータは、消費者が想像する大衆の像をより鮮明な形で投影することに役立ったのだ。だが、そうしたデータは、あくまでマーケターや商品開発者らの意図を介在した調査の結果であり、その意味では、消費者データは、消費者そのものを表すものというよりも、企業・ビジネス側がいかに消費者や商品・市場について考えていたのかを映し出すものだともいえる。よって、それによって作り出される大衆消費者像は、必ずしも実際の消費者の姿ではなく、様々な意図や思惑によって作られた姿である。もっとも大衆とは常に虚像によって作られるものなのかもしれないが。

データが誰によって、いつ、どのように作られたのかを考える

データが生み出す市民像や大衆消費者像は、ある意味で社会を(虚構であったとしても)可視化するものだといえるかもしれない。データを用いた可視化とは、グラフや図柄として視覚的に理解することで、問題解決の糸口を見つける助けとしてしばしば用いられる。だが、データを「活用する」と言う時、そのデータが誰によって、いつ、どのように作られたものなのか、そのデータを用いることが何を意味するのかをクリティカルに考えなければ、本当の意味で活用することにはならない。データの「盲点」に気づかず、むしろその活用が逆効果になってしまうこともあるだろう。AIデータを「活用」した結果、子どもの虐待死を防げなかった例は記憶に新しいだろう。そして、データによる可視化で思考停止するのではなく、時に耳をすませたり、肌で感じとったりするなど、五感を研ぎ澄ませて世界と対峙することで、データを疑ってみることが、本当の意味での「データの活用」には必要なのではないだろうか。それは、生成AIが膨大なデータを元に文章を一瞬で作り出すのに比べれば、果てしなく長く、地道な作業である。またそこで扱うデータは決して「ビッグ」ではなく、むしろミクロでスモールなものだ。だが、「スマート」でも「ビッグ」でもないことに対する感性を養うことも社会に新たな道筋を見つける重要なヒントにつながるのではないだろうか。それは、私たち一人ひとりがデータとして扱われる社会へのささやかな抵抗かもしれない。

参考文献
「子どもの心、データで見る意味は サイトの閲覧履歴や検索数を可視化」篠健一郎『朝日新聞』2023年11月12日
データ視覚化の人類史―グラフの発明から時間と空間の可視化まで』マイケル・フレンドリー、ハワード・ウェイナー 飯嶋貴子訳(青土社 2021年)
Igo, Sarah. The Averaged American: Surveys, Citizens, and the Making of a Mass Public. Harvard University Press, 2008.
Wiggins, Chris, and Matthew L. Jones. How Data Happened: A History from the Age of Reason to the Age of Algorithms. Norton, 2023.