何となく本屋を歩いていると、本書「統計学を拓いた異才たち―経験則から科学へ進展した一世紀 著者;デイヴィッド
サルツブルグ」が目に付いたので手に取ってみる。何故目に付いたかというと、近頃、冷静にデータについて考えてみて、そして、多くのものは、全てデータベースとして表現出来るものであるし、多くの物事は、何らかの理論ベースの公式によって表現される場合がある一方で、データベースの中に紛れ込む変数の回帰によって表現される場合もあり、というのが実情であり、後者によって表現される物事の方が多いと捉えるべきなのだろうと強く認識し始めているということに起因する。もう少し、これを説明すると、結局例えば、人間の判断という動作についても、これは、記憶や経験というデータベースに対して(もしくは、極端に言うとDNAというデータベースに対して)、検索をかけて最適と思えるものを選択するということであるのだと捉えることが出来るのではないかと。つまり、様々な物事は論理的云々や経験的云々といしばしば対立項として取り扱
われるものが基底としてあるのではなく、それらを接続(インターフェイス)した発想ともなりうる、データベースとして取り扱えば、なんのことはない、対立も何もないすっきりした現実が表出すると言うことなのでは無かろうかと
いうことなのだ。そして、そのようなデータベースという観点が入ってくると、そこには統計という発想が必要になってくる、というか、それがなければ、どうにも処理しきれなくなる。ということで、統計学という学問的重要性もさることながら、その発想というものが非常に重要なものだと思うのだ。
さて、これで前置き終了。まずは全体的なところから。数学関係書籍でありながら、数学にそれほど詳しくなくても、読めるというか、逆に数学的なものを期待しすぎるともう一つ足りなく感じるかもしれない。とはいいつつも、数式を使わないが故に言い回しがややこしくて、理解が困難なところがあるのも事実だったり。ただ、細かい内容の理解ではなくて、理系ドキュメンタリーのスペクタクルを感じたいというのであれば、問題はないだろうし、統計の発展がうまくまとまっているので、理系の人にも読みがいは十分にあると思う。ただ、やはりそのあたりにもう少し工夫が足りないというか、何となく気になってしまうと言うところは、この著者の表現力が並以上ではあれど天才級ではないということだろう。また、何度かたとえ話が表現のために使われるのだが、そのたとえ話の使い方も少し不適切なように思うところもいくつもある。そのあたりが改善されれば、もっと感動できる作品になっていただろう。
もう少し踏み込んでいこう。内容は、カール・ピアソンやフィッシャーといった統計学の創始者とも言うべき人物に対する言及から始まる。
大量の自然発生物に対するデータの収集と分析という、まさにデータ分析の基本的姿勢から統計学が始まる。やがて、そこにあるデータの特性、収集するデータの特性とは別の大量のでデータが常にはじき出す揺らぎという特性、が発見されそこから統計学が始まる。ここに、やがて様々な手法の開発と応用利用が始まるという形で、創始者の話から、多くの統計学者による適用範囲の拡張と精度の向上が図られていくという展開が紹介されている。特に統計学の特徴であるのが、現実の問題を解決するために使用されるという側面。この本でも、ここを重視していて、統計学理論の説明よりも、それがいかに利用されたかという事例紹介に重きを置いているように感じる。そのことによって、読む楽しさが膨張しているといえる。ただ、一方で、多くの事例を扱っていると言うこともあってか、様々な事例の紹介がどこか、中途半端で終わってしまうというか、で、それでどうなったのっていう統計学の導入による最終効果の部分が不足しているようで、ちょっと消化不良感が残るところも多くあるのが残念というか、しょうがないのかもしれないが。
統計学にも怪しい側面が残るのも事実だ。統計的な方法論を信用しようとしない人もいるし、統計的な手法の誤った使用法によって、誤った結論を導き出す場合もある。実際、専門家の中でもどの統計的手法が正しくて、どの統計的回答が正しいのかということ自体が議論の対象となることも多くあるようであり、そのような側面もこの本の中で紹介されている。真実は、すぐそこに在るようで、どうにも到達できないものであると、しかし、統計学という武器を使用しなければならない時点で、決定論的な発想は、捨て去らなければならないと言うことであり、ただ、どこまで肉薄することが出来るかと言うことがデータ解析者、統計学者の能力に直結するのかもしれない。神はさいころを振らないのではなくて、やはり、さいころを振るのであり、不確定性理論でもあるのだから、静的に固定された世界観ではなくて、動的に変化し続ける世界観によってそれに対峙するしかないのであろう。そして、言うなれば、神はさいころを振るが故に、ここにある宇宙が存在すると捉えるべきなのだろうし、その意味では、神は死んだというべきでもあるのだろう。宇宙の始まりにも揺らぎがあったということでもある。きっとわずかな秩序の混乱によって完全な混沌の中にわずかながらの秩序ができあがり、そして、存在が時間軸の上を走り出したというのが今の宇宙であり、その中に在る我々の存在なのであろう。正確な引用が出来なくて残念だがアイザック・アシモフ氏の著書の中で、「トランプを混ぜた時にも、どこかにたまたま数字が秩序的にならぶところがある。我々の宇宙はそういった無秩序の中にたまたま出来た秩序の部分なのかもしれない。」というような考えが披露されていたが、まさにその捉え方が、この宇宙を表現するのにもっとも適切なのだと思う。
いずれにせよ、この統計学の展開は、今後、明らかにコンピュータの導入で次のステージへ進みつつあると思う。様々なものがデータベース化されてコンピュータ処理が容易になっていく現状と今後を考えると、この統計学の重要性はさらに今後増していく(現在進行形)と、個人的には思っている。なので、非常にタイムリーなところでの統計関連まとめ書籍だと思う。そして、今後様々な分野でさらなるデータのデジタル化が起こって(現在進行形)、その処理技術と処理アルゴリズムが開発されて(現在進行形)、数学的手法も開発されていく(現在進行形)のではと勝手に想像してみる。となると、様々な物事へのデジタル革命に対して、既にぱっと見ただけでもこれだけネタが揃っているということであり、既にデジタル革命はそれなりのレベルまで進行していると捉えるべきだと思う。デジタル革命とはつまりデータのメタ意味の変化である。そして、近頃強く思うのは、マトリックス演算の力強さである。学生時代は全く気づかなかった愚かさであったことが悔やまれる。
この著書の最終章がとても意味深いと思う。「隠れた欠点のある崇拝物」。これは、しかし、もしかすると統計学のみならずこの宇宙がまさにそのような状態であり、前述のようにだからこそ、存在が時間軸の上を走り出したということなのだと思う。そして、この「隠れた欠点のある崇拝物」というのは、実は統計学そのものを差すだけではなくて、この世の中をさすのではないだろうかと。より現実を表現しようとして生まれた統計学が、自己矛盾を抱え込むように、自己参照性という危険性を回避することが出来ず、むしろそこへと突入してしまいがちであるという事実は、きっと、それが表現しようとしている対象がそのような特性を持っているからであるとも考えるべきではないだろうか。神は死に、そして、神はさいころをふり、「隠れた欠点をもつ崇拝物」であり、そう、全ては「隠れた欠点をもつ崇拝物」なのだ。だから、欠点を指摘し続けて、そして、何かを否定して悦に入る態度は全くもって価値のない行動であり、「隠れた欠点」を内包しながらも突入し何かを生み出そうとする努力が必要なのだと思う。