データ解析と言えば、どのツールやプログラムを使うかにフォーカスしがち
私は仕事でデータ解析のPoCやコンサルティングを行うこともありますが、いわゆるドメインエキスパートと呼ばれるその領域の専門家というわけではなく、お客さんのやりたいことをソフトウェアで実現する方法を示したり、プログラムを書いたり、簡単なサンプルのシステムを作ったり、というIT部門での支援を行う仕事なので、そのデータ解析結果がお客さんの業務にどう役立つところまでは完全に理解しきれないところもあります。
こちらの記事で紹介したようなデータ解析の手法を学ぶ本も読んではいますが、お客さんと話していると「Hadoopにデータがあってこれを何とかしたい」とか、「MongoDBにデータを入れているのでここからデータを抽出したい」とか、「scikit-learnを使って何か解析したい」という意見を聞くことがたまにあります。私自身も、あるソフトウェアやプログラムだけに特化した仕事をしていると、こう書けばできますよ、などツールありきの話になってしまいます。お客さんもそれで満足しているので良いのですが、局所最適になっていないか、本当にその先の業務につながる「生きたデータ解析」なのか、ふと思うことがあります。
河本 薫さんの本で凝り固まった考えをリフレッシュ
そうなった時に、手に取る本が河本 薫さんの「会社を変える分析の力」(講談社現代新書)です。大阪ガスのビジネスアナリシスセンターの所長をやっていた河本さんが2013年に執筆した本で、電子書籍も出ています。河本さんは2018年から滋賀大学のデータサイエンス学部の教授を務めていますが、私もデータサイエンスに近い業界にいると河本さんの流れを汲む方が特に関西エリアではよく活躍されているなという印象です。
よくあるデータ解析の本と一線を画すのが、この本はデータ解析者の心構えについて書いているからです。前段でツールありきになってしまいがちと書きましたが、河本さんのこの本ではツールや分析手法はどうでもいいというスタンスです。個々人が使いたいものを使えば良い。データ解析のベースとなる数学力がなくても分析はできるし、むしろ「こうなったときにこうなるのではないか」という仮説を作れるドメインエキスパートのほうが強みを発揮しまう。
特に河本さんの考えは「現場で役立つものでないとデータ解析は使ってもらえない」という意識が強いですが、これは大阪ガス時代に現場のスタッフとよくコミュニケーションを取って何をやりたいのか理解し、さらにデータ解析も現場でも使えるような実用的なものを提供しようとしたときの教訓だと思います。
データサイエンスに関わる身として意識したい
「〇〇をやりたいから、それを導き出す結果がデータ解析で出てこないか」と言われれば、それなら「こういうアプローチが良いですね。」という提案がしやすいですよね。その業務でデータ解析に何が求められるのか、学習したモデルの精度はどれぐらいで十分か、実行速度はどれぐらいで許容範囲か、などイメージが付くからです。私もデータサイエンスに関わる身として、こういった意識で取り組めるよう邁進したいです。
No responses yet