日立のLumadaデータサイエンティストたちが書いた「実践 データ分析の教科書」(出版:リックテレコム)

ミーティングに参加すると、議事録を書くことも多いですよね。

リックテレコムの「実践 データ分析の教科書」(2021年8月30日第1版)。

日立と言えばLumadaというイメージはありますが、Lumadaと言えばデータサイエンスと言われるとちょっとピント来ないなと思いつつも、早速買ってみました。

日立のLumadaデータサイエンティストたちが書いた「実践 データ分析の教科書」(出版:リックテレコム)
日立のLumadaデータサイエンティストたちが書いた「実践 データ分析の教科書」(出版:リックテレコム)

出版はリックテレコム社。初めて耳にした会社ですが、最近はクラウドやデータサイエンス系の書籍に力を入れているようです。プログラムコードのサンプルもこちらのページからダウンロードできますが、この本に書いてあるログイン情報が必要になります。

【リックテレコム】実践 データ分析の教科書のWebページ

聞き慣れない会社だったので大丈夫なのかと心配したのですが、それが正夢になってしまいました。

なんと裁断不良の本が届きました。こちらは235ページの写真なのですが、「何で折れているんだろう」と疑問に思ってページを開いてみると、ページが折れて裁断されてしまったようで、折れた部分を開くと裁断残りの「耳」がありました。

裁断不良の本
裁断不良の本

まぁこのページは引用文献の紹介で裏面のP.236は用語集なので、本質的ではないのですが、これまで数十年色々な書籍を買ってきましたがこんな裁断不良は初めてのことでした。こんな品質で大丈夫なのか…。

この本はデータサイエンスの入門向けの書籍で、実際のデータ解析の例でも数値解析、テキスト解析、画像処理などを網羅しています。

執筆したのは日立の方ですが、正直、日立色は無いに等しいです。

プログラム言語はPythonばかりですし、ライブラリもTensorFlow(ディープラーニング)、scikit-learn(機械学習)、PuLP(最適化)とサードパーティ製のものを使っていて、日立独自のアルゴリズムはありません。

データベースもPostgreSQLやMySQLといったオープンソースのデータベースに言及しているだけで、日立の主力のデータベースであるHiRDBなどには言及がありません。またLumadaのアーキテクチャの説明も皆無です。本だけを読むと、日立の方が書いたなんて全くわからないですね。

そういう意味では、これまでの日立独自技術路線からオープンソースを活用する戦略に変わったのだなぁと痛感しました。日立色が薄い分、例えばデータサイエンティストを抱えているコンサルティングの会社なども同様に実践していますし、同様にできる会社は多いだろうなと感じました。

日立のLumada部隊の本ということで、私が一番期待したのは、現場適用のコツ。

LumadaというIoTプラットフォームがあるので、Lumada部隊で作ったデータ解析のモデルをそこにデプロイするところの工夫点が書いてあるかなと期待していました。IT/OTシステムを作っている日立だからこそ、他のデータサイエンス屋さんにはできないシステム展開のノウハウがあるだろう、と。

しかし、第5章の「現場適用」でも1節にさらっと抽象的なアーキテクチャ図があるだけ。

入門書とは言え、データサイエンスの出口である現場適用について、Lumadaでの実践で工夫している点や、過去にあったエピソードなど、もう少し掘り下げて欲しかったなと思いました。

実際、私が関わっているデータサイエンスのプロジェクトでは、研究所の方が作成したオープンソースのプログラムを事業部に持っていったら「事業部で使えるオープンソースのバージョンが違うのでうまく動かなかった」とか「事業部側でオープンソースのライブラリのサポートをしきれないので、コストが掛かってもサポートのある商用ツールを使って欲しい」と言われたということもありました。

Lumadaならではの現場での苦労話、結構聞きたいところなんですが…。

ただ、データサイエンスの入門としては良い本だと思いました。

No responses yet

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です