データサイエンティスト養成読本の登竜門編
データサイエンティスト養成読本 登竜門編 (Software Design plus)
- 作者: 高橋淳一,野村嗣,西村隆宏,水上ひろき,林田賢二,森清貴,越水直人,露崎博之,早川敦士,牧允皓,黒柳敬一
- 出版社/メーカー: 技術評論社
- 発売日: 2017/03/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
データをサイエンスする仕事に就く人が知っているべきことが一通り書かれている。データサイエンス未経験の人が0から学べるような内容になっていると思うが、9章の統計知識、10章の数理モデルのお話には数式がたくさん出てくるので、数学からしばらく距離を置いていた人は面食らうかもしれない。
Web系エンジニアにとっては、3章のシェル、4章のデータベースの内容は簡単すぎるので読み飛ばして良いと思う。逆に言うとめっちゃ基礎から説明してくれるので、今までこの辺のツールを触ってこなかった人にとってはありがたい章だと思った。こんなに丁寧に解説してくれるのかーと思って関心していた。
5章ではRStudioとJupyter Notebookのインストールから使い方までの説明が書いてある。Jupyter Notebookは今回初めて使ったけど、データに対して行った処理の履歴が残るし、処理内容や結果をmarkdown使って簡単にまとめてレポート化できるので、実際に手を動かしてみてとても便利なことが実感できた。Rについては、変数代入を <-
で行ったり、パイプ演算子が %>%
だったりと見慣れない記法が多く、このキモさに慣れるのには少し時間がかかりそう。