三角Validator

△をバリデートするブログ

データサイエンティスト養成読本の登竜門編

データサイエンティスト養成読本 登竜門編 (Software Design plus)

データサイエンティスト養成読本 登竜門編 (Software Design plus)

データをサイエンスする仕事に就く人が知っているべきことが一通り書かれている。データサイエンス未経験の人が0から学べるような内容になっていると思うが、9章の統計知識、10章の数理モデルのお話には数式がたくさん出てくるので、数学からしばらく距離を置いていた人は面食らうかもしれない。

Web系エンジニアにとっては、3章のシェル、4章のデータベースの内容は簡単すぎるので読み飛ばして良いと思う。逆に言うとめっちゃ基礎から説明してくれるので、今までこの辺のツールを触ってこなかった人にとってはありがたい章だと思った。こんなに丁寧に解説してくれるのかーと思って関心していた。

5章ではRStudioとJupyter Notebookのインストールから使い方までの説明が書いてある。Jupyter Notebookは今回初めて使ったけど、データに対して行った処理の履歴が残るし、処理内容や結果をmarkdown使って簡単にまとめてレポート化できるので、実際に手を動かしてみてとても便利なことが実感できた。Rについては、変数代入を <- で行ったり、パイプ演算子%>% だったりと見慣れない記法が多く、このキモさに慣れるのには少し時間がかかりそう。