こんにちは!くーです。
「企業の開発は大学の研究室とは違い、今までの膨大なデータから機械学習を活かしたデータサイエンスが使えるのではないか」という考えのもと、マテリアルインフォマティクスの勉強に励んでおります。
今回は、明治大学データ化学工学研究室の金子先生の著書『化学のためのPythonによるデータ解析・機械学習入門』を紹介します。
以前紹介した『Pythonで気軽に化学・化学工学』も書かれた先生で、研究室のHPと併せて精力的にマテリアルインフォマティクスの普及に努めておられます。
そんな金子先生が、書かれた最初の本になります。
本書のデータ
リンク
著者:金子弘昌
出版社:オーム社
ページ数:224
【概要】
本書は、化学・化学工学分野でPythonを使って機械学習を行うための入門書です。
これまでに蓄積してきた実験/製造データをデータ解析・機械学習を用いて分析することで、いままでとはまったく別のアプローチで材料開発を加速させたり、プロセス管理を効率化・安定化させたりすることができます。なぜなら、実験や製造データは、目に見えない、研究者・技術者の知識・知見・経験・勘の宝庫だからです。そして、データ解析・機械学習を用いることで、これらを目に見える形にすることができるからです。
読者が一から実践できるよう、Pythonのインストール方法、データ解析・機械学習の基本理論から、材料設計、分子設計、プロセス管理について実際にサンプルプログラムとサンプルデータセットを使った実践までを丁寧に解説しています。
<公式ページより>
概要
本書は3部構成で書かれており、基礎から応用の流れになっています。
本書内のコードおよびデータはダウンロード可能となっており、自分のパソコンで実際にコードを動かすことができます。
第1部:Pythonと統計の基礎知識
本書では、タイトルにあるように“Python”というプログラミング言語を用います。
そのPythonの基本的な説明と、データの図示の仕方が第1部には書かれています。
第2部:データ解析・機械学習の基礎
ここから、本題であるデータ解析や機械学習について説明がなされます。
データ解析や機械学習の手法には様々な種類があるため、代表的な方法について「どのようなことができるのか」や「中でどのような計算が行われているのか」、「気を付けるべきことは何があるのか」ということが説明されています。
第3部:化学・化学工学データでの実践のしかた
第3部では、前の部で学習した内容を用いて、様々なケーススタディのもと機械学習を活かした課題解決方法を学びます。
材料開発や医薬品開発、果ては生産ラインでの時系列データからの異常検出など、多岐にわたるケーススタディがあります。
感想
Pythonを用いて、機械学習を活用する方法が知りたい方にはうってつけの本です!
また、以前に紹介した『Pythonで気軽に化学・化学工学』と比べると、こちらの方が内容が多岐にわたり、その分難しい印象を受けました。
また、Pythonについては、ある程度の理解力が求められ全く触ったことのない方は、Youtube等で学習する必要があります。
サンプルコードの理解は容易
サンプルコードの中に難しい文法は使われておらず、基本的なPythonの文法に関する知識と本書内の解説があれば理解できます。
そのため、簡単に自分の持っているデータセットを使って、本書と同じようなデータ解析・機械学習を行えます。
コードが理解しやすいため、パラメータの変更や数値の変更を行い、自分の求める解析方法やデータ処理方法への手直しも容易にできます。
モデルの理解には数学の知識が必須
私は、コード自体の理解はできましたが、モデルを出す際に裏で行われている計算は本書を読んでも中々理解することができませんでした。
図などによって、何となくは理解はできますが、しっかりと理解したい場合には線形代数の教科書と一緒に読む必要があります。
サンプルコードが豊富
各データ処理やデータ分析、機械学習モデルをするためのコードから、ケーススタディにおけるコードまで全てダウンロードすることができます。
そのため、基礎から応用まで自分でコードを動かしながら学ぶことができます。
以上、『化学のためのPythonによるデータ解析・機械学習入門』の紹介でした。
ちなみに、表紙には可愛らしい絵が書かれておりますが、本の中身とはほとんど関係がありませんでした(笑)
コメント