これまでPython3の基礎をPythonプログラミング入門編として、ここで学んできました。基本的なデータ型からデータ構造、フロー制御と学んできています。
まだまだPythonの入門学習の範囲は続きますし、Pythonプログラミング難度も上がって入門編からより実践的な内容も増やして行きます。
ということで、Python自体のマスターする内容はまだまだ続くのですが、Pythonを使ってちょっと目先を変えたこともやってみたいですよね。
Pythonでデータ分析を始めよう!
これまで、Pythonのデータ型、データ構造、フロー制御について既に学んできています。これらの知識があれば、Pythonのデータ分析、データサイエンスの入門的な知識を理解することが可能だと思います。
そこで、ここにPythonデータ分析入門編として、作業環境の準備やデータ分析に必要となるパッケージ(NumPy, Pandas, Matplotlibなど)の基本的な操作の仕方についてここで学んでいくことにします。
最近流行りの機械学習、ディープラーニング、AIといった分野にも後々に繋がっていく分野でもあります。Pythonの言語自体を学ぶ入門編よりも楽しく学習することができるかもしれませんね。
Pythonデータ分析の作業環境構築 – Anaconda, jupyter notebook
入門編でも触れていますが、私の使っているパソコンはMacBook Proですので、Windowsの人は操作方法を少し読み換える必要があるかもしれませんので、そのあたりはご理解ください。それほど混乱することはないとは思います。
では、さっそく作業環境の構築をはじめていきましょう。
Anacondaのインストール
まずPythonを使ってのデータ分析ということですから当然Pythonが必要です。ここではAnacondaでインストールしたPythonを利用します。
このブログではすでにPython学習の入門編ですでにインストールしていますので、Anacondaのインストール方法はこちらを確認してください。
PythonのバージョンはPython3を使います。
jpyter notebookの利用
次に実際にコード書いていくエディタですが、データ分析などでもよく使われているjuupyter notebookを利用します。インタラクティブに操作ができ、編集などもやりやすいツールです。
jpyter notebookはAnacondaをインストールすれば一緒に使えるようになっていますので、特に何もする必要はありません。
基本的なjupyter notebookの使い方についてはこちらにまとめています。
これでとりあえずの準備は完了しました。
あとはデータ分析に必要なライブラリNumPy, Pandas, Matplotlibなど)の導入ですが、おそらくAnacondaをフルでインストールしたのであれば、すでに一緒にインストールされているのではないかと思います。
インストールされていなくても簡単にできるので、ライブラリを使う最初の時点で触れようと思います。
まとめ
Pythonのデータ型、データ構造、フロー制御についての知識があれば、Pythonのデータ分析に必要な入門的な知識を学ぶことができます。
データ分析の環境構築にはAnacondaをインストールしてPythonとjupyter notebookを使って作業していきます。必要なライブラリも既にインストールされている場合もあるので、Anacondaはとても便利です。
データ分析の基礎は、最近流行りの機械学習やディープラーニング、AIなどにも繋がる知識ですのでしっかりマスターしましょう。