Pythonでのデータ分析に必要なNumPy、Pandas、Matplotlibについての基本的な知識
【Python】NumPyのarrayとimageファイルで画像処理 – pillow(PIL)
PythonのライブラリーNumPyの配列を使って画像ファイルを操作します。ここでは画像処理ライブラリのpillow(PIL)を導入し、RGBカラーモデルの表現も確認します。読み込んだ画像ファイルデータのカラーを変換する操作を行います。
【Python】seabornでグラフのスタイルとカラーを操作する
Pythonの描画ライブラリseabornのグラフ描画について、スタイルの変更やカラーリングの設定をset_style()、despine()、set_context()などから見ていきます。カラーコードやラインスタイルも確認しましょう。
matplotlibでグラフを描くためのラインスタイル、マーカー、カラーマップのリファレンス
matplotlibでグラフを描く時にラインスタイル、マーカー、カラーマップを指定しますが、どんな値を指定するのか覚えてはいません。公式ドキュメントを探すのにも手間がかかります。そこでここにリファレンス一覧としてリンクをまとめてみました。
【Python】seabornで回帰モデルの表示 – Implot()
Pythonの描画ライブラリseabornの回帰モデルの表示を扱います。ここではseabornに組み込まれている回帰モデルのlmplot()関数を見ていきます。回帰分析については機械学習の分野でもっと詳細に扱おうと思っています。
【Python】seabornでグラフのグリッド表示 – PairGrid, pairplot, FacetGrid, JointGrid
Pythonの描画ライブラリseabornのグリッド表示を扱います。データを特徴ごとに分けられたグラフ作成に役立ちます。ここではPairGrid()、pairplot()、FacetGrid()、JointGrid()を見ていきます。
【Python】seabornでグラフのマトリックス表示 – heatmap, clutermap
Pythonの描画ライブラリseabornのグラフ表示について、heatmap()とclustermap()を使ってマトリックス表示をやっていきます。データを色分けされた行列として表示し、データ内のクラスターを表すことができます。
【Python】seabornでカテゴリーの分類データを描画
Pythonのライブラリseabornを使って分類データを描画します。catplot()、boxplot()、violinplot()、stripplot()、swarmplot()、barplot()、countplot()を扱います。
【Python】seabornの色々な分布図を扱う – distplot, jointplot, pairplot
Pythonのデータ視覚化ライブラリであるseabornに用意されているデータセットをload_dataset()を使って読み込んでグラフを描画してみました。distplot()、jointplot()、pairplot()を扱います。
【Python】seabornの導入 – 簡単に美しいグラフ描写ができるライブラリ
ここでは、Pythonのデータ可視化ライブラリであるmatplotlibをベースにしたグラフ描画ライブラリのseabornの導入を扱います。seabornを使うとmatplotlibで描画したグラフを簡単に綺麗な表示にしてくれます。
【Python】Matplotlibでグラフ表示するための色々な使い方
Pythonの外部ライブラリMatplotlibを使ってデータをグラフで可視化する時の色々なメソッドがあります。複数のグラフ表示や、色やマーカーなどのオプション、タイトルの設定、凡例の表示などグラフに必要な情報を加える方法を見ていきます。
【Python】Matplotlibの導入と基本操作 – はじめの一歩
Matplotlibは、Pythonを使ってデータを視覚化するためのライブラリです。いろんなグラフに表示することができます。ここではMatplotlibのインストール、導入、日本語化、簡単なデータのグラフの描画の方法について扱います。
【Python】PandasのDataの読み込み・書き込み – CSV, Excel, HTML, SQL
Pythonの拡張モジュールPandasを使ってデータの入力と出力を扱います。pd.read_メソッドを使ってさまざまな種類のファイルを読み出すことができます。ここではCSV、Excel、HTML、SQLの4つの一般的なデータ型を扱います。
【Python】PandasのDataFrameのいろいろな操作方法
Python拡張モジュールPandasのDataFrameの様々な操作方法を見ていきます。unique(), drop(), sort_values(), dropna(), fillna(), pivot_table() などを扱います。
【Python】PandasのDataFrameの組み合わせ- merge(), join(), concate()による結合
Pythonの拡張モジュールPandasで複数のDataFrameを組み合わせる方法を見ていきます。それには主に3つの方法があります。merge(), Join(), concate()を使ってDataFrameの結合をみていきましょう。
【Python】Pandasのgroupbyでデータを集約する
Pythonの拡張モジュールPandasを使ってデータの集約を行ないます。データの集約はそのままsum()やmean()を使えば全体の様子を掴めますが、groupby()によってインデックスや列に条件をつけて詳細に絞り込むことができます。
【Python】Pandasの欠損値の除外と代入処理 – dropna(), fillna()
Pythonの拡張モジュールPandasを使って、欠損値を処理する操作を行ないます。データの欠落部分をデータ全体から削除するメソットdropna()、欠損値の代わりに値を置き換えるfillna()メソッドの操作を見ていきましょう。
【Python】PandasでDataFrameオブジェクトを作る
Pythonの拡張モジュールPandasのDataFrameを扱います。DataFrameは一連のデータオブジェクトをまとめて、同じインデックスを共有することができます。DataFrameはPandasの主要な機能と言っていいと思います。
【Python】PandasでSeriesオブジェクトを作る
Pythonの拡張モジュールPandasは、数表や時系列データを操作するためのデータ構造の分析と演算をすることができます。ここではPandasでSeriesを作る操作を学びます。Seriesは軸ラベルを持つのがNumPy配列との違いです。