データ分析

Pythonデータ分析の基礎

【Python】NumPyのarrayとimageファイルで画像処理 – pillow(PIL)

PythonのライブラリーNumPyの配列を使って画像ファイルを操作します。ここでは画像処理ライブラリのpillow(PIL)を導入し、RGBカラーモデルの表現も確認します。読み込んだ画像ファイルデータのカラーを変換する操作を行います。
Pythonデータ分析の基礎

【Python】seabornでグラフのスタイルとカラーを操作する

Pythonの描画ライブラリseabornのグラフ描画について、スタイルの変更やカラーリングの設定をset_style()、despine()、set_context()などから見ていきます。カラーコードやラインスタイルも確認しましょう。
Pythonデータ分析の基礎

【Python】seabornで回帰モデルの表示 – Implot()

Pythonの描画ライブラリseabornの回帰モデルの表示を扱います。ここではseabornに組み込まれている回帰モデルのlmplot()関数を見ていきます。回帰分析については機械学習の分野でもっと詳細に扱おうと思っています。
スポンサーリンク
Matplotlib

【Python】seabornでグラフのグリッド表示 – PairGrid, pairplot, FacetGrid, JointGrid

Pythonの描画ライブラリseabornのグリッド表示を扱います。データを特徴ごとに分けられたグラフ作成に役立ちます。ここではPairGrid()、pairplot()、FacetGrid()、JointGrid()を見ていきます。
Pythonデータ分析の基礎

【Python】seabornでグラフのマトリックス表示 – heatmap, clutermap

Pythonの描画ライブラリseabornのグラフ表示について、heatmap()とclustermap()を使ってマトリックス表示をやっていきます。データを色分けされた行列として表示し、データ内のクラスターを表すことができます。
Pythonデータ分析の基礎

【Python】seabornでカテゴリーの分類データを描画

Pythonのライブラリseabornを使って分類データを描画します。catplot()、boxplot()、violinplot()、stripplot()、swarmplot()、barplot()、countplot()を扱います。
Matplotlib

【Python】seabornの色々な分布図を扱う – distplot, jointplot, pairplot

Pythonのデータ視覚化ライブラリであるseabornに用意されているデータセットをload_dataset()を使って読み込んでグラフを描画してみました。distplot()、jointplot()、pairplot()を扱います。
Matplotlib

【Python】seabornの導入 – 簡単に美しいグラフ描写ができるライブラリ

ここでは、Pythonのデータ可視化ライブラリであるmatplotlibをベースにしたグラフ描画ライブラリのseabornの導入を扱います。seabornを使うとmatplotlibで描画したグラフを簡単に綺麗な表示にしてくれます。
Pythonデータ分析の基礎

【Python】Matplotlibでグラフ表示するための色々な使い方

Pythonの外部ライブラリMatplotlibを使ってデータをグラフで可視化する時の色々なメソッドがあります。複数のグラフ表示や、色やマーカーなどのオプション、タイトルの設定、凡例の表示などグラフに必要な情報を加える方法を見ていきます。
Matplotlib

【Python】Matplotlibの導入と基本操作 – はじめの一歩

Matplotlibは、Pythonを使ってデータを視覚化するためのライブラリです。いろんなグラフに表示することができます。ここではMatplotlibのインストール、導入、日本語化、簡単なデータのグラフの描画の方法について扱います。
Pandas

【Python】PandasのDataの読み込み・書き込み – CSV, Excel, HTML, SQL

Pythonの拡張モジュールPandasを使ってデータの入力と出力を扱います。pd.read_メソッドを使ってさまざまな種類のファイルを読み出すことができます。ここではCSV、Excel、HTML、SQLの4つの一般的なデータ型を扱います。
Pandas

【Python】PandasのDataFrameのいろいろな操作方法

Python拡張モジュールPandasのDataFrameの様々な操作方法を見ていきます。unique(), drop(), sort_values(), dropna(), fillna(), pivot_table() などを扱います。
Pandas

【Python】PandasのDataFrameの組み合わせ- merge(), join(), concate()による結合

Pythonの拡張モジュールPandasで複数のDataFrameを組み合わせる方法を見ていきます。それには主に3つの方法があります。merge(), Join(), concate()を使ってDataFrameの結合をみていきましょう。
Pandas

【Python】Pandasのgroupbyでデータを集約する

Pythonの拡張モジュールPandasを使ってデータの集約を行ないます。データの集約はそのままsum()やmean()を使えば全体の様子を掴めますが、groupby()によってインデックスや列に条件をつけて詳細に絞り込むことができます。
Pandas

【Python】Pandasの欠損値の除外と代入処理 – dropna(), fillna()

Pythonの拡張モジュールPandasを使って、欠損値を処理する操作を行ないます。データの欠落部分をデータ全体から削除するメソットdropna()、欠損値の代わりに値を置き換えるfillna()メソッドの操作を見ていきましょう。
Pandas

【Python】PandasでDataFrameオブジェクトを作る

Pythonの拡張モジュールPandasのDataFrameを扱います。DataFrameは一連のデータオブジェクトをまとめて、同じインデックスを共有することができます。DataFrameはPandasの主要な機能と言っていいと思います。
Pandas

【Python】PandasでSeriesオブジェクトを作る

Pythonの拡張モジュールPandasは、数表や時系列データを操作するためのデータ構造の分析と演算をすることができます。ここではPandasでSeriesを作る操作を学びます。Seriesは軸ラベルを持つのがNumPy配列との違いです。
NumPy

【Python】NumPyの配列の演算 – NumPy Operations, ufunc

PythonのライブラリーNumPyを使って配列の演算を行います。四則演算などの各種演算ができるだけでなく、ユニバーサル関数(ufunc)というものを使えば、演算処理の速度を上げることができるので、大量のデータを計算するには有用です。
スポンサーリンク