【Python】seabornでグラフのマトリックス表示 – heatmap, clutermap

Pythonデータ分析の基礎
スポンサーリンク

初心者の独学でのプログラミング学習はとてもツライ…

プログラミングをマスターしたい!

今のIT業界はプログラミングエンジニアが不足していると言われています。
高収入の職業とも言われる分野もありますし、AI、機械学習、ディープラーニング、IOTといった注目される分野が目白押しです。

でも、いざ初心者がプログラミングをマスターしようとすると…

  • 本を読んだりネットの記事で自力で勉強しているけど限界を感じる
  • プログラミングスクールに定期的に通うのは面倒だ
  • 地方に住んでると家の近くにプログラミングスクールなんてない
  • どのプログラミング言語を学べばいいのか悩む
  • 実際の就職や転職にプログラミングが活かせるのか心配だ

など、プログラミングを自分で勉強しようとすると悩みが尽きません。

プログラミングに詳しい友人に教えてもらおうと思っても、そんな友人なんて滅多にいません。いたとしても細かく教えてくれるほど時間に余裕がある人はいないでしょう。

そんな独学でプログラミングをマスターするのに限界を感じてる方に、オンラインプログラミングスクールをがおすすめです。

おすすめのオンラインスクールはこちら

Pythonの描画ライブラリseabornのグラフ表示の続きです。ここではグラフのマトリックス表示をやってみようと思います。

マトリックス表示のメソッドを使用すると、データを色分けされた行列としてプロットすることができ、データ内のクラスターを表すために使用することもできます。機械学習などでも利用することになります。

今回もload_dataset()を使ってGitHub上にあるデータセットを使っていきます。

スポンサーリンク

データの準備

ここではseabornのheatmapとclutermapを見ていくことにします。

jupyter notebookにライブラリーをインポートしてデータの準備をしておきます。

今回は、tipsだけでなくflightsのデータも読み込んで利用します。

それぞれのデータの冒頭5データを表示しておきます。

これらを使ってマトリクス表示を扱って行きましょう。

スポンサーリンク

heatmapとclustermap

ここではseabornのheatmapとclustermapを見ていくことにします。

準備したデータを使って順に見ていきましょう。

heatmap()

まず、heatmap()からみて行きます。ヒートマップが正しく機能するためには、データはすでにマトリックス形式でなければなりません。

corr()を使ってtipsデータの相関係数を出してみます。

これをheatmap()を使って表示します。

heatmap()に相関データを入れています。

相関データをヒートマップで表すことができました。

このヒートマップを少し加工してみます。

cmapにcoolwarmを指定してカラーリングを変えています。annotをTrueとすることで、ヒートマップのセルに値を出力することができます。

データの大きさに応じたカラーリングとデータ表示がなされているのがわかります。

今度は、flightsデータを使って見て行きましょう。

マトリックス形式のデータと言えば、ピボットテーブルです。flightsデータをピボットテーブルで読み込んでみましょう。

pivot_table()でglightsデータを読み込んでいます。valuesをpassengersにして、indexをmonth、columnsをyearに設定して表示します。

年毎の月別顧客データのマトリクス表示ができました。

このデータをheatmap()に渡して表示してみます。

数値を見るよりもイメージが掴みやすくなりました。年々増加していますが、特に7月、8月が多いという感じです。

このグラフをもう少し見栄えを変えてみます。

cmapでカラーマップをmagmaに変えてみました。linecolorを白に指定してセルの間に線を入れます。その幅はlinewidthsで指定します。

ちなみにcmapのパラメータはmatplotlibのドキュメント内にあります。

color example code: colormaps_reference.py — Matplotlib 2.0.2 documentation

clustermap()

clustermap()は、階層的クラスタリングを使って近い属性を持つカテゴリーが近くなるようなヒートマップを表示します。

同じflightsデータを使ってclustermapを表示してみます。

これは、年月が順番どおりではなく、乗客数である値の類似性によってグループ分けされています。ここでは、8月と7月のようなデータから事柄を推測することができることを示していて、両方とも夏の旅行の時期と読み取ることができます。

この情報をもう少し修正を加えてみます。。

standard_scaleを設定して、データの標準化を行ってみます。 標準化とは各列または各行のデータとの最小値の差を取り、それを最大値で割ったものです。0 (行), または 1 (列) で指定します。

cmapをcoolwarmを指定し、standard_scaleを1に設定してみます。

データの分布の違いがより明確になりました。

スポンサーリンク

最後に

Pythonの描画ライブラリseabornのグラフ表示について、ここではマトリックス表示をやってみました。

マトリックス表示によって、データを色分けされた行列としてプロットすることができ、データ内のクラスターを表すことができます。

heatmap()とclustermap()の表示をここでは行いました。マトリクス表示にするには、利用するデータをマトリックス形式にしておく必要があります。

自宅学習はオンラインプログラミングスクールを活用!

自宅学習にはオンラインプログラミングスクールがおすすめ!

オンラインプログラミングスクールは独学でプログラミングを学習する時のデメリットを解消する仕組みが備わっています。

気になるところは…

学習がオンラインで完結するのはもちろんですが、独学ではできない質問サポートがあるかどうか。わからないことを現役のエンジニアが質問に答えてくれるといいですよね。

受講者個人に担当のメンターがつき、マンツーマンで学習の相談に乗ってくれることも必要で、ITエンジニアの世界についても伺えたりもすると幅が広がります。

オンライン面談だけでなく、チャット機能を使って気軽に質問を投げかけることができることも大切です。

また、オリジナルプロダクトの開発とサポートがコースの中に組み込まれていて、独学ではなかなか難しい実践的なスキルの習得にもつなげたい。

プログラミングをマスターした後の実際の仕事につながる転職サポートでがあると、ITエンジニアの世界に飛び込むのに不安が解消されます。

そんな豊富なメニューが揃っているおすすめのオンラインプログラミングスクールがこちらにあります。

おすすめのオンラインプログラミングスクールはこちら

TechAcademyはおすすめのオンラインプログラミングスクール!

オンラインのプログラミングスクールでは、テックアカデミーの充実度が目を見張ります。

オンラインで受講が完結するので、自宅学習でプログラミングをマスターしたい人にはテックアカデミーがおすすめです。

メンター制度も現役のプロが対応してくれます。大学生などが対応しているスクールに比べて本気度と専門性が違います。メンター制度の無いスクールもありますし、担当では無いメンターが対応するスクールもあったりするので、相談の質が違いますね。

チャットサポートもあるので、それが無いスクールに比べて相談の気軽さの違いがあります。

プロダクト開発のサポートで実践力が養われるだけでなく、どの講座を利用しても転職サポートが受けられるのはありがたい。

用意されているコースも、初心者向けのプログラミングコースから、Python、Java、PHP、iPhoneアプリ、AndroidといったITエンジニアのベースとなる主要な言語だけでなく、AI、データサイエンス、ブロックチェーン、webアプリケーションと行った実践的なコースまで用意しています。

他にも、webデザインやUI/UXデザイン、動画編集、webディレクションやwebマーケティングといったプログラミング以外での役立つコースまであります。

このようなたくさんの選択肢から自分にあったコースを選ぶことがでるのがテックアカデミーです。

コースの期間も短期間でマスターしたり、長期の受講でじっくり取り組むコースを選ぶこともできます。

複数講座のセットコースを利用することで大幅な割引が受けらるので、お得に受講することもできます。

無料体験もありますので、プログラミング学習でオンラインスクールを考えている人はTechAcademyをぜひ利用してみてください。

テックアカデミーの公式サイトはこちら

タイトルとURLをコピーしました