【Python】seabornの色々な分布図を扱う – distplot, jointplot, pairplot

Pythonデータ分析の基礎
スポンサーリンク

初心者の独学でのプログラミング学習はとてもツライ…

プログラミングをマスターしたい!

今のIT業界はプログラミングエンジニアが不足していると言われています。
高収入の職業とも言われる分野もありますし、AI、機械学習、ディープラーニング、IOTといった注目される分野が目白押しです。

でも、いざ初心者がプログラミングをマスターしようとすると…

  • 本を読んだりネットの記事で自力で勉強しているけど限界を感じる
  • プログラミングスクールに定期的に通うのは面倒だ
  • 地方に住んでると家の近くにプログラミングスクールなんてない
  • どのプログラミング言語を学べばいいのか悩む
  • 実際の就職や転職にプログラミングが活かせるのか心配だ

など、プログラミングを自分で勉強しようとすると悩みが尽きません。

プログラミングに詳しい友人に教えてもらおうと思っても、そんな友人なんて滅多にいません。いたとしても細かく教えてくれるほど時間に余裕がある人はいないでしょう。

そんな独学でプログラミングをマスターするのに限界を感じてる方に、オンラインプログラミングスクールをがおすすめです。

おすすめのオンラインスクールはこちら

Pythonの描画ライブラリであるseabornの導入の方法はわかりました。特にこれまでの方法とそれは変わりませんね。

ここからはseabornでグラフの描画をやって行こうと思います。

seabornにはネット上(GitHub)に利用可能なデータセットが用意されています。

https://github.com/mwaskom/seaborn-data

この中にあるデータセットをload_dataset()を使って読み込んで使うことができるので、ここでもそれを利用して行きましょう。

まず、ここでは分布図を見て行くことにします。

スポンサーリンク

データの分布図を見ていく

ここからはデータの分布図を扱うことにします。データの分布を視覚化するには次のdistplot()、jointplot()、pairplot()といったメソッドを扱うことになります。これらを順に見ていくことにしましょう。

ではseabornのインポートから始めましょう。

jupyter notebookを利用するので、ここでは%matplotlib inlineも記述しています。

先ほども触れたように、seabornにあらかじめ用意してあるデータセットの’tips’をload_dataset()で読み込みtipsに格納しています。head()でデータの冒頭5つを表示します。

このデータを使ってグラフの表示をして行きましょう。(或いは、自分で適当なデータを作って利用しても構いません)

distplot()

distplot()は1つの変数データについての分布を示すことができます。

total_billの項目のデータを使ってグラフにプロットしてみます。

tipsのtotal_billを指定して、distplot()に渡しています。

 

ここでは棒グラフの他に、それに沿って描かれてる曲線が表示されています。これはカーネル密度関数(kde)で、細かい説明は別のところに譲るとして、要するにヒストグラムの分布からそれを滑らかになるように推定したものを表示したものと考えておけばよいでしょう。

このグラフのビン(bins)は自動的に表示されています。ビンとは、サンプルデータをグラフ用に並べ替えるために使用する、等間隔の区間のことです。

このグラフのkdeを非表示にして、binsを30として表示しなおしてみます。

次のコードで書き換えることができます。

kde=false, bins=30としています。

kdeの曲線が非表示になり、ビン数が変更されているのがわかります。

jointplot()

distplot()は1つのデータでしたが、jointplot()は2つの変数データを組み合わせて表示して比較することができます。グラフの種類には“scatter”、“reg”、“resid”、“kde”、“hex”といったものがあります。

scatter

ここではtotal_billとtipのデータを使ってみます。

ここではkindにscatterを適用してみました。

 

x軸、y軸に対応した分布が表示され、それぞれの軸に対応したヒストグラムも表示されているのがわかります。

hex

hexを指定すれば、六角形のヒートマップとして表示することができます。

 

reg

regはregressionで回帰直線を表示することができます。

 

pairplot()

pairplot()は、データ全体の対の関係を視覚化することができます。

次のように表示されます。

操作自体はとても簡単ですね。

また、クラスごとにデータの色を変えたい場合は、hue引数にクラスに相当するカラム名を指定します。ここではhueにsexを指定して性別で分けてみます。

ここでは、性別の色をpaletteにcoolwarmで指定してカラーリングしています。

グラフとしても意味の取りやすいものとなったのがわかると思います。

スポンサーリンク

最後に

Pythonのデータ視覚化ライブラリseabornに用意されているデータセットをload_dataset()を使って読み込んでグラフを描画してみました。

ここでは、distplot()、jointplot()、pairplot()といったメソッドで分布のプロットを視覚化してみました。

なお、ここではwarningが出ることがありますが、ここでの説明上は全く問題ないので無視してもかまいません。パッケージをアップデートすればwarningが消えるものもあります。

MacにインストールしたAnacondaのアップデート方法
MacにインストールしたAnacondaを使っていますが、パッケージなどのアップデートがあれは更新する必要も出てきます。ここでは、Anacondaのアップデートの方法についてまとめてみました。

他にもメソッドはありますので、公式ドキュメントなどに目を通すといいでしょう。

その他のものは今後扱っていく場面で出てきたときに触れて行こうと思います。

自宅学習はオンラインプログラミングスクールを活用!

自宅学習にはオンラインプログラミングスクールがおすすめ!

オンラインプログラミングスクールは独学でプログラミングを学習する時のデメリットを解消する仕組みが備わっています。

気になるところは…

学習がオンラインで完結するのはもちろんですが、独学ではできない質問サポートがあるかどうか。わからないことを現役のエンジニアが質問に答えてくれるといいですよね。

受講者個人に担当のメンターがつき、マンツーマンで学習の相談に乗ってくれることも必要で、ITエンジニアの世界についても伺えたりもすると幅が広がります。

オンライン面談だけでなく、チャット機能を使って気軽に質問を投げかけることができることも大切です。

また、オリジナルプロダクトの開発とサポートがコースの中に組み込まれていて、独学ではなかなか難しい実践的なスキルの習得にもつなげたい。

プログラミングをマスターした後の実際の仕事につながる転職サポートでがあると、ITエンジニアの世界に飛び込むのに不安が解消されます。

そんな豊富なメニューが揃っているおすすめのオンラインプログラミングスクールがこちらにあります。

おすすめのオンラインプログラミングスクールはこちら

TechAcademyはおすすめのオンラインプログラミングスクール!

オンラインのプログラミングスクールでは、テックアカデミーの充実度が目を見張ります。

オンラインで受講が完結するので、自宅学習でプログラミングをマスターしたい人にはテックアカデミーがおすすめです。

メンター制度も現役のプロが対応してくれます。大学生などが対応しているスクールに比べて本気度と専門性が違います。メンター制度の無いスクールもありますし、担当では無いメンターが対応するスクールもあったりするので、相談の質が違いますね。

チャットサポートもあるので、それが無いスクールに比べて相談の気軽さの違いがあります。

プロダクト開発のサポートで実践力が養われるだけでなく、どの講座を利用しても転職サポートが受けられるのはありがたい。

用意されているコースも、初心者向けのプログラミングコースから、Python、Java、PHP、iPhoneアプリ、AndroidといったITエンジニアのベースとなる主要な言語だけでなく、AI、データサイエンス、ブロックチェーン、webアプリケーションと行った実践的なコースまで用意しています。

他にも、webデザインやUI/UXデザイン、動画編集、webディレクションやwebマーケティングといったプログラミング以外での役立つコースまであります。

このようなたくさんの選択肢から自分にあったコースを選ぶことがでるのがテックアカデミーです。

コースの期間も短期間でマスターしたり、長期の受講でじっくり取り組むコースを選ぶこともできます。

複数講座のセットコースを利用することで大幅な割引が受けらるので、お得に受講することもできます。

無料体験もありますので、プログラミング学習でオンラインスクールを考えている人はTechAcademyをぜひ利用してみてください。

テックアカデミーの公式サイトはこちら

タイトルとURLをコピーしました