【Python】PandasのDataFrameのいろいろな操作方法

Pandas
スポンサーリンク

初心者の独学でのプログラミング学習はとてもツライ…

プログラミングをマスターしたい!

今のIT業界はプログラミングエンジニアが不足していると言われています。
高収入の職業とも言われる分野もありますし、AI、機械学習、ディープラーニング、IOTといった注目される分野が目白押しです。

でも、いざ初心者がプログラミングをマスターしようとすると…

  • 本を読んだりネットの記事で自力で勉強しているけど限界を感じる
  • プログラミングスクールに定期的に通うのは面倒だ
  • 地方に住んでると家の近くにプログラミングスクールなんてない
  • どのプログラミング言語を学べばいいのか悩む
  • 実際の就職や転職にプログラミングが活かせるのか心配だ

など、プログラミングを自分で勉強しようとすると悩みが尽きません。

プログラミングに詳しい友人に教えてもらおうと思っても、そんな友人なんて滅多にいません。いたとしても細かく教えてくれるほど時間に余裕がある人はいないでしょう。

そんな独学でプログラミングをマスターするのに限界を感じてる方に、オンラインプログラミングスクールをがおすすめです。

おすすめのオンラインスクールはこちら

これまでPythonの拡張モジュールPandasのいろいろな操作をテーマ別に見てきました。

ですが、Pandasの操作にはそういった項目ではまとめられないほどたくさんの操作方法があります。

ここではPandasのDataFrameについて、いろいろな操作方法について見ていきましょう。まず、操作のための任意のDataFrameを作っておきまます。

ライブラリーをインポートして3つのカラムとそれぞれ4つのデータを持ったDataFrameを作っています。

表示するとこうなります。

これを使って、DataFrameの操作について様々な方法があるので順に見ていきます。

スポンサーリンク

ユニークな値を調べる

このデータを使って、ここではユニークなデータを扱う操作をしてみます。

‘clm2’を指定して、次のように操作してみます。

unique()は含まれているデータを重複を除いて表示します。nunique()はその数、value_counts()はデータの値とそのデータが存在する数を示しています。

実行するとこうなります。

nunique()はコメントアウトしている部分のようにunique()をlen()を使ってカウントすることと同じです。

スポンサーリンク

データの条件を指定する

DataFrameの中から、条件を指定して値を取り出すことができます。

ここでは’clm1’の中から20より大きいことを指定してみます。

次のように&などを使って条件を組み合わせることもできます。

条件にあった部分だけが取り出されているのがわかります。

スポンサーリンク

関数を適用する

DataFrameに関数を適用して操作します。

まずは自作した関数を適用してみます。

次のような関数を作ってみます。

これは値を2倍する関数です。

これをDataFrameに適用するには次のようにapply()を使います。

この関数はlambda関数を使って次のようにも書くことができます。

それぞれカラムを指定して実行するとこうなります。

もちろんPythonの組み込み関数も適用できます。

len()を使ってカラム内のデータの長さを調べるには次のようになります。

カラムを指定して、そのデータの合計を求めるには次のようにsum()が使えます。

スポンサーリンク

特定のカラムを削除する

カラムを指定して、DataFrameからその列データを削除することができます。

それにはdrop()を使ってカラムを指定し、axis=1を適用します。

指定した’clm1’のデータが削除されています。

ただし、これは元のDataFrameが変更されている訳ではありません。

完全にDataFrameから削除するには次のようにdelキーワードを使います。

スポンサーリンク

カラム名とインデックス名を取得

カラム名とインデックス名を取得するには、それぞれcolumnsとindexをドットでDataFrameにアクセスして取得します。

スポンサーリンク

ソートする

DataFrameのカラムを指定して、そのデータをソートすることができます。

ソートするにはsort_values()を使ってカラムを指定します。

データがソートされているのがわかります。「by=カラム名」で指定していますが、by=を使わずにカラム名だけでもソートできます。

スポンサーリンク

欠損値の扱い

DataFrame欠損値が存在するかどうかはisnullを使います。

これまで使ってきたDataFrameには全て値が入っているので、Falseのみが返されています。

あらためて欠損値の入ったDataFrameを作って操作していきましょう。

あらためて欠損値の有無を調べてみます。

欠損値に該当する部分がTrueで返されているがわかります。

欠損値を削除して取り出すには、dropna()を、欠損値に指定の値を入れて取り出すにはfillna()を使います。

それぞれNaNの行データが削除され、NaNの部分にanyが与えられているのがわかります。

スポンサーリンク

ピボットテーブルを作る

エクセルで表計算するときなどのように、多次元の集計をするピボットテーブルをDataFrameから作ることもできます。

次のようなDataFrameを用意してみます。

このDataFrameをピポットテーブルにするには、pivot_table()を使います。

Dをデータの値に取り、A、Bをindex、Cをcolumnに割り当てて作ってみます。

次のように書くことができます。

値の無い部分にNaNが入って、きちんと分類されているのがわかります。

スポンサーリンク

最後に

ここでは、Pythonの拡張モジュールPandasのDataFrameの様々な操作方法を見てきました。

DataFramesの操作はこれまでカテゴリー別にまとめて扱ってきましたが、それに収めて説明できない機能もたくさんあるのでここでまとめて扱ってみました。

これまで扱った操作方法同様にしっかり身につけましょう。

自宅学習はオンラインプログラミングスクールを活用!

自宅学習にはオンラインプログラミングスクールがおすすめ!

オンラインプログラミングスクールは独学でプログラミングを学習する時のデメリットを解消する仕組みが備わっています。

気になるところは…

学習がオンラインで完結するのはもちろんですが、独学ではできない質問サポートがあるかどうか。わからないことを現役のエンジニアが質問に答えてくれるといいですよね。

受講者個人に担当のメンターがつき、マンツーマンで学習の相談に乗ってくれることも必要で、ITエンジニアの世界についても伺えたりもすると幅が広がります。

オンライン面談だけでなく、チャット機能を使って気軽に質問を投げかけることができることも大切です。

また、オリジナルプロダクトの開発とサポートがコースの中に組み込まれていて、独学ではなかなか難しい実践的なスキルの習得にもつなげたい。

プログラミングをマスターした後の実際の仕事につながる転職サポートでがあると、ITエンジニアの世界に飛び込むのに不安が解消されます。

そんな豊富なメニューが揃っているおすすめのオンラインプログラミングスクールがこちらにあります。

おすすめのオンラインプログラミングスクールはこちら

TechAcademyはおすすめのオンラインプログラミングスクール!

オンラインのプログラミングスクールでは、テックアカデミーの充実度が目を見張ります。

オンラインで受講が完結するので、自宅学習でプログラミングをマスターしたい人にはテックアカデミーがおすすめです。

メンター制度も現役のプロが対応してくれます。大学生などが対応しているスクールに比べて本気度と専門性が違います。メンター制度の無いスクールもありますし、担当では無いメンターが対応するスクールもあったりするので、相談の質が違いますね。

チャットサポートもあるので、それが無いスクールに比べて相談の気軽さの違いがあります。

プロダクト開発のサポートで実践力が養われるだけでなく、どの講座を利用しても転職サポートが受けられるのはありがたい。

用意されているコースも、初心者向けのプログラミングコースから、Python、Java、PHP、iPhoneアプリ、AndroidといったITエンジニアのベースとなる主要な言語だけでなく、AI、データサイエンス、ブロックチェーン、webアプリケーションと行った実践的なコースまで用意しています。

他にも、webデザインやUI/UXデザイン、動画編集、webディレクションやwebマーケティングといったプログラミング以外での役立つコースまであります。

このようなたくさんの選択肢から自分にあったコースを選ぶことがでるのがテックアカデミーです。

コースの期間も短期間でマスターしたり、長期の受講でじっくり取り組むコースを選ぶこともできます。

複数講座のセットコースを利用することで大幅な割引が受けらるので、お得に受講することもできます。

無料体験もありますので、プログラミング学習でオンラインスクールを考えている人はTechAcademyをぜひ利用してみてください。

テックアカデミーの公式サイトはこちら

タイトルとURLをコピーしました