Pythonでの文字列を操作をやってきましたが、他にもいろんなメソッドを利用した操作ができます。
ここではそのメソッドを使って文字列をいろいろと触ってみたいと思います。
ただし、ここで全てのメソッドを扱うことは不可能ですので、よく見かけるメソッドをいくつかみていこうと思います。
Pythonでの文字列のメソッドいろいろ
それではPythonで文字列を操作する代表的なメソッドをいくつか順にみていきましょう。
次のような文章の文字列を代入した変数を用意して操作して行きましょう。
I am playing with Python. It is not a serpent Python.
「私はPythonで遊んでいます。蛇のPythonではありません。」をgoogle翻訳してみました。英訳が正しいかどうかはこの際関係ありません。この英文を変数sに代入します。
s = "I am playing with Python. It is not a serpent Python."
この変数を使って操作していきます。
len()で文字列の長さを調べる
まずはlen()を使ってみましょう。これは文字列の長さを調べるメソッドです。すでに別のところでも触れているメソッドます。
len(文字列)の形で利用します。
len()の中に文字列を代入した変数sを入れてprintで出力します。コードはこのようになります。
s = "I am playing with Python. It is not a serpent Python."
print(len(s))
今回はAtomエディタを使ってPythonコードを実行してみましょう。ファイル名はstring_method.pyにしています。
結果は「53」と出力されています。この変数に代入された文字列は、スペースも含めて53文字であるということがわかります。
in演算子を使って存在の有無を調べる
次は文字列の中に、特定の文字や文字列が含まれるかどうかをin演算子を使って調べてみましょう。
s = "I am playing with Python. It is not a serpent Python."
in_python_word = "Python" in s
in_php_word = "PHP" in s
print(in_python_word)
print(in_php_word)
“「調べたい文字列」” in 「元の文字列」という形で調べます。
今回は「Python」「PHP」の文字列が変数sに含まれていいる文字列の中にあるかどうかを調べています。存在している場合は「True」、無い場合は「False」が出力されます。
このコードを実行してみると次のようになります。
文字列の中に「Python」は含まれて、「PHP」は含まれていないということがわかりました。実際にそうなってますよね。
split()で分割する
split()を使って文字列を分割してみましょう。
文字列の変数の後ろにピリオド「.」を入力し、それに続けてsplit()を入力します。
文字列.sprit()という形で利用します。
次のようなコードになり、printで出力しています。
s = "I am playing with Python. It is not a serpent Python."
print(s.split())
これを実行すると、次のように出力されます。
それぞれの単語ごとに分割されて、カッコ([])の中に入れられているのがわかります。これは別のところでも触れますが、リスト形式の表現です。
split()をそのまま使うとセパレータとして空白文字が使われます。この場合はスペースで区切られているということですね。
では、セパレータにピリオドを使ってみましょう。文章に2箇所ありますからね。split(“.”)のようにセパレータを指定して使います。
コードを書き換えるとこうなります。
s = "I am playing with Python. It is not a serpent Python."
print(s.split("."))
実行結果はこうなります。
セパレータのピリオドのところで分割されているのがわかりますね。
もう一つやってみましょう。こちらはセパレータに「t」を使ってsplit(“t”)で実行しています。
文章がtで分割されているのがわかりますね。
join()で結合する
次は結合です。join()を使います。これはsplit()とちょうど逆の関数で、文字列のリストを一つの文字列に結合してくれます。
クォートで囲んだ結びつける文字列の後ろにピリオド「.」を入力し、それに続けてjoin()のカッコの中に文字列のリストを入れることで結合します。
文字列.join([文字列のリスト])という形で利用します。
具体的にやっていきましょう。上のsplitの実行結果のリストを利用して、逆のことをやってみます。
s = ['I am playing wi', 'h Py', 'hon. I', ' is no', ' a serpen', ' Py', 'hon.']
t = "t"
print(t.join(s))
リストを変数sに代入し、結合する文字をtにしました。(変数は本来はもっと見ただけで変数の意味がわかるような綴りにした方がいいです)
このコードを実行すると、このようになります。
全てが「t」で結合されて、元の文章に戻っているのがわかりますね。
find()で検索する
次はfind()を使って、文字列の検索をしてみましょう。対象の文字列から検索したい文字列がどこにあるのか調べることができます。
対象の文字列.find(検索したい文字列)という形で利用します。
ここでは対象の文字列の中に「Python」という文字が含まれているかどうかを調べてみます。コードは次のようにしてみましょう。
s = "I am playing with Python. It is not a serpent Python."
print(s.find("Python"))
実行するとこうなります。
実行結果に「18」と表示されています。これは「Python」という文字列が先頭の「0」から数えて18文字目のところにあるという意味になります。
例に挙げている文章の文字列には、「Python」という文字列が最後にもう一つあります。これを後ろから見つけたい場合は、find()の代わりにrfind()を使います。
同じようにやってみましょう。
s = "I am playing with Python. It is not a serpent Python."
print(s.rfind("Python"))
findをrfindに変えただけです。
これを実行するとこうなります。
0から数えて46番目のところに後ろ側の「Python」があることがこれでわかります。
count()で数える
len()関数を使うと全体の個数を数えることができましたが、文字列の中に特定の文字列がいくつあるかを数えるにはcount()を使えばわかります。
対象の文字列.count(数えたい文字列)という形で利用します。
ここではこれまで使っている例文の中に文字列「Python」がいくつあるか数えるということをやってみましょう。ついでに「n」もいくつあるか数えてみます。
コードはこう書いてみましょう。
s = "I am playing with Python. It is not a serpent Python."
print(s.count("Python"))
print(s.count("n"))
これを実行するとこうなります。
「Python」は2個、「n」は5個あるということがわかりました。
実際に数えてみるとそうなっていますね。
capitalize()、title()、upper()、lower()で文字変換
次は、capitalize()、title()、upper()、lower()をまとめて解説しましょう。これらは文字列の大文字・小文字を操作する時に使います。
- capitalize()は先頭の単語をタイトルケースに変換する
- title()は全ての単語をタイトルケースに変換する
- upper()は全ての文字を大文字に変換する
- lower()は全ての文字を小文字に変換する
全て、文字列にピリオドで接続して利用します。
メソッド順にまとめてコードを書いてみましょう。
s = "I am playing with Python. It is not a serpent Python."
print(s.capitalize())
print(s.title())
print(s.upper())
print(s.lower())
これを実行すると、こうなります。
それぞれ順に、先頭の単語だけタイトルケース、全ての単語がタイトルケース、全て大文字、全て小文字、となっているのがわかりますね。
replace()で置換する
今度は置き換えをやってみましょう。それにはreplace()を使います。
対象の文字列.replace(元の文字列, 置換したい文字列)という形で利用します。
これまでの例文の前半を使って、文字列「Python」を「Swift」に置き換えるコードを書いてみます。
s = "I am playing with Python."
print(s.replace("Python", "Swift"))
これを実行するとこうなります。
元の文の「Python」の部分が「Swift」に置換されているのがわかりますね。
まとめ
以上、文字列のメソッドについていくつか使ってみました。これらは、おそらくよく見かけるものだと思います。
他にもたくさんメソッドはありますが、今後はPythonの学習を進めていく中で、その都度使い方をみていくことにします。
他にどんな文字列メソッドがあるのか知りたい人は、公式ドキュメントや書籍などを参考にしてみてください。