2015年2月12日木曜日

文字列の分割(.split())について

PythonやSwiftでの文字列操作ですごく便利なのが
.split()
です。

引数を省略した場合は' '(スペース)で区切られるかと思います。しかし、web上のファイルは'\t'(タブ)で区切られていることが多いです。CSVファイルであれば','で読みます。

ここで、複数の種類の文字で分割するにはどうすればよいか。

解決法は、2つあります。ひとつは正規表現(reモジュール)を使うこと、もうひとつは、文字列を先に.replace()しておくことです。分割しようと思ってる部分なので、問題はないはずです。

正規表現は便利ですが、忙しい時などは、後者の方法のほうが手軽に書けます。前者のドキュメントはどこにでもあるので、後者について書きます。

つまり、文字列変数stringをタブ、スペース、コンマの全てで区切りたいときは、
string.replace('\t',' ')
string.replace(',',' ')
list = string.split()
こうすればできます

非常に簡単なので、よく使います・・・

0 件のコメント:

コメントを投稿