毎日Learning

学んだことを共有します

文字列の前後の全角空白をtrimする

文字列の前後に、半角空白やタブ文字が入っている場合、

" \thoge   \t".strip()

>>> 'hoge'

で除去できるのは、普通。

ただ、全角空白が入っていると、

"  \thoge   \t".strip()

>>> '\xe3\x80\x80\thoge'

と、上手いこといかない。全角空白は残るし、タブも残るし、だー!ってなる。

この対応として、unicodeにしてやるとオールオッケー。

unicode("  \thoge   \t").strip()

>>> u'hoge'

結構ハマったぜい。