文字列の前後の全角空白をtrimする

文字列の前後に、半角空白やタブ文字が入っている場合、

" \thoge   \t".strip()

>>> 'hoge'

で除去できるのは、普通。

ただ、全角空白が入っていると、

" 　\thoge   \t".strip()

>>> '\xe3\x80\x80\thoge'

と、上手いこといかない。全角空白は残るし、タブも残るし、だー！ってなる。

この対応として、unicodeにしてやるとオールオッケー。

unicode(" 　\thoge   \t").strip()

>>> u'hoge'

結構ハマったぜい。

毎日Learning