python - 'u' は TextBlob 内のすべてのテキストの先頭に追加されます

Question

テキストデータの処理に Textblob を使用しています。

私のコードは次のとおりです。

from textblob import TextBlob
wiki = TextBlob("Python is a high-level, general-purpose programming language.")
wiki.tags

次のような出力が得られます。

[(u'Python', u'NNP'), (u'is', u'VBZ'), (u'a', u'DT'), (u'high-level', u'JJ'), (u'general-purpose', u'JJ'), (u'programming', u'NN'), (u'language', u'NN')]

それ以外の：

[('Python', 'NNP'), ('is', 'VBZ'), ('a', 'DT'), ('high-level', 'JJ'), ('general-purpose', 'JJ'), ('programming', 'NN'), ('language', 'NN')]

各単語の前に文字「u」が追加される理由は何ですか?

私はPython 2.7.6バージョンでUbuntu 14.04.2に取り組んでいます。

score 1 · Accepted Answer

これは、Python による Unicode 形式の表現です。これは、文字列の保存中や文字列操作中であっても何の影響も与えません。さらに、どの形式を表しているのかを示す記号を付けたほうがよいでしょう。これは、Python が従う規則です。

python - 'u' は TextBlob 内のすべてのテキストの先頭に追加されます

1 に答える 1

Related

Reference