タグのリストを英語の辞書と照合しようとしています。私はpyenchantを使用していますが、エラーが発生し続けています。「?」を読んだ後、エラーが発生したようです。文字列ライブラリと次のコードを使用して、すべての句読点を削除しようとしました。
for punc in string.punctuation:
title = title.replace(punc,'')
しかし、いくつかのように見えるこの文字はどうですか?辞書を捨てています。
コードスニペット:
if word not in stopwords.words('english'):
print word, "=", d.check(word)
if d.check(word):
tags.append(word.lower())
応答:
Learning = True
Lens = True
Children = True
Pumkincom = False
Pumkin = False
** (process:49042): CRITICAL **: enchant_dict_check: assertion `g_utf8_validate(word, len, NULL)' failed
? =
私はPython 2.7.3とpyenchant-1.6.5-py2.7を使用しています
編集: len(word)==1 かどうかを確認することでこの問題を解決したと思いますが、なぜこれが起こるのか知りたいです。