3

タグのリストを英語の辞書と照合しようとしています。私はpyenchantを使用していますが、エラーが発生し続けています。「?」を読んだ後、エラーが発生したようです。文字列ライブラリと次のコードを使用して、すべての句読点を削除しようとしました。

for punc in string.punctuation:
    title = title.replace(punc,'')

しかし、いくつかのように見えるこの文字はどうですか?辞書を捨てています。

コードスニペット:

if word not in stopwords.words('english'):
    print word, "=", d.check(word) 
    if d.check(word):       
        tags.append(word.lower())

応答:

Learning = True
Lens = True
Children = True
Pumkincom = False
Pumkin = False

** (process:49042): CRITICAL **: enchant_dict_check: assertion `g_utf8_validate(word, len, NULL)' failed
     ? =

私はPython 2.7.3とpyenchant-1.6.5-py2.7を使用しています

編集: len(word)==1 かどうかを確認することでこの問題を解決したと思いますが、なぜこれが起こるのか知りたいです。

4

1 に答える 1

3

以前にこの問題に直面しましたが、テキストに英語以外の文字が存在するためでした。単語に英語の文字のみが含まれていることを確認することをお勧めします

于 2013-08-14T18:31:10.237 に答える