Python 2.6 で ahocorasick C モジュールを試してみます。KeywordTree を作成し、中国語の単語を UTF-8 で挿入してから、次のようにします。
.py ファイルで「セグメンテーション違反」が発生したか、メモリが不足します。
iPython シェルでは、問題なく動作しました。
コードは次のとおりです。
tree = ahocorasick.KeywordTree()
tree.add('头条')
Cモジュールは https://hkn.eecs.berkeley.edu/~dyoo/python/ahocorasick/ahocorasick-1.0pre.tar.gzからのものです
POST: モジュールは Python 2.7 で正常に動作します