特定のテキストを調べて、その前に # タグが付いた単語を抽出することを目的とした小さなアプリをプロジェクトに組み込みました。
テキストが英語で受信された場合は完全に機能しますが、アラビア語または中国語を使用すると機能しません。外国語にも適応させるにはどうすればよいですか?
私のmodel.pyで私が書いた
class Article(models.Model):
def _strip_hash_tags(self, ):
return tuple([tag.strip("#") for tag in self.content.split() if tag.startswith("#")])
def save(self, force_insert=False, force_update=False, using=None):
super(Article, self).save(force_insert=force_insert, force_update=force_update, using=using)
# first remove all associatd tags with object
Tag.objects.remove_all_tags(self)
# then, look through content field and insert all tagged words
for tag in self._strip_hash_tags():
Tag.objects.add_tag(self, tag)