0

2つの質問があります:)

  1. irc ボットの拡張に取り組んでいます。新しいコンテンツの RSS をチェックし、それをチャンネルに投稿することになっています。フィードパーサーを使用しています。私が見つけた唯一の方法は、すべての新しいコンテンツをファイルに保存し、数分ごとに RSS コンテンツをダウンロードして、ファイル内のコンテンツと照合することです。これは、私の意見ではちょっと奇妙です。RSS に新しいコンテンツがあるかどうかを確認する簡単な方法はありますか? どうも

  2. コンテンツをファイルに保存すると、一部の部分が Unicode (チェコ語の特殊文字) - u"xxx" でエンコードされることがあります。しかし、それらをutf8としてファイルに保存したい。どうすればいいのですか?

4

1 に答える 1

2
  1. RSSアイテムには通常、GUIDまたはリンクが関連付けられています。存在する場合はGUIDを使用し、存在しない場合は、各アイテムを一意に識別するためのリンクを使用します。RSS形式では前回から何が変わったかがわからないため、以前に見たものを追跡する必要があります。本当に他に方法はありません、私は恐れています。

  2. data(Unicodeオブジェクト)をUTF-8に保存するには、ファイルに書き込むときにエンコードするだけです。

    output.write(data.encode('utf8'))
    

エンコーディングとデコーディングの意味を完全に理解するには、 UnicodeとPythonUnicodeHOWTOに関するJoelSpolskyの記事を読んでください。

于 2012-09-11T13:37:21.153 に答える