1

別のプロジェクト管理サイトにインポートできるように、 Google Code サイトからデータを抽出しようとするプログラムの作成を開始しようとしています。具体的には、問題の完全な詳細 (説明、コメントなど) をサイトから抽出する必要があります。

残念ながら、Google はこのための API を提供しておらず、エクスポート機能も持っていません。そのため、私には唯一のオプションは実際の HTML からデータを抽出することのように見えます (yuck)。HTMLからデータを解析しようとする「ベストプラクティス」について何か提案はありますか? これが理想的ではないことは承知していますが、選択肢があまりないと思います。他の誰かがより良い方法を考えることができますか、それとも他の誰かがすでにこれを行っているのでしょうか?

また、課題ページに CSV エクスポート機能があることは承知していますが、これは課題に関する完全なデータを提供するものではありません (ただし、出発点としては役立つ可能性があります)。

4

1 に答える 1

0

google-code-export (Github でホストされている)というプログラムを完成させました。これにより、Google Code プロジェクトを XML ファイルにエクスポートできます。次に例を示します。

>main.py -p synergy-plus -s 1 -c 1
parse: http://code.google.com/p/synergy-plus/issues/detail?id=1
wrote: synergy-plus_google-code-export.xml

... synergy-plus_google-code-export.xmlという名前のファイルを作成します。

于 2010-07-31T12:23:04.767 に答える