Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私の要件は、flv ファイルからテキストとオーディオを抽出することです。Webクローラーを使用してこれを達成する方法を教えてください。Web クローラーでそれができない場合は、他のツールを提案してください。
ありがとうございました
Nutch を使用すると、FLV ファイルからメタデータを解析して抽出できます。テキストがメタデータの一部としてファイルに追加されている場合は、Nutch で取得してデータベースに入れることができます。
しかし、必要なものを実現するには、おそらく wget (コンテンツをダウンロードするため) + "FLV ストリーム抽出ツール" の組み合わせを検討する必要があります。
ナット
Wget
FLV メタデータ