0

現在、ビデオの URL リンクをスキャンまたはクロールする必要があるときに、いくつかの問題が発生しています。この Web ページは、Flash ベースの技術を使用してビデオを埋め込み、ビデオをストリーミングしています。

より明確に理解するために、これはリンクの例です。

http://vnexpress.net/gl/the-gioi/tu-lieu/2012/11/bai-phat-bieu-thua-nhan-that-bai-cua-romney/

上記のリンクには以下のコンテンツがあります (Flash 埋め込みビデオの HTML コード):

        <div id="flashContent" style="text-align:center;width:100%;">                                                   
            <span id="FlashPlayer79237" class="Normal" align="center">B&#7841;n c&#7847;n c&#224;i <a href="http://www.macromedia.com/go/getflashplayer">Flash Player</a> &#273;&#7875; xem &#273;&#432;&#7907;c Clip n&#224;y.</span>              
        </div>          

この上記の記事には、上記のビデオがあります。ただし、コンテンツをスキャンまたはクロールしようとすると、ビデオが正しく実行されず (正しいビデオ リンクを読み込めなかったため)、Install Flash Player プラグインの単語しか表示されませんでした (確かに、実際の Web ページでは Javascript スクリプトを実行する必要があります)。実際のビデオ リンクを取得し、このビデオをユーザーにストリーミングするための Flash スクリプト)

したがって、PHP、ASP.NET、または Java を介して Flash および Javascript スクリプトをレンダリングするにはどうすればよいでしょうか? Web ページをクロールするときに正しいビデオ リンクを取得するにはどうすればよいですか? この場合、正しいFlash 埋め込みビデオ (HTML コード)を取得するにはどうすればよいですか?

どうもありがとう。

4

1 に答える 1

0

答える前に、何か怪しいことをするためにこの情報が必要な場合は...しないでください.

免責事項はさておき、その特定のサイトについては比較的簡単です。

flashvars パラメータ (おそらく Javascript によってそこに配置されます) には、xmlPath と呼ばれる値が含まれています。これは、(ドメイン名に関連する) URL エンコードされたパスです。それをつかんでデコードすると、次のようになります。

/Service/FlashVideo/PlayListVideoPage.asp?id=79237&f=108&t=1

を指す

 http://vnexpress.net/Service/FlashVideo/PlayListVideoPage.asp?id=79237&f=108&t=1

それを読むと、それは実際のビデオの URL を含む XML ファイルです。

その値がどこから生成されるかはよくわかりません。これを完全にサーバー側で行う必要がある場合は、ヘッドレス ブラウザーを使用して処理できます。

于 2012-12-11T08:41:51.380 に答える