Selenium 2JavaAPIを使用してWebページを操作しています。私の質問は:リンク先のコンテンツタイプをどのように検出できますか?
基本的に、これが背景です。リンクをクリックする前に、応答がHTMLファイルであることを確認したいと思います。そうでない場合は、別の方法で処理する必要があります。したがって、PDFファイルのダウンロードリンクがあるとしましょう。アプリケーションは、ブラウザで開くのではなく、そのURLの内容を直接読み取る必要があります。
目標は、現在の場所がHTML、PDF、XML、または適切なパーサーを使用してドキュメントから有用な情報を抽出するものであるかどうかを自動的に認識するアプリケーションを作成することです。
アップデート
追加された報奨金:特定のURLのコンテンツタイプを取得できる最良のソリューションに報酬を与えます。