リンクhttp://www.lyricsfreak.com/search.phpが利用できないため、エラーが表示されます。時々リストアップすると言うと、実際に起こるのはホームページへのリダイレクトです。したがって、http://www.lyricsfreak.com/search.php を使用する代わりに、ホームページ リンク http://www.lyricsfreak.com/ を使用できます。
コメントに基づくサンプル
Ok。jsoup を使用して Java プログラムから検索した後にトラックを読みたいとします。Lyricsfreak の問題は、結果を返す前にソースをチェックすることです。クエリのソースが Lyricsfreak.com でない場合、access_error.htm にリダイレクトされ、そこから以下のスクリプトを使用して再度送信し、3.5 秒後に結果を取得します。
<script type="text/javascript">
var redirect_url = document.location.href.match(/\?(.*)/);
redirect_url = redirect_url ? '/search.php?' + redirect_url[1] : '/';
setTimeout(function() { document.location.href = (redirect_url); }, 3500);
</script>
ここでできることは、referrer
jsoup を介して 'lyricsfreak.com' として設定することで、access_error なしで適切な結果が得られます。したがって、サンプルコードは次のようになります。もちろん、より良い方法でページを解析することもできますが、これはアイデアを提供するためのものです。
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class LyricsParser {
public static void main(String[] args) throws Exception {
String SEARCH_STRING = "Madonna";
String URL = "http://www.lyricsfreak.com/search.php?a=search&type=song&q=";
List<String> artists = new ArrayList<String>();
List<String> songs = new ArrayList<String>();
List<String> hits = new ArrayList<String>();
Document doc = Jsoup.connect(URL + SEARCH_STRING)
.referrer(URL + SEARCH_STRING).get();
for(Element tracks : doc.select("td.colfirst")){
for(Element links : tracks.getElementsByTag("a")){
artists.add(links.text());
}
}
for(Element tracks : doc.select("td > a.song")){
for(Element links : tracks.getElementsByTag("a")){
songs.add(links.text());
}
}
for(Element tracks : doc.select("td.colast")){
hits.add(tracks.text());
}
int length = artists.size();
for(int i=0; i<length; i++){
System.out.println("[" + artists.get(i) + ",\t" + songs.get(i) + ",\t" + hits.get(i+1) + "]");
}
}
}