0

そこにはたくさんの音楽歌詞サイトがあります。しばらく前に、私が参加しているバンドの歌詞を見ていました。そして、「このサイトはどのようにしてこれらの歌詞をすべて取得し、どうすればこのようなものを手に入れることができるのでしょうか?」と考えました。当時はあまり見つけることができなかったので、基本的にバンド情報と歌詞のサイトを解析し、作成したデータベースにデータを配置するプログラムを作成することにしました。

しかし、これらのサイトがどのようにデータを取得しているのか、まだ疑問に思っています。私の方法はあまり効率的ではなく、非常にサイト固有であり、サイトがスクリプト構造を変更した場合、解析プログラムを変更する必要があります。もっと簡単な方法があるはずです。

誰の考えも大歓迎です!

4

2 に答える 2

1

JSONまたはXMLファイルのいずれかだと思います。「手に入れる」には、Web サイトからデータをダウンロードするさまざまな方法と手段があります。wget は 1 つの手段です。私はそれを容認しているわけではありませんが、ほとんど秘密ではありません

于 2013-09-05T20:48:25.550 に答える
0

Web サイトのほとんどは、ユーザーから歌詞を取得します。たとえば、Musixmatch では、歌詞がデータベースに存在しない場合、ユーザーは歌詞を作成できます。ユーザーが歌詞を作成すると、おそらく musixmatch のデータベースに自動的に保存されます。ユーザーが歌詞をアップロードできる歌詞のウェブサイトはたくさんあります。

ウェブサイトがデータを取得する別の方法は、あなたが言ったように、パーサー/スクレーパーを作成して他の誰かのウェブサイトを通過するデータマイニングです。

于 2015-01-16T23:41:02.597 に答える