コミュニティでは、ページのソースコードを読み取って、リモートホスト(自分のホストではなくWebサーバー)から歌詞を抽出するアプリケーションの擬似コードを作成中です。これは、次のことを前提としています。
- 歌詞は平文で表示されています
- 歌詞を含むソースコードの一部は、Javaフロントエンドアプリケーションで読み取ることができます
質問に答えるためのソースコードを探していませんが、リモートWebページにプレーンテキストコンテンツをクエリするために使用される専門用語は何ですか?
Webページの命名スキームを決定できれば、URLオブジェクトのポインタを適切なWebページに設定できますよね?唯一の制限は不規則な大文字化であり、平文がまったく同じ場所で見つかった場合にのみ有効になります。
何か提案はありますか?「Buck65」はこういうことを考えていて、「Ilookgood」を歌っていました。
- URL url =新しいURL(http://www.elyrics.net/read/b/buck-65-lyrics/i-look-good-lyrics.html);
- 「buck-65-lyrics」と「i-look-good-lyrics」をユーザー入力を反映するように置き換えることができますか?
- PostgreSQLテーブルにリダイレクトされた入力
現在の目的:
- ユーザーは{曲、アーティスト、アルバム}の名前を要求し、JavaフロントエンドはリモートWebページを照会します
- 完全なソースコード(プレーンテキストを含む)は、Javaフロントエンドで抽出されます
- 歌詞はソースコードから抽出されます(どういうわけか)
- 曲が現在PostgreSQLサーバーによってインデックス付けされていない場合は、テーブルに追加されます。
- プログラムの目的に合わせて平文で操作します
私は方向性を探しているだけです。私が完全に間違った方向に向かっている場合は、私に知らせてください。これは擬似コード専用です。私は答えや配布物を探していません。何をする必要があるかを判断するのに助けが必要です。あなたが知っている平文を抽出するための外部ライブラリはありますか?私が達成しようとしていることにはどのような技術名がありますか?
ありがとう、タイラー