仕事用ネットワーク上のサイトから情報を取得するための自動化されたプロセスを作成しようとしています。
var duderegex = new RegExp("Title for Mr. [^\n]+","m");
var dude = duderegex.exec(input);
ここまでは順調ですね。問題は、私が仕事用のコンピューターでこれを書いているので、それをホストしているサイトと同じドメインにこれを保存するようにだれにも説得できないことです。つまり、技術的にはXSSになります。そして、真剣にファンキーなものをインストールするために承認を得る必要はありません(たとえば、JQueryやコピー/貼り付けが簡単なPowerShellを保証することはできません)。
ファイルのダウンロードとダウンロード後のWebページからの操作に問題はありませんが、[名前を付けて保存...]をクリックする手順が追加されます。
別のドメインのHTMLソースで正規表現を実行するための実行可能なソリューションはありますか?Javascriptに限定する必要はありませんが、たとえばPHPを機能させるには、私が持っているよりも多くのリソースが必要になる場合があります。
コメント投稿者が説明を求めたので、ここに行きます。1日に50人の著作権所有者に連絡する必要があるとしましょう(知的財産とは関係ありませんが、機能します)。今、私は私をに連れて行くフォームを持っています
(1) http://foo.bar/form.htm?action=search&type=ArtistAlbum&Artist=Beatles&Album=White
にリダイレクトします
(2) http://foo.bar/form.htm?id=4578469
そこから、ドロップダウン(トラックリストなど)をクリックすると、次の場所に移動します。
(3) http://foo.bar/form.htm?id=4578469&track=7
そこには、トラックで働いたすべての人、その代理人、および法定代理人のアルファベット順のリストがあります。歌詞の著作権を持っている人の名前、メロディーの著作権を持っている人の名前、録音の著作権を持っている人の名前の3つの名前だけに興味があります。したがって、ドキュメントを3回検索する必要があります。
それぞれの名前には標準のタイトルがあるので、アーティストとアルバムを要求し、(1)へのリンクを生成し、(2)のURLからパラメーターをコピーするか、正規表現を使用してそれを見つけるスクリプトを作成できるはずです。 (3)へのリンクから、ページ(3)をロードしてから、文字列に正規表現の出力を生成します
/Lyrics Copyright Holder [^\n]+/
/Melody Copyright Holder [^\n]+/
/Performance Copyright Holder [^\n]+/
すべてのファイルをダウンロードできましたが(時間がかかります)、情報が変わることがあるので、常に最新の情報を取得していることを確認したいと思います。
しかし、私はXSSビットを回避できないようです。