私は Yahoo Pipes を使用して、xPath 経由で会社のマイクロ サイトをスクレイピングし、メイン サイトに埋め込むことができる RSS フィードを生成するスクレーパーを構築しています。
これまでのところ、ページから役職と場所をスクレイピングすることはできましたが、アイテムをマイクロサイトにリンクすることはできません.
これまでのところ、私のパイプは次のとおりです。
各ノードからhrefリンクを抽出してから正規表現を適用する必要があると思いますが、本当に理解できません。
コード内のリンクは次のようになります: www2.jobs.badenochandclark.ch/JavaScript:OpenAssignment('a960c93a-11fe-4751-bc27-83a48429c3ba',%20'/Jobs/Details/a960c93a-11fe-4751-bc27-83a48429c3ba ');
しかし、基本的にこれを行う正規表現を生成するのに苦労しています: -4751-bc27-83a48429c3ba ');
そのため、リンクを抽出する方法と、それをパイプに構築する方法に固執しています。正しい方向への助けや微調整は本当にありがたいです。