4

私は、StaterBrosで購入したDietRiteドリンクが発売されたときに、母親に通知する手段を作成しようとしています。私の考えでは、毎週の広告フィードと文字列DietRiteのフィルターを取り込むYahooPipeを作成できると思います。Yahoo Pipeはそれ自体がRSSフィードであるため、私はPipeをGoogleリーダーに配信するので、母はStaterBrosがセールを行っているかどうかを知ることができます。

Stater Brosが毎週の広告の検索可能なPDFをどのように持っているかを見て、YahooPipesに検索させるのは簡単なことだと思いました。ただし、YahooPipesはPDFをサポートしていません。

次に、PDFをオンラインのPDFからHTMLへのコンバーターにFetch Pageパイプして、YahooPipesのモジュールにフィードすることにしました。実際、コンバーターは非常に成功しました。結果のHTMLでテキストが保持され、検索して必要なものを見つけることができました。ただし、データをフレームに出力することが判明したため、使用できません。他のオンラインPDFからHTMLへのコンバーターが見つかりません。

PDFのHTMLをYahooPipesに取り込むことができたとしても、Yahoo PipesはHTMLを検索/フィルタリングする手段を提供していないため、それがうまくいくかどうかはわかりません。主にフィードで機能します。

だから私は立ち往生しています。私がやろうとしていることを達成する方法について何かアイデアはありますか?

4

1 に答える 1

2

まだ使用していない場合は、Googleのキャッシュシステムを確認することをお勧めします。

http://webcache.googleusercontent.com/search?q=cache:http://www.staterbros.com/Images/PDFs/weekly.aspx

SEOサークル以外ではあまり知られていませんが、Googlebotは実際には大まかなPDFからHTMLおよびテキストへの変換を実行します。GoogleがPDFファイルを変換するのを待つことができない場合は、同じ機能を実行できる無料のPHPスクリプトもいくつかあります。

パイプには「Preg_match」に相当するものがないため、探しているものではないものを削除して、逆方向に作業する必要があります。

replaceモジュールの正規表現は次のようになります... ^(。+?)Diet Rite(。+?)$ 文字列の先頭から「DietRite」までのすべてを何も置き換えないでから「DietRite」以降のすべてを置き換えます'文字列の最後まで何もありません。

したがって、「Diet Rite」がページに存在する場合、それはパイプに表示され、RSSフィードに追加できます。それ以外の場合、パイプは空白を返します。

于 2012-05-08T13:23:18.597 に答える