1

私は「学習」手法に基づいてスクラブ エクストラクタを作成しました。つまり、ページ上の現在のテキストを指定し、それを取得して XPath 式自体を解決します。ただし、ページが変更された場合でも使用できるように、extractor をエクスポートしたいと考えています。

現在、scrubyt のドキュメントはいたるところにあるようですが、私が見つけたものから、行を配置できるはずでextractor.export(__FILE__)あり、機能するはずです。そうではありません-エクスポートの引数の数が間違っているというエラーが表示されます。0にする必要があります。引数なしで試しましたが、まだ失敗します。

スクラブ フォーラムで質問したいのですが、長い間そこに誰もいなかったようです。

ここで何をすべきか?

4

1 に答える 1

1

同じ問題が発生し、「puts google_data.export()」を試しました(Googleからいくつかのものを取得しようとしています)

これにより、次のことがわかりました。

=== 抽出ツリー ===

 export() is not working at the moment, due to the removal or

ParseTree、ruby2ruby、RubyInline。今のところ、例を使用している場合は、以下の出力に基づいて手動で置き換えることができます。したがって、学習エクストラクタのパターンが次のようになっている場合

 book "Ruby Cookbook" 

 and you see the following below:

 [book] /table[1]/tr/td[2]

 then replace "Ruby Cookbook" with "/table[1]/tr/td[2]" (and all the

他の XPath など)、準備は完了です。[リンク] /body/div/div/div/div/div/ol/li/h3/a

これにより、探していたxpathが得られました

スクラブのバージョンは 0.4.06 です

于 2011-03-25T09:33:25.197 に答える