2

Twitter の検索結果を処理可能な形式にするために Kettle PDI 4.2.3 を使用する詳細な方法を見つけたいと思います。

私が今まで持っているのは、次の手順です。

ステップ 1: 行の生成 ここで、最初の行にリンクを挿入します Twitter 検索結果

制限=1

ステップ 2:HTTP クライアント ここで、前のフィールドの URL を受け入れるように設定します。出力フィールドに job-xml と記述します。フィールドタブでは、何をすべきかわかりません。フィールドの取得を押すと、Generate Row から単一のフィールドが表示されます。しかし、私はそれを空のままにします。

ステップ 3:XML データを取得するここで問題が発生します。現在の状況は次のとおりです。 - [ファイル] タブで [フィールドから Xml を取得] にチェックを入れ、"job-xml" と書きました。残りは空のままにします - [コンテンツ] タブの名前空間を認識し、ファイルがチェックされていない場合はエラーを発生させません。ループ XPath が空です。Get XPath Nodes を押すと、「XML フラグメントを提供してください」と表示されます。通常、Node オプションが表示されます。HTTP クライアントを xml コードを含むテキスト ファイル入力に置き換えると、ノードのオプションが表示されます。-もちろん、[フィールド] タブでは、XPath を指定する必要があるため、フィールドを取得できません。

だから私はここで立ち往生しています。通常、私は HTTP クライアントから Tweeter フィールドを取得し、値の選択や Excel 出力などの次のステップに進みたいと考えています。

誰かが私が間違っていることを理解し、ツイートをExcelに変換するのを手伝ってくれるなら、私は永遠に感謝します:)

前もって感謝します

4

1 に答える 1

0

最善の方法は、Twitter xml をファイルに書き込んで、そのファイルを XML フラグメントに使用できるようにすることです。少しばかげていますが、ノードなどを選択できる get xml は、ファイルから xml を読み取るときにのみ機能します。

したがって、Xpath とファイルのすべてをセットアップしてテストし、動作したら xml に戻ってフィールドに切り替えます。

于 2012-11-28T15:25:56.610 に答える