問題タブ [hpple]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1309 参照

html - Hpple、後でテキストを取得

これが私のHppleの最後の質問だと思います!Hpple で解析している HTML ドキュメントのエントリを見つけました。さまざまなクエリを試しましたが、うまくいきません。以下はHTMLのサンプルです。HTML

//div[@class = 'entry-content']/p で、「今日のプロジェクト」で始まるテキストを取得できます。//div[@class = 'entry-content']//a[@title]//* を使用して次のタグを取得し、その後のすべてのテキストを取得することもできます。ただし、ご覧のとおり、「/span」の後にまだテキストがあります。ただし、私が試したものは何も機能しません。//div[@class = 'entry-content']/p//text(), //div[@class = 'entry-content']/p// を試して、要素の子を調べてみました以下::*、何も機能しません。誰かが何かアイデアを持っているなら、私はすべての耳です!!! いつもありがとうございます。

EDIT #1 さまざまなことを試してみると、HTML を見ていました。p タグの下には、必要なテキスト "Today's project..." があり、テキストの色を変更し、リンクを含むスパンがあり、その後にさらにテキストが続きます。私がしなければならないことは、テキストを読み続けるためにそのスパンを飛び越えることです。多分私の質問は、どうやってスパンを飛び越えるのですか? ご覧いただきありがとうございます。

編集 #2 さて、私はこれに報奨金を開始するつもりです。私は本当に助けが必要です。私はあらゆる場所を見て、さまざまなことを試してきました。しかし、何もうまくいきません。その1つの閉じたスパンの後のテキストを取得できません。そして、この形式はよく登場します。アプリ用にこれを解析しているブログの著者は、時々彼女の言葉のスタイルを変更し、彼女がスタイルを変更した後、テキストを取得できません。どんな助けでも大歓迎です。ご覧いただきありがとうございます。

編集 #3 これは、DOM ツリー HTML の別のスクリーン ショットです。div クラスの「エントリ コンテンツ」を解析していることに気付くと、問題のテキストが表示されます。「今日...」で始まり、テキストの色を変更するスパン、そのテキストを取得できます。必要なのは、終了 p タグの直前の「It was one.....」というテキストです。

ドムの木

また、HTML 全体を gist に配置しました。ここに。問題の行は 102 です。ただし、HTML はうまくコピーされませんでした。ありがとう。

0 投票する
2 に答える
82 参照

ios - 私のXpathはHppleで使用するのに正しいですか

これは正しい Xpath //p[id='Q'] で "Who Framed the Law" ですか?Hpple でこれを使用しても null の値が返されます

0 投票する
1 に答える
1140 参照

html - iOS アプリケーションへのログイン後の Web ページの解析

iOS アプリケーションへのログイン後の Web サイトを解析しようとしています。HTML タグの解析は hpple で正常に機能しますが、ログインを「パススルー」する方法がわかりません。

どうも!

0 投票する
1 に答える
280 参照

ios - Objective C - TR タグ内からテキストを取得する hpple

ここで初めて。

hpple を使用して Web サイトの HTML テーブルから単一の文字列を取得する Iphone アプリを作成しようとしています。 22&dest=&offset=1

そしてウェブサイトのコード:

アプリ内で次の方法を試して、テキスト「Tannery Street - 02:32 (+1h):

NSLog を使用して配列を出力しようとしましたが、これが配列の出力です。

配列: ( "{\n nodeAttributeArray = (\n {\n attributeName = align;\n nodeContent = center;\n },\n {\n attributeName = valign;\n nodeContent = middle;\n }\n ) ;\n nodeName = td;\n raw = \"\";\n}" )

ここの誰かがこれを解決し、ラベルをテキスト文字列に設定するのを手伝ってくれることを願っています.

ありがとう。ダミアン

0 投票する
1 に答える
832 参照

ios - hpple ヘルプが必要な iOS 解析コンテンツ

私は現在、iOSでスクラップをスクリーニングする方法を自分自身に教えようとしています.Androidでそうする方法を学びました.

私はhppleライブラリを使用しています。

現在、hpple を使用して Android にあるものを複製するのに苦労しているため、hpple を正しく使用して HTML コンテンツを解析する方法に関するガイダンスを探しています。

現在、HTML Web サイトから次のコンテンツを解析しようとしています。

HTML の場合に表示されるすべてのテキスト値を取得できる必要があるため、次の値を取得できる必要があります。「CODE MyTestCode」、「Number 123」、「Company Name」、「11:10 AM」、および「会社の状況」。

これが私がこれまでに持っているコードです:

次のコード行の正しい XPath クエリ文字列がわかりません

何を試しても、一度に要素を 1 つしか見つけることができないため、「会社名」の値を取得できますが、他には何も取得できません。

誰でもクエリ文字列を手伝ってもらえますか?

0 投票する
0 に答える
711 参照

objective-c - [element raw] を置き換える HTML hpple の解析

HTML コンテンツを解析するための hpple ライブラリの使用に問題があります。

textkit を使用して、適切な html コンテンツを表示したいと考えています。

だからここに私の問題があります。

すべての画像またはビデオ タグを独自のタグに置き換えてから、UITextview に textkit を挿入したいと考えています。

私のアルゴリズム:

私は自分のhtmlコンテンツを解析します

[要素 raw] に正規表現の a が含まれている場合、正規表現でテストします

ある場合は、ビデオの画像の「src」を抽出し、パーソナライズされた文字列を作成します

次に、 [element raw] 全体を新しい文字列に置き換えたい

たとえば、次のようになります。

次のようになります。

次に、正規表現を使用してすべての HTML タグを削除します

私の問題は、[element raw] を新しいタグ「\IMG\blablabla.jpg」に置き換えたいときです。

私が使用する正規表現

カスタム NSTextstorage の初期化

独自のタグを使用して HTML 文字列をフォーマットする

この方法では、長さの範囲は常に 0 です

ここで私が得るものの例:

最初の html コンテンツ

抽出された [要素 raw]

範囲

編集

アルゴリズムで抽出したい部分を手動で抽出し、それを HTML パーサーによって返された [element raw] と一致させたところ、HTML パーサーが空白文字を削除したようです...

0 投票する
1 に答える
38 参照

parsing - hpple でデータを解析してからラベルに表示する

これまでのところ、私はこれを持っています:

Web ページから hpple を使用して日付を解析し、ラベルに表示しようとしています。どうすればいいのかわかりません。void GoToSecretsList の Secret 変数を、他の void が取得している値と何らかの形で等しくする必要があると思います...誰か提案はありますか?

編集:今、私はこれを持っています:

しかし、どの変数が情報を持っています..? または私が間違っていることは何ですか?secretNodes はそうではないからです。