問題タブ [domparser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
1065 参照

php - 正規表現:タグの一部でない場合にのみ文字列に一致します

文字列がhtmlタグの一部でない場合にのみ、文字列を一致させようとしています。

たとえば、文字列「abc」を検索する場合。 <a href="foo.html">abc def</a>一致する必要があります一致 <p> foo bar foo abc foo bar</p>する必要があります

しかし、 <a href="abc.html">foo</a>一致するべきではありません。

助けてくれてありがとう!

0 投票する
5 に答える
9716 参照

java - Android: XML DOM パーサーの解析。子ノードを文字列に変換する

また質問です。今回は、サーバーから受信した XML メッセージを解析しています。賢いと思われる誰かが、HTML ページを XML メッセージに配置することにしました。この XML メッセージから HTML ページを文字列として抽出したいので、問題に直面しています。

わかりました、これは私が解析している XML メッセージです:

<AmigoRequest> <From></From> <To></To> <MessageType>showMessage</MessageType> <Param0>general message</Param0> <Param1><html><head>test</head><body>Testhtml</body></html></Param1> </AmigoRequest>

Param1 で HTML ページが指定されていることがわかります。次の方法でメッセージを抽出しようとしました。

ここで、d は文書形式の XML メッセージです。getNodeValue() が null を返すため、常に null 値が返されます。results.item(0).getFirstChild().hasChildNodes() を試すと、メッセージにタグがあることがわかるため、true が返されます。

<html><head>test</head><body>Testhtml</body></html>文字列内の Param0 からHTML メッセージを抽出するにはどうすればよいですか?

私は Android SDK 1.5 (ほぼ Java) と DOM パーサーを使用しています。

お時間をいただき、ご返信いただきありがとうございます。

アンテック

0 投票する
7 に答える
15192 参照

php - 文字列からPHPの見出しタグを抽出する方法は?

<h1><h2>etc多くのHTMLを含む文字列から、タグからすべてのテキストを新しい変数に抽出するにはどうすればよいですか?

これらの要素からすべてのテキストをキャプチャし、コンマ区切りの値として新しい変数に格納したいと思います。

使用できpreg_match_all()ますか?

0 投票する
3 に答える
1747 参照

android - xmlファイルを解析するには

DOMを使用してカスタムxmlファイルを解析する方法の例を教えてください

0 投票する
2 に答える
615 参照

android - Android の DOM パーサー

次のコードを使用して res/xml の xml ファイルを解析しようとしましたが、プロジェクトを起動すると、「そのようなファイル/ディレクトリはありません」という例外が表示されます。コードにエラーはありますか? すぐに答えてください。よろしくお願いします。

XML ファイルは

0 投票する
7 に答える
56857 参照

php - タグの ID を使用してタグとその内部のすべての HTML を取り除く方法は?

私は次のhtmlを持っています:

<div id="anotherDiv">から終了までのすべてを削除したい<div>。それ、どうやったら出来るの?

0 投票する
2 に答える
1192 参照

c# - HtmlAgilityPack を使用してドキュメントを分割する

これが可能かどうか疑問に思っています。

私は次のようなhtmlを持っています:

はい、それは醜い html であり、WYSIWYG から来ているので、私はそれをほとんど制御できません。

私がやりたいことは、ドキュメント内で[READMORE]を検索し、親タグ (この場合は<font><p>タグ) を削除し、ドキュメントの REST を巨大な `... でラップしながら readmore リンクに置き換えます。残りの記事...

HtmlAgilityPack がその道のりの一部になると確信していますが、どこから始めればよいかを考えているところです。

htmlDoc.DocumentNode.SelectSingleNode(//p[text()="[READMORE]"])これまでのところ、何かを使用する必要があると確信しています。私は XPATH にあまり詳しくありません。

font私のドキュメントでは、readmore がネストされたタグにある場合とない場合があります。

また、場合によっては、タグではなく、ドキュメント ルートにあることもあります。その場合、通常の検索と置換を行うだけで、簡単なはずです。

私の理想的な状況は次のようなものです (PSEUDOCODE)

夢を見ているのはわかっています...でも、これが理にかなっているといいのですが。

0 投票する
1 に答える
6244 参照

javascript - XMLHttpRequestで受け取ったhtmlページからDOMオブジェクトを作成するには?

私はクロム拡張機能を開発しているので、許可を求めているドメインの XMLHttpRequests に対するクロスホスト許可を持っています。

XMLHttpRequest を使用して、HTML Web ページ (txt/html) を取得しました。XPath (document.evaluate) を使用して、そこから関連するビットを抽出したいと考えています。残念ながら、返された html の文字列から DOM オブジェクトを作成できません。

console.logChromium JS コンソールにデバッグ内容を表示することです。

上記のJSコンソールで。私はこれを得る:

では、どのように XMLHttpRequest を使用すると思いますか -> HTML を受信 -> DOM に変換 -> XPath を使用して横断しますか?

DOM オブジェクトの読み込み/受信に「隠された」iframe ハックを使用する必要がありますか?

0 投票する
3 に答える
4149 参照

java - org.w3c.dom.Document のデフォルト実装の変更

のプロジェクト内のデフォルトの実装を変更する必要がありますorg.w3c.dom.Document

このリンクをたどって 、次のデフォルトの実装を変更しました。

上記の名前の 3 つのファイルを in で作成しMETA-INF/services、それぞれに次の行を挿入しました。

ファイル内:javax.xml.parsers.DocumentBuilderFactory私は入れました:com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl

ファイル内:javax.xml.parsers.SAXParserFactory私は入れました:com.sun.org.apache.xerces.internal.jaxp.SAXParserFactoryImpl

ファイル内:javax.xml.transform.TransformerFactory私は入れました:org.apache.xalan.processor.TransformerFactoryImpl

しかし、Oracle Application Server にデプロイすると、Jetty での開発時に表示されるのではなく、の実装クラスorg.w3c.dom.Documentが :であることがわかりました。oracle.xml.parser.v2.XMLDocumentcom.sun.org.apache.xerces.internal.dom.DeferredDocumentImpl

Jetty で開発し、Oracle アプリケーション サーバーにデプロイしています。

0 投票する
1 に答える
3857 参照

javascript - Javascript xml パーサー: 名前に「:」が含まれるノードを取得する方法

c:CreationDate ノードを取得しようとしている次のコードがあります。

残念ながら、xml にあるノードの配列ではなく、空の配列を返しています。これは「:」記号が原因だと思います。

それを逃れる方法はありますか?

注: childNodes またはこのようなものでの使用を提案しないでください。私のxmlは検証が複雑であるため(これは単なるサンプルです)、将来的に変更される可能性が高く、タグ名にしか依存できないため、これは機能しません。

ありがとう!