問題タブ [domparser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 正規表現:タグの一部でない場合にのみ文字列に一致します
文字列がhtmlタグの一部でない場合にのみ、文字列を一致させようとしています。
たとえば、文字列「abc」を検索する場合。
<a href="foo.html">abc def</a>
一致する必要があります一致
<p> foo bar foo abc foo bar</p>
する必要があります
しかし、
<a href="abc.html">foo</a>
一致するべきではありません。
助けてくれてありがとう!
java - Android: XML DOM パーサーの解析。子ノードを文字列に変換する
また質問です。今回は、サーバーから受信した XML メッセージを解析しています。賢いと思われる誰かが、HTML ページを XML メッセージに配置することにしました。この XML メッセージから HTML ページを文字列として抽出したいので、問題に直面しています。
わかりました、これは私が解析している XML メッセージです:
<AmigoRequest>
<From></From>
<To></To>
<MessageType>showMessage</MessageType>
<Param0>general message</Param0>
<Param1><html><head>test</head><body>Testhtml</body></html></Param1>
</AmigoRequest>
Param1 で HTML ページが指定されていることがわかります。次の方法でメッセージを抽出しようとしました。
ここで、d は文書形式の XML メッセージです。getNodeValue() が null を返すため、常に null 値が返されます。results.item(0).getFirstChild().hasChildNodes() を試すと、メッセージにタグがあることがわかるため、true が返されます。
<html><head>test</head><body>Testhtml</body></html>
文字列内の Param0 からHTML メッセージを抽出するにはどうすればよいですか?
私は Android SDK 1.5 (ほぼ Java) と DOM パーサーを使用しています。
お時間をいただき、ご返信いただきありがとうございます。
アンテック
php - 文字列からPHPの見出しタグを抽出する方法は?
<h1><h2>etc
多くのHTMLを含む文字列から、タグからすべてのテキストを新しい変数に抽出するにはどうすればよいですか?
これらの要素からすべてのテキストをキャプチャし、コンマ区切りの値として新しい変数に格納したいと思います。
使用できpreg_match_all()
ますか?
android - xmlファイルを解析するには
DOMを使用してカスタムxmlファイルを解析する方法の例を教えてください
android - Android の DOM パーサー
次のコードを使用して res/xml の xml ファイルを解析しようとしましたが、プロジェクトを起動すると、「そのようなファイル/ディレクトリはありません」という例外が表示されます。コードにエラーはありますか? すぐに答えてください。よろしくお願いします。
XML ファイルは
php - タグの ID を使用してタグとその内部のすべての HTML を取り除く方法は?
私は次のhtmlを持っています:
<div id="anotherDiv">
から終了までのすべてを削除したい<div>
。それ、どうやったら出来るの?
c# - HtmlAgilityPack を使用してドキュメントを分割する
これが可能かどうか疑問に思っています。
私は次のようなhtmlを持っています:
はい、それは醜い html であり、WYSIWYG から来ているので、私はそれをほとんど制御できません。
私がやりたいことは、ドキュメント内で[READMORE]を検索し、親タグ (この場合は<font>
と<p>
タグ) を削除し、ドキュメントの REST を巨大な `... でラップしながら readmore リンクに置き換えます。残りの記事...
HtmlAgilityPack がその道のりの一部になると確信していますが、どこから始めればよいかを考えているところです。
htmlDoc.DocumentNode.SelectSingleNode(//p[text()="[READMORE]"])
これまでのところ、何かを使用する必要があると確信しています。私は XPATH にあまり詳しくありません。
font
私のドキュメントでは、readmore がネストされたタグにある場合とない場合があります。
また、場合によっては、タグではなく、ドキュメント ルートにあることもあります。その場合、通常の検索と置換を行うだけで、簡単なはずです。
私の理想的な状況は次のようなものです (PSEUDOCODE)
夢を見ているのはわかっています...でも、これが理にかなっているといいのですが。
javascript - XMLHttpRequestで受け取ったhtmlページからDOMオブジェクトを作成するには?
私はクロム拡張機能を開発しているので、許可を求めているドメインの XMLHttpRequests に対するクロスホスト許可を持っています。
XMLHttpRequest を使用して、HTML Web ページ (txt/html) を取得しました。XPath (document.evaluate) を使用して、そこから関連するビットを抽出したいと考えています。残念ながら、返された html の文字列から DOM オブジェクトを作成できません。
console.log
Chromium JS コンソールにデバッグ内容を表示することです。
上記のJSコンソールで。私はこれを得る:
では、どのように XMLHttpRequest を使用すると思いますか -> HTML を受信 -> DOM に変換 -> XPath を使用して横断しますか?
DOM オブジェクトの読み込み/受信に「隠された」iframe ハックを使用する必要がありますか?
java - org.w3c.dom.Document のデフォルト実装の変更
のプロジェクト内のデフォルトの実装を変更する必要がありますorg.w3c.dom.Document
。
このリンクをたどって 、次のデフォルトの実装を変更しました。
上記の名前の 3 つのファイルを in で作成しMETA-INF/services
、それぞれに次の行を挿入しました。
ファイル内:javax.xml.parsers.DocumentBuilderFactory
私は入れました:com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl
ファイル内:javax.xml.parsers.SAXParserFactory
私は入れました:com.sun.org.apache.xerces.internal.jaxp.SAXParserFactoryImpl
ファイル内:javax.xml.transform.TransformerFactory
私は入れました:org.apache.xalan.processor.TransformerFactoryImpl
しかし、Oracle Application Server にデプロイすると、Jetty での開発時に表示されるのではなく、の実装クラスorg.w3c.dom.Document
が :であることがわかりました。oracle.xml.parser.v2.XMLDocument
com.sun.org.apache.xerces.internal.dom.DeferredDocumentImpl
Jetty で開発し、Oracle アプリケーション サーバーにデプロイしています。
javascript - Javascript xml パーサー: 名前に「:」が含まれるノードを取得する方法
c:CreationDate ノードを取得しようとしている次のコードがあります。
残念ながら、xml にあるノードの配列ではなく、空の配列を返しています。これは「:」記号が原因だと思います。
それを逃れる方法はありますか?
注: childNodes またはこのようなものでの使用を提案しないでください。私のxmlは検証が複雑であるため(これは単なるサンプルです)、将来的に変更される可能性が高く、タグ名にしか依存できないため、これは機能しません。
ありがとう!