問題タブ [sgmlreader]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - XmlDocument.GetElementByIdが常にnullを返すのはなぜですか?
次のようなXML(有効なXHTML)があります。
#myHeader
そして、を使用してノードを取得しようとしていますdocment.GetElementById("myHeader")
が、常に。を返しますnull
。なんで?
DTDなどのid
ないid属性として属性を認識しないと思いますか?その場合、HTML DTDを使用するにはどうすればよいですか?
c# - C# - SgmlReader を使用して XSL 変換を実行することは可能ですか (およびその方法)
XSLTを使用してHTML Web ページのコンテンツを変換する必要がありました 。したがって、私はSgmlReaderを使用し、以下に示すスニペットを作成しました (結局、これもXmlReaderだと思いました...)
それにもかかわらず、エラーメッセージが表示されます
HTMLをXMLに変換してから transform を適用することで、これを回避する方法を見つけましたが、次の理由から、これは非効率的な解決策です。
- 中間のXHTML出力は buffer に送られるため、余分なメモリが必要です
- 変換プロセスには追加のCPU処理が必要であり、同じ階層が 2 回走査されます (理論的には不必要です)。
したがって ( StackOverflowコミュニティは常に素晴らしい回答を提供してくれるのに対し、他のC#フォーラムでは完全にがっかりしていることを知っているので;o) HTMLを直接使用してXSL変換を実行するためのフィードバックと提案を探しています( SgmlReaderを別のものに置き換える必要がある場合でも)。同様のライブラリ)。
c# - テキスト XmlNode の InnerXml を変更する
SGML と XmlDocument を使用して HTML ドキュメントをトラバースします。タイプがテキストの XmlNode を見つけたら、xml 要素を持つその値を変更する必要があります。読み取り専用のため、InnerXml を変更できません。InnerText を変更しようとしましたが、今回はタグ記述子の chars<
を and に>
エンコードしまし<
た>
。例えば:
私はに変更しようとしています:
テキスト XmlNode の値を変更する最も簡単な方法は何ですか?
python - 美しいスープのUnicodeEncodeError(python 2.7.1)
ここではpython 2.7.1でBeautiful Soup 3.2を使用しています。
私は最近、簡単なものを機能させようとしていますが、かなりトリッキーなようです:
私は次のことを行います:
ただし、次のエラーが表示されます。
同じループをもう一度実行すると、次のようになることもあります。
このエラーを回避するにはどうすればよいですか? 明らかに、sgmllib.py に問題があります。
私はSOFからいくつかの解決策を試しました:
*]soup = BeautifulSoup(page, fromEncoding=<encoding of the page>)
試行結果: Dosent 作業、同じエラー。
*] sgmllib.py を 2.7.2 バージョンから 2.7.1 バージョンにアップグレードしようとしました。結果: うまくいきませんでしたが、同じエラーが発生しました。
*]html = BeautifulSoup(page.encode('utf-8'))
試行結果: Dosent 作業、同じエラー。
このエンコード エラーを解決する方法についての提案をいただければ幸いです。
c# - Xml ドキュメントから jquery と CSS を削除する
HTML を XML に変換するために sgmlreader を使用しています。出力は XmlDocument オブジェクトに送られ、InnerText メソッドを使用して Web サイトからプレーン テキストを抽出できます。JavaScriptを削除して、テキストをできるだけきれいに見せようとしています。xml をループして削除するの<script type="text/javascript">
は簡単ですが、jquery やスタイリングがどのタグにもカプセル化されていないと、壁にぶち当たります。誰でも私を助けることができますか?
サンプルコード:
ステップ 1: webclient クラスを使用して HTML をダウンロードしたら、それを保存し、テキスト リーダー クラスでファイルを開きます。
ステップ 2: sgmlreader クラスを作成し、入力ストリームをテキスト リーダーに設定します。
ステップ 3: xmldocument を作成したら、doc.InnerText を使用してプレーン テキストを取得します。
ステップ 4: 次のように JavaScript タグを簡単に削除できます。
いくつかのものはまだすり抜けています。私がスクリプしている特定のウェブサイトの出力の例を次に示します。
その jquery とスタイリングを削除する必要があります。
windows-8 - SgmlReaderおよびSystem.XmlWindows8
さらに解析するためにSgmlReaderを使用してHTMLストリームをXMLに変換しようとしています。この変換は、私がWindows8Store用に開発しているAPPの一部です。以下は、HTMLをXMLに変換する方法です:-
sgmlReader.WhitespaceHandling = WhitespaceHandling.All; Xml.WhitespaceHandlingが存在しないため、問題が発生します。これを行う他の方法はありますか?
sgmlreader - Nuget パッケージに DTD を埋め込んだ SgmlReader
数日前に、DTD スキーマが SgmlReader の nuget パッケージに埋め込まれていないことを報告しました。 そこのポスト
しかし、私は応答を得て、それを埋め込みます。それを使用するには、DocType を「HTML」に設定する必要があります。(1.8.7は私にとってはうまくいきます)
DotPeek を使用して両方のバージョンを逆コンパイルしましたが、1.8.8 に DTD が表示されません (スクリーンショットを添付)
sgmlreader - 出力のように不足しているタグを追加するために SGMLReader を停止する方法
ここに示すように、SGML Reader を使用して HTML スニペットをフォーマットしていますhttps://github.com/MindTouch/SGMLReader。問題は、コードのように不足しているタグを追加することです。それを止める方法はありますか?
xml - Window Phone アプリケーションで SgmlReader を使用する
Windows Phone アプリケーションに SgmlReader を含める方法はありますか? Install-package SgmlReader incompatiable asssembly エラーでインストールできない
これが不可能な場合、Window Phone Application 8.0 で HTML から XML への変換を実行する別の方法はありますか?
perl - Perl: Mac OSX で SGML::Parse::OpenSP をビルドできず、プロキシ エラーが発生する
OSX 10.9.1 で Perl 5.16.2 を実行していますが、CPAN からモジュールをインストールできません。正常にインストールしました
しかし、次のようなことをしようとすると
エラーが発生します
を使用して、CPAN シェルで HTTP および FTP プロキシ変数をリセットしようとしました
ただし、エラーは解決しません。
また、次のパッケージをインストールしようとすると
エラーが発生します
関連するエラーは
アップデート:
fink を使用して OpenSP をインストールし、fink をルート ディレクトリにインストールしました
ディレクトリsw
は、私のルート ディレクトリに fink によって作成されました。を使用していますが、ビルドしようとしたときにsudo cpan SGML::Parser::OpenSP
このファイルが見つからない理由がわかりません。ParserEventGeneratorKit.h
アドバイスをいただければ幸いです。
ありがとう