問題タブ [sgml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
546 参照

eclipse - Eclipse IDE:SGMLプラグイン?

Eclipse内でSGMLファイルを編集するためのプラグインを知っていますか?

0 投票する
3 に答える
153 参照

html - HTML 属性値の引用

仕様では、属性値の区切り文字として ' と " の両方が許可されていることを知っています。また、常に引用することをお勧めします。

ただし、「よりクリーンな方法であると考えています。おそらく、CおよびC ++の構文で育ったのは私だけです。

属性値を引用する最もクリーンな方法とその理由は何ですか? 主観的な回答はご遠慮ください。

0 投票する
5 に答える
11568 参照

python - Python を使用してタグの内容を取得する

0 投票する
2 に答える
2149 参照

java - SGML を使用した Java 文字列の解析

私はSGMLを使用したJava文字列を持っています。このようなものです...

<suggestion> </suggestion>たとえば、 「ダッキー」を出すために内部のテキストを言うためにそれを解析するにはどうすればよいですか??

javax.swing.text.html.parser.Parse は役に立ちますか? または、HTMLドキュメントのみを解析できますか?

0 投票する
5 に答える
516 参照

html - >は必要ですか?

&gt;私は現在、7年以来WebサイトとXMLインターフェースを開発していますが、を使用することが本当に必要な状況に陥ったことはありません><これまでのところ、すべての明確化は、、、およびを引用するだけで処理でき&ます。"'

大なり記号をエスケープすることが不可欠であると感じた状況(SGML処理、ブラウザーの問題、XSLTなどに関連する)に誰かがいたことがあります&gt;か?

更新:XML仕様を確認しました。たとえば、セクション2.4の文字データについて説明しています。

文字データ

したがって>、CDATAセクションの終了シーケンスを除いて、それは特別なものとしては言及されていません。

が重要であるこの単一のケース>は、CDATAセクションの終わりになりますが、]]>それを引用すると、引用(つまり、リテラル文字列]]&gt;)は文字通り出力に到達します(それはCDATAです)。

0 投票する
1 に答える
3580 参照

xml - WYSIWYG XML エディター (DTD または RelaxNG または XSD ベースの文法)

カスタム XML 文法用の WYSIWYG XML エディターを作成する必要があります。このドメインで見つけられるすべてのオープンソース ツールを調査しました。VEX、Oxygen、Bitflux を含む...

それらのどれも私の目的を果たしませんでした。

また、DTD または任意の文法を使用した追加の DOCTYPE をサポートできる JavaScript ベースの WYSIWYG HTML エディターも探しています。私はすでに FCK と CKEditor と TinyMCE の種類のエディターをチェックアウトしました。

0 投票する
1 に答える
161 参照

c# - SGML で複数のタグを削除する

私は次のようなsgmlファイルを持っています

私の質問は、あるタグを削除<p>して別のタグをそのままにしておく方法です...どの正規表現が適切でしょうか...

0 投票する
5 に答える
26709 参照

html - HTML5ドキュメントタイプ定義はどこにありますか?

「古い」HTML/XHTML標準には、DTD(文書型定義)が定義されています。

HTML 4.01 http://www.w3.org/TR/html401/sgml/dtd.html
XHTML 1.0 http://www.w3.org/TR/xhtml1/dtds.html#a_dtd_XHTML-1.0-Strict

このDTDは、要素をネストするためのルール、つまり「どのタイプの要素がどのタイプの要素に表示されるか」を指定します。ここでXHTML1.0の図を作成しました(申し訳ありませんが、そのリソースはもうありません)

その図を、新しいHTML5要素も含む新しいバージョンで更新したいと思います。ただし、HTML5DTDはないようです。ネストルールは、HTML5で定義されているさまざまなコンテンツモデルによって定義されているようです。

では、DTDはありませんよね?

フォローアップの質問: HTML5にDTDがない理由はありますか?DTDは、さまざまな種類の要素すべてのネストルールを定義するための優れた方法です。なぜそれらはそのようなものを含まないのでしょうか?

更新:私はこれを見つけました: http ://www.w3.org/TR/html5/dom.html#kinds-of-contentおそらく、これはDTDを持つことに最も近いです。

更新: VisualStudioチームはXHTML5のXMLスキーマを作成しました。私はそれが私の質問に答えると思います:リンク

0 投票する
1 に答える
823 参照

python - lxml を使用して、すべての要素が事前にわかっていないデータを抽出する

おおよそ標準化された sgml ファイルがいくつかあります。ただし、ファイルを開いて個人的に読むまでは存在を知らないタグ​​内のデータが含まれている可能性があります。たとえば、ファイルには住所があり、通常、住所には通り、都市、州、郵便番号、電話番号があります。アドレスの各要素はタグで示されます

しかし、たとえば、Country、STREET1、STREET2 のタグがあることを発見しました。20 万を超えるファイルを処理する必要があり、不明なタグの存在を気にせずにアドレスのすべての要素を抽出できるかどうかを知りたいです。

私がこれまでやってきたことは、

しかし、ある要素がどこで終わり、次の要素が始まるかを特定できないため、得られるものには問題があります

0 投票する
2 に答える
1709 参照

xml - 整形式でない SGML / XML ドキュメントの LOTS および LOTS を解析するための戦略

私は何千もの SGML 文書を持っており、整形式のものもそうでないものもあります。ドキュメント内の特定の ELEMENTS を取得する必要がありますが、それらをロードして XDocument、XMLDocument、または単に StreamReader に読み込もうとすると、さまざまな XMLException エラーが発生します。

「'[' は予期しないトークンです。」のようなもの。なんで?私はDOCTYPEのような文書を持っているので

そして、「[]」には有効なものが含まれている必要があることを学びました。繰り返しますが、私はドキュメントの作成を管理していませんが、それらを「クラック」して、必要なデータを取得する必要があります。別の例として、「閉じていない」ELEMENT があります。たとえば、次のようになります。

この XMLException は、「27 行目の 'ハイフン' 開始タグが 'キャプション' の終了タグと一致しません。27 行目、58 番目の位置です。」明らかですよね?

しかし、問題は、XMLException に遭遇することなく、これらの文書内の特定の ELEMENT を実際に取得するにはどうすればよいかということです。SAXパーサーは正しい方法ですか? 私は基本的に、ドキュメントを開き、必要な要素に直接移動し (近くに整形式のものがあるかどうかを気にせずに)、データを取得して先に進みたいと考えています。XMLDocument、XDocument での解析を忘れて、次のような単純な文字列置換を行うだけでよいでしょうか

そして、それを XML パーサーの 1 つにロードしてみてください。攻略のコツは?