RFC(http://www.ietf.org/rfc.html)は通常、テキストファイルとして公開されます。
- RFCコンテンツの解析を容易にする他の形式はありますか?
- 広く使用されているRFCテキストドキュメントのパーサーはありますか?
RFC(http://www.ietf.org/rfc.html)は通常、テキストファイルとして公開されます。
限られた数のRFCがhttp://xml.resource.org/public/rfc/xml/でXMLとして提供されています。
また、http://xml.resource.org/public/rfc/bibxml/のBibXMLを使用してテキストデータをマージすることもできます。
IETFは、最小限にマークアップされたRFCをHTMLで維持します。次に例を示します。
https://www.rfc-editor.org/rfc/rfc2616.html
ただし、マークアップは主に目次を実装するためのアンカーで構成されています。本体のマークアップは主に<pre>...</pre>です。それでも、これらのRFCで意味のある解析を実行できる可能性があります。
W3CにはいくつかのHTML化されたRFCがあります。次に例を示します。
http://www.w3.org/Protocols/rfc2616/rfc2616.html
マークアップはそのセマンティクスがいくらか豊富であるため、おそらく構文解析に適しています。