これが私がやっていることです。カスタム拡張子(.cpm)で終わるドキュメント用のperlインタープリターを作成しています。私は周りを見回して見つけました
- http://perlmeme.org/tutorials/html_parser.html
- https://metacpan.org/pod/HTML::TokeParser::Simple
- http://www.justskins.com/forums/html-parser-8489.html
HTML::Parserがその方法のようです。私が求めているのは、特別なタグを持つドキュメントを解析するための簡単なチュートリアルです。たとえば、HTMLドキュメントを解析する方法を示すものが必要ですが、<putinbold>
が検出されると、それが。に置き換えられ<b>
ます。
私が欲しいものの例-
<html>
This is HTML talking
<liamslanguage>say "This is Liams language speaking"</liamslanguage>
</html>