c++ - C/C++ での HTML コンテンツのリアルタイム URI 変換

翻译自：https://stackoverflow.com/questions/15783389 2013-04-03T09:20:05.867

170 次

カスタムリバースプロキシ (C++ で記述) を開発するために、HTML コンテンツの URI をリアルタイムで変換したいと考えています。たとえば、をhttp://myserver/使用してリソースにアクセスしたい場合http://my-reverse-proxy/myserver、すべての絶対リンクとトップレベルリンクを変更する必要があります。http://myserver/somecontent1.ext/somecontent2.ext

HTML タグ

<img src="/sample.png">

したがって、に翻訳されます

<img src="/myserver/sample.png">

私の観点からは、次のアプローチがあります。

1) 正規表現と文字列置換を使用して、キャプチャグループを使用して関連するすべての HTML タグとそのパスを検索し、文字列置換を行います。

2) HTML コンテンツ全体を解析し、解析ツリーで何らかの変換を行い、結果を有効な HTML リソースに整形して出力します。

そして、これがこの質問のすべてです。どのソリューションがより速く、おそらくより合理的であるかを経験したことがありますか? 車輪の再発明を避けるために使用できるフレームワークを知っていますか? このプロセスは後で CSS および XML ベースのリソースにも使用する必要があるため、HTML に依存するソリューションではありません。

前もって感謝します！

c++ - C/C++ での HTML コンテンツのリアルタイム URI 変換

1 に答える 1

Related

Reference