1

次のような HTML があります。

<pre class="script">template("main/GlobalShared");</pre>
<pre class="script">
var link = '/Draft/Tracker_1.1';
if (wiki.pageexists(link)) {
    &lt;div class="version"&gt; web.link(wiki.uri(link), 'Version 1.1') &lt;/div&gt;
}
</pre>

次のように変換する必要があります。

<pre class="script">template(&quot;main/GlobalShared&quot;);</pre>
<pre class="script">
var link = '/Draft/Tracker_1.1';
if (wiki.pageexists(link)) {
    &lt;div class=&quot;version&quot;&gt; web.link(wiki.uri(link), 'Version 1.1') &lt;/div&gt; 
}
</pre>

私は正規表現をいじっていますが、近づくことさえできないようです。私の選択は完全に間違っていると思います。

これが可能であれば、誰かが私を正しい方向に向けることができますか?

4

1 に答える 1

2

代わりに HTML パーサーを使用し、引用符を.replace('"', '&quot;').

BeautifulSoupを使用すると、この作業が簡単になります。

from bs4 import BeautifulSoup

soup = BeautifulSoup(htmlsource)

for string in soup.strings:
     string.replace_with(string.replace('"', '&quot;'))

htmlsource = str(soup)
于 2013-08-16T13:41:42.883 に答える