問題タブ [pywikibot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - Python: 正規表現の検索と正規表現による置換の違い
pywikibotを使用してインターウィキ翻訳リンクを自動修正するための小さなスクリプトを作成しています。既存のリンクを探して、すべてのページへのリンクを含む標準形式でそれらを書き直したいと考えています。
私が探しているテキストは、どちらかのように見えます
または複数行のように
wikiページのソースでこれら2つのインスタンスを見つけることができました
これにより、次のようなテンプレートの中心が得られます(最初のケースの場合)
同様に、2番目の複数行文字列と同様です。
ただし、replace コマンドで同じ reg_strg を使用するようになりました。置換に失敗し、テキストは変更されずに残り、new_strg は、置換文字列を構成するために読み取られたものから作成されます。ただし、結果は、new_strg が複数行の文字列であるか、単純な「flobberigoo」であるかに依存しません。
したがって、明らかに re.search と re.sub の間にはいくつかの違いがあります-しかし、ドキュメントでそれを見つけることができませんでした(re.search と re.match の違いを認識していても、そのように理解しました。 sub は最初のように動作する必要があります)。
何が恋しいですか?ページで見つけた前述の正規表現を文字列に置き換えるにはどうすればよいですか?
完全を期すために、これはデバッグ出力を含む完全な関数です:
python - ウィキペディア api python が奇妙な結果を返す
このコードがエントリ「tomato」に対する要約/曖昧さ回避エラーだけでなく、「tom tom」の曖昧さ回避エラーを返すのはなぜですか? 検索用語は明らかにトム トムではありませんか、それともここで何か不足していますか? なぜこれが機能しないのですか?