文字列内のいくつかの部分文字列をウィキマークアップに置き換えたい。たとえば、文字列があります
some other string before
; Methods
{{columns-list|3|
* [[Anomaly detection|Anomaly/outlier/change detection]]
* [[Association rule learning]]
* [[Statistical classification|Classification]]
* [[Cluster analysis]]
* [[Decision trees]]
* [[Factor analysis]]
* [[Neural Networks]]
* [[Regression analysis]]
* [[Structured data analysis (statistics)|Structured data analysis]]
* [[Sequence mining]]
* [[Text mining]]
}}
; Application domains
{{columns-list|3|
* [[Analytics]]
* [[Bioinformatics]]
* [[Business intelligence]]
* [[Data analysis]]
* [[Data warehouse]]
* [[Decision support system]]
* [[Drug Discovery]]
* [[Exploratory data analysis]]
* [[Predictive analytics]]
* [[Web mining]]
}}
some other string after
元の部分文字列を次のように置き換えたい
[[Anomaly detection|Anomaly/outlier/change detection]]
[[Association rule learning]]
[[Statistical classification|Classification]]
[[Cluster analysis]]
[[Decision trees]]
[[Factor analysis]]
[[Neural Networks]]
[[Regression analysis]]
[[Structured data analysis (statistics)|Structured data analysis]]
[[Sequence mining]]
[[Text mining]]
[[Analytics]]
[[Bioinformatics]]
[[Business intelligence]]
[[Data analysis]]
[[Data warehouse]]
[[Decision support system]]
[[Drug Discovery]]
[[Exploratory data analysis]]
[[Predictive analytics]]
[[Web mining]]
最初に{{}}で何かを抽出するために、いくつかの正規表現を試しました。しかし、私は常になしを取得しました。
追加:問題は、それ自体が{{}}にある[[]]のコンテンツにのみ関心があることです。文字列の他の部分に[[]]が他にもいくつか出現しています。
では、re.subを使用してこれを行うにはどうすればよいですか?ありがとう
追加:現在の解決策(醜い)
def regt(matchobj):
#store matchobj.group(0) somewhere else, later on add them to the string
#Next, another function will remove all {{}} alway
return ''
matches = re.sub(r'\[\[.*?\]\](?=[^{]*\}\})', regt,wiki_string2)