XML文字列があります
<tags>
<person1>dave jones</person1>
<person2>ron matthews</person2>
<person3>sally van heerden</person3>
<place>tygervalley</place>
<ocassion>shopping</ocassion>
</tags>
「SallyVanHeerden」や「Tygervalley」などの検索用語を使用してこのxml文字列を検索したいと思います
この文字列内の用語を見つけるために正規表現を使用する方が速いですか、それともPythonのfind()メソッドは十分に速いですか?Pythonの要素ツリーXMLパーサーを使用して検索し、XMLツリーを構築して検索することもできますが、速度が遅くなるのではないかと心配しています。
上記の3つのうちどれが最速ですか?また、他の提案はありますか?
複数の検索語が入力される可能性があり、複数(数千)のXML文字列も検索されることに注意してください。
更新:xml文字列をリストに分割し、すべての特殊文字を削除してから、リストをセットおよび検索語のセットに変換するのはどうでしょうか。次に、2つのセットの共通部分を取得しますか?これは速いでしょうか?