1

私は正規表現の経験がないので、csvファイルに含まれているファイル名の一部を削除するための可能な解決策についてのヘルプと提案が欲しいです。

問題:

エクスポートされたファイル名のリストには、分離する必要のあるランダムな一意の識別子が含まれています。一意の識別子には予測可能なパターンはありませんが、削除する必要のある側面にはあります。各ファイル名は、次のいずれかのバリエーションで終わります。

V、-V、または%20Vの後に、スペースが可能な乱数シーケンス、追加の「-」、「」が続き、.PDFで終わる

例:

GTD-LVOE-43-0021 V10 0.PDF GTD-LVOE-43-0021-V34-2.PDF GTD-LVOE-43-0021_V02_9.PDF GTD-LVOE-43-0021 V49.9.PDF

解決:

私の計画は、文字列の最後から最初に出現するVを選択し、それとその右側のすべてを削除するスクリプトを作成することでした。次に、文字列の末尾にある「-」または「_」と空白を削除することで、ファイル名をクリーンアップできます。

質問:

正規表現でこれを行うにはどうすればよいですか?私の考え方は、これを解決するための正しいアプローチにさえ近いですか?

4

1 に答える 1

1

正規表現: [\s\-_]V.*?\.PDF

トリックをするかもしれません。それでも、先頭の-と_を置き換える必要がありますが、うまくいけば、それで道を進むことができます。

これは次のようになります。

whitespace-ORで始まり、_その後にV。次に、最初に到達するまですべてを取ります.PDF

于 2012-04-30T02:42:54.157 に答える