正規表現を使い始めたばかりで、少し行き詰まっているようです。TextSoapで複数行を使用して一括検索と置換を作成しました。これは私がOCRしたレシピをクリーンアップするためのものであり、材料と方向性があるため、「1」を「1.」に変更することはできません。これは「1Tbsp」を「1.Tbsp」に書き換えることができるためです。
したがって、このコードを検索として使用して、次の2行(おそらく余分な行がある)が次の連続番号であるかどうかを確認しました。
^(1) (.*)\n?((\n))(^2 (.*)\n?(\n)^3 (.*)\n?(\n))
^(2) (.*)\n?((\n))(^3 (.*)\n?(\n)^4 (.*)\n?(\n))
^(3) (.*)\n?((\n))(^4 (.*)\n?(\n)^5 (.*)\n?(\n))
^(4) (.*)\n?((\n))(^5 (.*)\n?(\n)^6 (.*)\n?(\n))
^(5) (.*)\n?((\n))(^6 (.*)\n?(\n)^7 (.*)\n?(\n))
上記のそれぞれの代わりとして以下を使用します。
$1. $2 $3 $4$5
私の問題は、それが私が望んでいたように機能するにもかかわらず、最後の3つの数字のタスクを実行しないことです...
クリーンアップしたいテキストの例:
1 This is the first step in the list
2 Second lot if instructions to run through
3 Doing more of the recipe instruction
4 Half way through cooking up a storm
5 almost finished the recipe
6 Serve and eat
そして、私がそれをどのように見せたいか:
1. This is the first step in the list
2. Second lot if instructions to run through
3. Doing more of the recipe instruction
4. Half way through cooking up a storm
5. almost finished the recipe
6. Serve and eat
これを逆方向に実行するために、上記の前の1行または2行を確認する方法はありますか?私は先読みと後読みを見てきましたが、その時点で少し混乱しています。誰かが私の番号付きリストをクリーンアップしたり、私が望む正規表現を手伝ってくれる方法はありますか?