私は正規表現にまったく慣れていません。これが可能かどうか知りたいだけです (説明がわかりにくく、複雑すぎる場合は申し訳ありません) たとえば、この特定の見出しを太字で見つけて置き換えたいだけです。
「第1章で説明したように、財務諸表の利用者は、リソース提供者として分類することができます。(スペース)(スペース)ユーザーと意思決定(スペース)(スペース)これの例です。(スペース)(スペース)の性質と目的財務分析(スペース)(スペース)私たちは、財務分析が、財務諸表で報告された数値を相対的な用語で表現することに発展することを確認しました。」
これに:
「第 1 章で説明したように、財務諸表のユーザーは、リソース プロバイダーとして分類できます。
(改行) ユーザーと意思決定 (タブ スペース)これの例
(改行) 財務分析の性質と目的 (タブ スペース)私たちは、財務分析が、財務諸表で報告された数値を相対的な用語で表現することに関与していることを確認しました。」
現在、正規表現に関する私の知識は限られているため、2 つの部分に分解してみます。
1. ". (スペース)(スペース)Nature "を検索するには:
[(.)]\s\s[(AZ)]\w+
to \n$&
2. " analysis(space)(space) We" を見つける:
[(az)]\w+\s\s[(AZ)]
to ??
したがって、私の質問は、 に対して 1 つの正規表現を定義するだけでよいということです
。(スペース)(スペース)ユーザーと意思決定(スペース)(スペース) An
. (スペース)(スペース)財務分析の性質と目的(スペース)(スペース)上記の例に
置き換えますか?
ありがとうございました!
PS。この奇妙な編集の背後にある理由は、これをさらに編集せずに txt として anki フラッシュ カード ソフトウェアにアップロードするためです。
分厚い教科書からテキスト全体を編集する場合、私の現在の方法は非常に負担が大きくなる可能性があります (1 章あたり 1000 以上の編集が含まれる可能性があります x20 または章 x5 教科書など)。
参考までに、anki や他のいくつかのフラッシュカード ソフトウェアでは、タブは前部/質問と後部/回答の間のフィールド セパレータです。
ダブル スペース [ ][ ] は、検索と置換を使用するときに、特定の見出しをシングル スペースから区切るために使用されます。事前に自分で設定したもの。
新しい行 (\n) は、新しい個別のフラッシュカードを追加するためのものです。
Anki(および他のいくつかのフラッシュカードソフトウェア)はhtmlをサポートしているため、通常、メモ帳++を使用してpdfからテキストをコピーし、正規表現を使用して複数のカードを追加し、いくつかの見出しまたは文の最初の単語を検索して置換し、質問/フラッシュカードの前部に合わせます残りは答えの部分になります。そしてそれをankiにインポートします。すべての検索部分を自動化できれば、非常に多くの時間を節約できます。