検索文字列をその構成要素に分割するための正規表現を作成しました。機能は次のとおりです。
- 演算子:
+、、、、-_ANDOR - 引用符による単語のグループ化(現時点ではシングルとダブル)
- アポストロフィを正しく無視する
それで:
((?<=^|\s)(?:[\+\-]?"[^"]+"(?=\s|$)|[\+\-]?'[^']+'(?=\s|$)|[\+\-]?\S+|AND|and|OR|or)(?=$|\s))
結果の一致から区切り文字の引用符を除外する最も簡単な方法は何ですか?例:
lsdkjflws's ldkj and "lfldkfjs's ldkjfls" lskdj
結果は次のようになります。
- lsdkjflwsの
- ldkj
- と
- 「lfldkfjsのldkjfls」
- lskdj
これを行う必要はありません。正規表現でもう1つのステップを実行したいと思います。