1

引用抽出関数を作成するためのヘルプが既にあります。どうもありがとう、ソウルマージ!

現在、引用されたテキストと引用された人物を抽出する正規表現 (PHP) を探しています。人物は 1 つのインデックス (部分文字列) にあり、テキストは別のインデックス (部分文字列) にある必要があります。

英語のテキストの場合、soulmerge は次の正規表現を提案しました。

  • /"(.*?)[,.]?\h*"\h*said\h*(.*?)\./
  • /"(.*?)\h*"(.*)said/
  • /\.\h*(.*)(once)?\h*said[\-]*"(.*?)"/

次のドイツ語の直接音声の例を正規表現に「翻訳」したいと思います。

  • 「これは引用です」、sagte PERSON ...
  • 「これは引用です!」、sagte PERSON ...
  • 「これは引用ですか?」 sagte PERSON ...
  • PERSON sagte: "これは引用です。"
  • PERSON sagte: 「これは引用です!」
  • PERSON sagte: "これは引用ですか?"

これらの直接発話形式に適した正規表現を構築するのを手伝ってくれる人はいますか?

あなたが私を助けてくれることを願っています。事前にどうもありがとうございました!

4

1 に答える 1

1
  • /"(.+)",\s*sagte\s+(.+)/
  • /(.+)\s+sagte:\s*"(.+)"/

2 番目の正規表現では、person 変数と question 変数が逆になっていることに注意してください。

于 2009-08-30T21:14:15.847 に答える