-1

テキスト内のパターンを検索する必要がある言語学プロジェクトに取り組んでいます。次のパターンを検索する必要があります: „ blah blah blah **target word** blah blah". つまり、(ドイツ語の) 引用符内に含まれる特定の単語のインスタンスで、引用符の間に他の単語をいくつでも含めることができます。

私が使用しているソフトウェアは、Ruby で書かれており、照合には正規表現を使用しているとのことです。それらが仕事に適したツールであるかどうかを知る必要があります。これは、Ruby の正規表現がキャプチャできるパターンのようなものですか?

4

2 に答える 2

1

単純。に文字列があるとするtarget_wordと、次のようになります。

/\„.*?#{target_word}.*?\"/m

ただし、ドイツ語の引用については特別な考慮が必要になる場合があります。

于 2013-06-18T12:54:27.107 に答える
0

実際に正規表現またはトークン化が必要なようです

プログラミングの経験がない場合は、後者を使用します。正規表現を習得するのは非常に困難です。

于 2013-06-18T12:42:51.400 に答える