私はJavaに比較的慣れていないため、文字列から複数の部分文字列を抽出するために助けが必要です. 文字列の例は次のとおりです。
String = "How/WRB can/MD I/PRP find/VB a/DT list/NN of/IN celebrities/NNS '/POS real/JJ names/NNS ?/."
望ましい結果:WRB MD PRP VB DT NN IN NNS POS JJ NNS
POS タグを抽出し、POS タグに基づいて計算を行う必要がある、おそらく数千の同様の POS タグ付き行を含むテキスト ファイルがあります。
トークナイザーを使用してみましたが、実際には望んでいた結果が得られませんでした。配列を保存して後で使用する必要があるため、配列を使用して保存しようとしsplit()
ましたが、それでも機能しませんでした。
最後に、パターン マッチャーを使用してみましたが、スラッシュを含む単語を返すため、正規表現に問題があります。
Regex: [\/](.*?)\s\b
Result: /WRB /MD ....
これを行うためのより良い方法がある場合は、私に知らせてください。誰かが私の正規表現の何が問題なのかを理解するのを手伝ってくれます。