1

基本的に段落を含む文字列があります。改行がある可能性があります。ここで、文字列の最初の文だけを取得したいと思います。やってみようと思った

indexOf(". ") 

それはスペースのあるドットです。

問題は、これが。のような行では機能しないことですfirstName. LastName

.Netを使用しています。これを達成するために利用できる良い方法はありますか?また、Javaにタグを付けて、検索を絞り込むことができるかどうかを確認します。

4

3 に答える 3

2

必要なのは、自然言語解析 (NLP) ツールキットです。多くの調査とデータ収集が必要なため、自分で作成するのは非常に困難ですが、幸いなことに、既に作成されています。

。ネット

SharpNLP は、C# で記述された自然言語処理ツールのコレクションです。現在、次の NLP ツールを提供しています。

  • センテンススプリッター
  • ...

ジャワ

于 2012-05-01T18:27:11.167 に答える
2

何らかの方法で文の終わりをマークする必要があります。すでに指摘したように、「。」別の使い方ができるので、そうしていません (「こんにちは、私の名前は Pudelhund さんです。」)。可能であれば、使用されない記号を使用することをお勧めします。

編集: 他の方法も同様に優れていますが、より複雑です。ただし、使用している文字列を編集できない場合は、その方法が私の方法よりも優れています;)

于 2012-05-01T18:27:23.383 に答える