基本的に段落を含む文字列があります。改行がある可能性があります。ここで、文字列の最初の文だけを取得したいと思います。やってみようと思った
indexOf(". ")
それはスペースのあるドットです。
問題は、これが。のような行では機能しないことですfirstName. LastName
。
.Netを使用しています。これを達成するために利用できる良い方法はありますか?また、Javaにタグを付けて、検索を絞り込むことができるかどうかを確認します。
基本的に段落を含む文字列があります。改行がある可能性があります。ここで、文字列の最初の文だけを取得したいと思います。やってみようと思った
indexOf(". ")
それはスペースのあるドットです。
問題は、これが。のような行では機能しないことですfirstName. LastName
。
.Netを使用しています。これを達成するために利用できる良い方法はありますか?また、Javaにタグを付けて、検索を絞り込むことができるかどうかを確認します。
必要なのは、自然言語解析 (NLP) ツールキットです。多くの調査とデータ収集が必要なため、自分で作成するのは非常に困難ですが、幸いなことに、既に作成されています。
。ネット
SharpNLP は、C# で記述された自然言語処理ツールのコレクションです。現在、次の NLP ツールを提供しています。
- センテンススプリッター
- ...
ジャワ
何らかの方法で文の終わりをマークする必要があります。すでに指摘したように、「。」別の使い方ができるので、そうしていません (「こんにちは、私の名前は Pudelhund さんです。」)。可能であれば、使用されない記号を使用することをお勧めします。
編集: 他の方法も同様に優れていますが、より複雑です。ただし、使用している文字列を編集できない場合は、その方法が私の方法よりも優れています;)