php - 段落を文に分割する方法

Question

私は使用しようとしてきました:

$string="The Dr. is here!!! I am glad I'm in the U.S.A. for the Dr. quality is great!!!!!!";
preg_match_all('~.*?[?.!]~s',$string,$sentences);
print_r($sentences);

ただし、Dr.、USAなどでは機能しません。

誰にもより良い提案がありますか？

score 11 · Accepted Answer

そのための簡単な解決策はありません。アプリケーションで自然言語処理（NLP）を実行し、各文を認識する必要があります。OpenNLPと呼ばれるものがあります。これは Java ベースの NLP パーサーツールです。または、Ruby のスタンフォード NLP パーサー。phpのようなものを見つけることができます。

ここで、PHP の自然言語処理用の一連のクラスを見つけました。

score 1 · Accepted Answer

うーん、多分次のようなことを試してください$sentences = preg_split('/.*?[?.!]+\s+/', $string);

score 0 · Accepted Answer

あなたの例は、Dr.、USAなどで使用できる句読点文字が文の開始/終了場所を知ることを不可能にすることを明確に示しているため、これはほとんど不可能です。

次の文字を検索して、言及している句読点文字の後に新しい文が続く (後に始まる) かどうかを判断する必要があります。

php - 段落を文に分割する方法

3 に答える 3

Related

Reference