0

このリンクPython 抽出文を含む wordで説明したのと同じ問題がありますが、違いは、同じ文で 2 つの単語を見つけたいということです。2 つの特定の単語を含むコーパスから文を抽出する必要があります。誰か助けてくれませんか?

4

3 に答える 3

2

これは、TextBlobパッケージを Python のビルトインセットと一緒に使用することで簡単になります。

基本的に、テキストの文を反復処理し、文中の一連の単語と検索語の間に共通部分が存在するかどうかを確認します。

from text.blob import TextBlob

search_words = set(["buy", "apples"])
blob = TextBlob("I like to eat apple. Me too. Let's go buy some apples.")
matches = []
for sentence in blob.sentences:
    words = set(sentence.words)
    if search_words & words:  # intersection
        matches.append(str(sentence))
print(matches)
# ["Let's go buy some apples."]

更新: または、よりPython的には、

from text.blob import TextBlob

search_words = set(["buy", "apples"])
blob = TextBlob("I like to eat apple. Me too. Let's go buy some apples.")
matches = [str(s) for s in blob.sentences if search_words & set(s.words)]
print(matches)
# ["Let's go buy some apples."]
于 2013-08-30T20:56:25.003 に答える