どのプラットフォームを使用していますか?unix / linux / macOS / cygwinでは、次の操作を実行できます。
sed 's/[\.\?\!]/\n/' < myfile | grep 'myword'
これはあなたの単語を含む行だけを表示します(そしてsedは文に非常に大まかなトークン化を取得します)。特定の言語での解決策が必要な場合は、使用しているものを言う必要があります。
Python用に編集:
以下は機能します---単語に正規表現が一致する場合にのみトークン化を呼び出します(これは非常に高速な操作です)。これは、必要な単語を含む行のみをトークン化することを意味します。
import re
import os.path
myword = 'using'
fname = os.path.abspath('path/to/my/file')
try:
f = open(fname)
matching_lines = list(l for l in f if re.search(r'\b'+myword+r'\b', l))
for match in matching_lines:
#do something with matching lines
sents = sent_tokenize(match)
except IOError:
print "Can't open file "+fname
finally:
f.close()