テキストのブロックを取り、与えられた量の文字からできるだけ多くの単語を抽出したいと思います。これを実現するためにどのツール/ライブラリを使用できますか?
たとえば、指定されたテキストブロックでは次のようになります。
Have you managed to get your hands on Nikon's elusive D4 full-frame DSLR?
It should be smooth sailing from here, with the occasional firmware update being
your only critical acquisition going forward. D4 firmware 1.02 brings a handful of
minor fixes, but if you're in need of any of the enhancements listed below, it's
surely a must have:
それを文字列に割り当ててから作成するとstring = string[0:100]
、最初の100文字が取得されますが、「sailing」という単語は「sailin」に切り取られ、テキストは正しく切り取られます。 「セーリング」の前のスペースの前または後。