ubuntu - ubuntuのテキストファイルから(一意の)単語のリストを生成する方法は?

Question

ASCII テキストファイルがあります。1 つ以上の Ubuntu コマンドを使用して、そのファイルからすべての「単語」のリストを生成したいと考えています。単語は、区切り文字間の英数字シーケンスとして定義されます。区切り文字はデフォルトで空白ですが、句読点などの他の文字も試してみたいと思います。つまり、区切り文字セットを指定できるようにしたいのです。一意の単語セットのみを作成するにはどうすればよいですか? 少なくとも N 文字の長さの単語だけをリストしたい場合はどうすればよいでしょうか?

score 5 · Accepted Answer

これが私の単語の雲のようなチェーンです

tex ファイルがある場合は、次のように置き換えcatますdetex。

ubuntu - ubuntuのテキストファイルから(一意の)単語のリストを生成する方法は?

3 に答える 3

Related

Reference