英語で有効なすべての単語のデータベースが必要です。ファイルを確認しましたが/usr/share/dict/words
、含まれている単語は10万語未満です。ウィキペディアによると、英語の単語数は475,000語です。完全なリスト(アメリカ式綴り)はどこで入手できますか?
また、アジアやヨーロッパの言語を含む他の言語の単語も提供する単一のWebサイトはありますか?
編集:追加するのを忘れました、名前などは必要ありません。有効な英語の単語だけです。
infochimps.orgで必要なものを見つけることができます。
彼らは無料でダウンロードできる350,000の単純な(すなわち非複合)単語のリストを持っています。
他の言語に関しては、ウィクショナリーをざっと見てみたいと思うかもしれません。すべてのデータベースバックアップへのリンクは次のとおりです。情報はそれほど整理されていない可能性がありますが、言語がある場合は、SQL形式でデータをダウンロードできます。
ここで言及されているhttp://wordlist.sourceforge.net/は表示されませんが、このようなものを探していた場合は、ここから始めます(そして、この質問に出くわしたときはそうだった)。
あなたがそこに欲しいものを見つけることができず、あなたが欲しいものが英語の単語のリストであるなら、あなたはおそらくあなたが欲しいものが何であるかを認識する方法を説明するために少し余分な時間を費やすべきです。
「完全な」リストのようなものはありません。測定方法は人によって異なります。たとえば、スラング、造語、複数単語のフレーズ、不快な用語、外国語、動詞の活用などがあります。百万語も数えている人もいます!したがって、単語リストで何をしたいかを決める必要があります。
Mozilla、OpenOffice、その他多くのソフトウェアで使用されている*spell
en-GB辞書を確認できます。
あなたはこのリストが何のために必要かを言いませんでした。パスワードチェックのブラックリストとして使用されるもので十分な場合は、 cracklibが適している可能性があります。150万語以上含まれています。