私はゲームを作成していて、基本形だけでなく他のすべての形も含む辞書 (この場合は平易な単語のリスト) が必要です。この場合、言語はイタリア語で、たとえば、動詞には多くの形と名詞もあります。
言語は非常に不規則なので、すべてを含む可能性のある巨大な情報源から単語を取得したいと考えています。最初はウィキペディアについて考えました。すべての記事をダウンロードし、テキストを抽出し、単語をフィルタリングします。
これには非常に時間がかかるため、時間とリストの完全性の両方の点で、より良い解決策があるかどうか知りたい.