-1

次の問題があります。

英語辞書を使用する Android アプリケーションを作成しています。これは、英語関連のテストをユーザーに送信する教育アプリです。

次の問題があります。

アプリケーションが生成するテストの難易度を評価するために、

英単語がどれくらい一般的に使用されているかを概算する必要があります。

必要なのは高レベルの概算だけです。妥当な情報源であれば何でも構いません。

問題は、 95000 語を含む辞書 (Sqlite データベース) 内のすべての単語に対してそれを行う必要があることです。

面白い問題ですね。

歓迎以上の提案をしてください!

編集 編集 編集

コードを介してGoogleクエリを実行し、結果を使用して概算を行うことを考えていました。要点は、Google が私のコードで 95000 回の自動クエリを実行できるとは思えないということです...

4

3 に答える 3

1

それは非常に興味深いです。1 つのオプションは、 http://books.google.com/ngrams/graphを照会することです。

統計を収集し、それを詳しく説明できます。いくつかの非常に一般的な単語を使用してベースを設定し、テストされた単語の頻度をベースと比較したり、統計の平均などを実行したりできます。

もちろん、それは英語ではなく書かれたものを反映していますが、日付範囲を最後の50年に制限すると、適切な近似値が得られるはずです.

于 2013-05-13T08:52:42.367 に答える
1

英語の頻度リスト(PDF) を使用します。頻度が低い、またはそのリストに含まれていない単語は一般的ではありません。

于 2013-05-13T08:52:50.333 に答える