Python では、プログラム内でさまざまな文字列処理関数を実行しています。ユーザーがフォームに用語を入力すると、その用語はさまざまな機能によって処理されます。これらには、ステミング、ストップ ワードの削除、句読点の削除、スペル チェック、類義語の取得が含まれます。
ステミングはステミング パッケージを使用して行われます。
string.replace()
と を使用しREGEX
たストップ ワードと句読点の削除
pyEnchantを使用したスペルチェック
Big Huge Thesaurus APIを使用してシノニムを取得します。
用語は API に送信されます。結果が返され、ハードコーディングされた並べ替えプロセスが実行されます。結局、結果はユーザーに出力されます。プロセス全体に 10 秒以上かかりますが、これは長すぎます。多くの拡張機能を使用しているため、それらをインポートしているため、長い遅延が発生しているのではないかと考えています。
これがstackoverflowのルールに違反していないことを願っていますが、私はpythonが初めてで、これは私が知る必要がある種類のものです.