現在、私はかなりの量のテキストを分析しています。前景コーパスと規範コーパスの用語の頻度偏差を特定するために、2 つの単語リストで対数尤度比を実行したいと考えています。Python で対数尤度をコーディングしましたが、バイグラムでコードを実行すると、コンピューターが遅くなり、待ち時間が長くなります。PyLucene を使用してコーパスのインデックスを作成できることを読んだところです。これにより、コーパスでのタスクの実行が高速化されます。インデックスを作成する方法については十分なドキュメントがありますが、PyLucene に対数尤度比関数が存在する場所を読みました。この関数について何か知っている人はいますか?前もって感謝します。