私は NLTK と機械学習の初心者です。私は NLTK Naive Bayes Classifier で Python を使用しています。NLTK を使用してテキスト分類用の Naive Bayes Classifier を作成し、ディスクに保存しました。この python コードを使用して、いくつかのテスト データを分類するために必要なときにロードすることもできます。
import pickle
f = open('classifier.pickle')
classifier = pickle.load(f)
f.close()
しかし、私の問題は、新しいテストデータが来るたびに、この分類子をメモリに何度もロードする必要があり、サイズが大きいため、ロードするのに多くの時間 (2-3 分) がかかることです。また、同じセンチメンタル分析プログラムの 2 つのインスタンスを実行する必要がある場合、両方のプログラムがこの分類器を別々にロードするため、2 倍の RAM が必要になります。私の質問は次のとおりです。この分類子をメモリに保存して、必要なときにいつでも感傷的な解析プログラムがこれをメモリから直接読み取ることができるようにする手法はありますか、または分類子のロード時間を最小限に抑えることができる他の方法はありますか? よろしくお願いします。