--token-regex '[\p{L}\p{M}]+',
マレットがドイツ語のテキストを読めるように、テキストをインポートするための通常のコマンドでコマンドを使用しようとしています。エラー メッセージは表示されず、新しいファイルが作成されます。しかし、それは疑わしいほど小さいです。次に、train-topics
topic-model を使用して実行すると、次のエラー メッセージが表示されます。
3 5
4 5
5 5
6 5
7 5
8 5
9 5
Infinite value after topic 0 0
<350> LL/token: ´┐¢
Infinite value after topic 0 0
<360> LL/token: ´┐¢
Infinite value after topic 0 0
<370> LL/token: ´┐¢
Infinite value after topic 0 0
<380> LL/token: ´┐¢
Infinite value after topic 0 0
<390> LL/token: ´┐¢
さまざまなトークン正規表現コマンドを使用して何時間もこれを修正しようとしましたが、何も機能していないようです。助けがあれば大歓迎です。