1

特定の言語のスパムを検出するために多くのテクノロジを使用できます。適切なテクノロジを採用すれば、システムで複数の言語のスパムを検出できるようになりますが、これには単一のテキストが特定の言語である必要があります。

だから私の質問は、複数の言語で構成されたテキストを検出する方法ですか? これは言語検出だけではありません。多言語テキスト スパム検出のベスト プラクティスを知りたいです。

4

1 に答える 1

0

単純な解決策は、依然として翻訳 API を使用して、テキストを言語ごとにフラグメントに分割することです。次に、テキストの断片を言語別に分類します。

これは簡単な解決策ですが、翻訳 API が頻繁に呼び出されるため、パフォーマンスが心配です。

大企業やいくつかの優れたプロジェクトがこの問題をどのように処理するのか疑問に思っていました.

于 2016-04-25T20:46:53.033 に答える