最初に、私はtikaによってペルシア語を検出しようとしました:
tikaでペルシア語のWebページを検出するにはどうすればよいですか?
しかし、tikaはペルシア語をサポートしていないことを理解しました。Farsiを処理するには、tikaで言語プロファイルを作成する必要があります。しかし、私はそれを行う方法がわかりません。実は次のリンクやグーグルの他のリンクからは何も理解できません。私を助けてください。
https://issues.apache.org/jira/browse/TIKA-546
tikaに言語プロファイルを追加する手順を知りたいです。