問題タブ [languagetool]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 言語ツールの例: java.lang.NoSuchMethodError: org.apache.xerces.impl.xs.XMLSchemaLoader.loadGrammar
から例を実行しようとすると、エラー メッセージ java.lang.NoSuchMethodError: org.apache.xerces.impl.xs.XMLSchemaLoader.loadGrammar が表示されます。
http://wiki.languagetool.org/java-api
提供されているソリューション: java.lang.NoSuchMethodError: org.apache.xerces.impl.xs.XMLSchemaLoader.loadGrammar
これは、LanguageTools の依存関係で指定された Xerces が問題を引き起こしていることを意味します。
mvn dependency:tree | grep -i xerces
結果は表示されず、Languagetools pom.xml では Xerces が明示的に除外されています。
私自身のテスト プロジェクトには、次の xerces 依存関係があります。
これらの依存関係の 1 つを取り除くか、依存関係の順序を変更するか、LanguageTool の正しい xerces 依存関係を追加したと思います。正しいアプローチは何でしょうか - これらの 1 つまたは他のものですか?
java - LanguageTool によって無視される 2 単語のパターンを追加する方法は?
状況:
単語のユーザー辞書を Languagetool に追加する機能がまだ実装されていないため、回避策として、次のコード スニペットを思いつきました。
で指定された単語のリストをうまく追加します
無視された単語のリストに。しかし、「Guest bathroom」、「French word」、「test application」などの単語の組み合わせ/2 つの単語パターンについてはどうでしょうか。元の文法ファイルを変更せずにこれらを無視するにはどうすればよいでしょうか。ユーザー定義のルールを作成することでうまくいくと思いますが、上記のコード スニペットのより洗練されたソリューションになる可能性もあります。
質問:
1 語または 2 語のフレーズを無視するユーザー辞書の回避策を実行するには、どのような方法がありますか?
python - 言語ツールの提案メカニズムをオフにする方法は?
私はpythonでlanguageToolを使用しています。しかし、非常に長いテキストや大量のテキストを進めたい場合は、かなり遅くなります。提案メカニズムの長さを読み続けています。実際には提案は必要ありません。rule_id とカテゴリだけに興味があります。
誰かが処理能力を得るためにこの提案メカニズムをオフにする方法を知っていますか?
java - jar ファイル以外の Eclipse エクスポート ライブラリ
外部ライブラリを使用して Eclipse プロジェクトをエクスポートするときに、これまで経験したことのない問題に直面しています。スペル修正機能を備えた小さなプログラムを作成し、ここにある言語ツール ライブラリを使用しました。
このライブラリをビルド パスに配置し、Eclipse プロジェクトに正しくインポートしました。それを実行可能なjarにエクスポートするように依頼すると、EclipseはjarファイルのみをlanguageToolライブラリにエクスポートしますが、このライブラリにはいくつかのtxtおよびxmlファイルも含まれています。コマンドラインからアプリケーションを起動しようとすると、このtxtおよびxmlファイルが見つからないため、エラーが発生します。jar アーカイブに手動で追加しようとしましたが、明らかに機能しません。どうすれば修正できますか?
お時間をいただきありがとうございます。私の下手な英語を許してください。
scalability - LanguageTool のスケーラビリティ
一度に多数のユーザー要求を処理し、非常に大きなテキストを処理できるように、 LanguageTool HTTP Serverを拡張したいと考えています。これを達成するための最良のアプローチはどれですか?
java - 必要な文法ケースに処理する単語の言語ライブラリ?
入力単語を必要な文法上のケース (属格、主格など) および複数形/単数形に変換できるライブラリはありますか?
基本的に英語、ドイツ語、ロシア語に興味があります。
apache lucene
とのようなライブラリがあることは知っていますがlanguage-tool
、それらはステミングとレンマタイゼーションを実行でき、検索とスペルチェックには使用できますが、テキスト変換には使用できないようです。
java - Language Tool で辞書を作成する
言語ツールのスペル チェックで使用するフランス語辞書を作成しようとしています。コード自体がそれを作成しているように見えますが、フォルダーに .dict ファイルが見つからないため、私の場合ではありません。あなたが私を助けてくれることを願っています.Javaコードの間違った使い方かもしれません.
regex - LanguageTool ルールの句読点
トークンに単語と句読点の組み合わせが含まれるルールの書き方がわかりません。
LanguageTool
ルールの句読点はどのように処理すればよいですか?
私はオンラインで見て、いくつかのことを試してみましたが、役に立ちませんでした。
たとえば、両方 1)
2)
そして 3)
失敗した。一方で
私がやりたいドットを考慮しなくても、動作します。
注:私はLanguageTool
内側で使用していTexstudio
ます。