問題タブ [hunspell]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows - hunspellの入力の特殊文字はスペースとして扱われます
この質問はスーパーユーザーに尋ねられましたが、7日間で8回しか表示されませんでした。Hunspellの知識のある人はstackoverflowに行くので、ここでもう一度質問します。
スウェーデン語の辞書を使用して、コマンドラインでhunspellをテストしています。インタラクティブモードでの入力は、スペルチェッシングの前に、すべての特殊文字(たとえば、åäö)をブランクに置き換えます。
ご覧のとおり、プロンプトのエンコーディングは機能しており、入力と出力の両方にåäとöが表示されます。
配管でも同じ結果が得られます。
、、およびaffファイルの保持など-i UTF-8、hunspellにさまざまなオプションを提供しようとしました。何も機能しませんでした。-i UTF-16SET ISO8859-1
同じことがフランス語でも起こります:
さらに、出力に問題があります。
MinGWでhunspellをコンパイルし、結果として必要なファイルをパスのどこかに移動しましたが、この情報はあまり関連性がないと思います。
hunspellに入力の特殊文字を認識させるにはどうすればよいですか?
php - utf-8テキスト入力を使用してshell_execを介してプログラムを呼び出す
必要条件:hunspellおよびphp5。
bashからのテストコード:
-正しく動作します。
テストコード(test.php):
戻り値
スクリーンショット(無効な文字を含むコードを投稿できませんでした):

shell_execがutf-8を正しく処理できないようです。または、追加のエンコード/デコードが必要な場合がありますか?
編集:有効なデータを取得するには、en_US.utf-8を使用する必要がありました。
spell-checking - Hunspell にスペルミスのある単語の行番号を出力させることは可能ですか?
Hunspellを使用して、自分が書いたエッセイを修正しようとしています。残念ながら、スペルミスのある単語の行番号を出力しない限り、私には役に立ちません。
-a そのため、現在、コマンドにパイプできるようにするために、オプションを使用していますhunspell。マニュアルページには、この-L オプションは「スペルミスのある行を印刷する」と書かれています。しかし、出力に違いは見られません。
これは私が今していることです:
出力例は次のようになります。
「JavaServer」という単語は 78 行目にあり、man ページで説明されているように、その行には 412 文字のオフセットがあります。
足りないものはありますか?この問題の簡単な解決策はありますか? それとも、各行を Hunspell にパイプして、それがどの行番号にあったかを調べる必要がありますか?
前もって感謝します。
c++ - 特殊文字を使用したHunspell提案の処理
Visual Studio 2010を使用して、Windows7のアンマネージC++アプリにHunspellを統合しました。
私は英語で機能するスペルチェックと提案を持っていますが、今はスペイン語で機能するようにしようとしています。スペイン語の提案を受け取るたびに、アクセント文字を含む提案がstd::wstringオブジェクトに適切に翻訳されていません。
Hunspell->suggestメソッドから返される提案の例を次に示します。

これは私がそれをに翻訳するstd::stringために使用しているコードですstd::wstring
そして、それを実行した後、最後にファンキーなキャラクターでこれを取得します。

ここでの変換で何が起こっているのかを誰かが理解するのを手伝ってもらえますか?hunspellから返された負の文字に関連していると思いますが、std::wstring変換コード用にそれを何かに変換する方法がわかりません。
ruby - ルビーの簡単なスペルチェック方法/宝石?
gem または API を使用して、単語のスペルが間違っているかどうかを比較的簡単に確認する方法を探しています。
raspell、ffi-aspell、hunspell-ffi、spell_cheker、spellchecker など、いくつかの gem を使用してみましたが、それぞれに異なるエラーが発生します。
私はRubyにかなり慣れていないので、最初から何かを構築することを含まない単純な解決策を望んでいます(私は多くの短いテキストファイルを処理していて、スペルミスの単語の割合を計算したいです)。
ffi-aspell を試すと、次のエラーが表示されます。
(1)上記の代替アプローチの提案、または(2)上記の5つのgemの使用に関する推奨事項のいずれかをいただければ幸いです。これにより、少なくとも最適なオプションのデバッグに時間を費やすことができます。
visual-studio-2010 - Hunspell コードが Visual Studio 2010 で機能しない
私のプロジェクトの 1 つにスペルチェック機能を組み込む必要があり、hunspell は優れたスペルチェッカーであるため (多くのフリーおよびプロプライエタリ ソフトウェアで使用されています)、hunspell を使用することにしました。ソース コードをダウンロードし、プロジェクト libhunspell をプロジェクトに追加しました。エラーなしでコンパイルし、openoffice Web サイトから英語の辞書をダウンロードしました。以下は、hunspell エンジンを初期化し、そのスペル チェック機能をクラス化するために使用するコードです。
コードはエラーをスローしませんが、単語が何であれ、hunspell_spell は常に 0 を返します。
emacs - emacsで利用可能なインタラクティブなスペルチェックプログラム
最近、emacs24に切り替えて、Ubuntu12.04にアップグレードしました。hunspellが再び正しく機能するようには見えません。hunspellは一般的にaspellよりも優れていると思います。Hunspellは、オーストラリアの辞書のみを使用したいと考えており、米国の英語の辞書は使用したくないか、システムをフリーズさせます。aspellを使用すると、辞書を切り替えたり、flyspellモードを実行したりするのに問題はありません。
私の質問は、人々がemacs24でインタラクティブなスペルをどのように設定しているかということです。引き続きispellとflyspell、またはその他の設定を使用することをお勧めします。emacs24でhunspellを使用していますか?私はこれを機能させることを試み続けるかもしれませんが、他の場所で人々が問題を抱えていないことを確認したいと思います。
apache - Apache Solr 3.5 - 4.0 HunspellStemFilter は、同じ辞書を使用して、コンソール/コマンド ラインで Hunspell とは別の値を返します。
チェコ語のテキストのステミングに HunspellStemFilter を使用すると、悪い結果が返されます。
たとえば、単語「praha」は「praha」と「prahnout」を返しますが、これは正しくありません。
したがって、まったく同じ辞書を使用してコンソール (Hunspell コマンド ライン) で同じことを試してみると、「praha」のみが返され、これは正しいです。
誰か助けてくれませんか?
linux - コマンドラインを使用した非対話型のファイルのスペルチェック
大量のテキスト ファイルがあり、スペルミスやスペルの間違った英単語が多数含まれています。Linux でコマンドライン スペル チェッカーを使用してこのファイルを編集する方法を探しています。これを行う方法をいくつか見つけましたが、私の検索によると、それらはすべてインタラクティブに機能します。つまり、スペルが間違っている単語やスペルが間違っている単語を見つけた場合、ユーザーにいくつかの修正を提案し、ユーザーはそれらのいずれかを選択する必要があります。私のファイルはかなり大きく、多くの間違った単語が含まれているため、この方法で編集することはできません。最初の候補を使用してすべての間違った単語を置き換えるようにスペルチェッカーに伝える方法を探しています。これを行う方法はありますか?(a/hun)spell にはそうするためのオプションがありますか?
よろしく。
lucene - Lucene と Hunspell を使用してすべての語形を生成する
私が取り組んでいるアプリケーションでは、Lucene Analyzer を使用しています。特に Hunspell 部分です。私が直面している問題は、一連の接辞規則を使用して、単語のすべての語形を生成する必要があることです。
たとえば、'educate' という単語にルール ABC を付けると、'educate' という単語のすべての形式が生成されます。- 教育、教育、教育など。
私が知りたいのは、Lucene の Hunspell 実装を使用してこれを行うことは可能ですか? Lucene の Hunspell API はそれほど大きくありません。調べてみましたが、適切なものが見つかりませんでした。
SO で見つけた最も近いものはthisでしたが、hunspell に関連する回答はありません。
更新 1上記に直面したプロジェクトにはもう取り組んでいませんが、Lucene のアナライザーを使用してこれを行うための解決策がまだある場合は、コミュニティが答えを見てくれることを嬉しく思います.