問題タブ [hunspell]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 単語の頻度に基づく最大編集距離と提案
次の仕様のスペルチェッカーが必要です。
- 非常にスケーラブルです。
- 提案された単語の最大編集距離を設定できるようにします。
- 提供された単語の頻度に基づいて提案を取得します (最も一般的な単語が最初)。
Hunspell を調べてみ
ました。man にパラメータ MAXDIFF が見つかりましたが、期待どおりに動作していないようです。使い方が悪いのかな
ファイルt.aff :
ファイルdico.dic :
-
t.aff
同じものが空かそうでないかを返します:
google-chrome - Chrome (hunspell) の 2 つの BDIC ファイルを 1 つに結合する
Google Chrome スペル チェッカー (hunspell に基づく) から 2 つの BDIC (バイナリ辞書?) ファイルがあります。この 2 つのファイルを、すべての単語に対して 1 つの BDIC に結合したいと考えています。
これは、Chrome ソース (LGPL/C++) からのこの形式のリーダー/ライター(chromium/src/third_party/hunspell/google/bdict_reader.h) です。
C++ またはコマンドライン ユーティリティを使用して 2 つのファイルを結合するにはどうすればよいですか?
ruby-on-rails - HerokuでHunspellを使用する
私は、Rubyがインターフェースできるように、Hunspellとhunspell-ffigemを使用するRailsアプリを構築しています。アプリをherokuにデプロイしていますが、残念ながら、gemを機能させるには、サーバーにHunspellをインストールする必要があります。
HunspellをHerokuにインストールする方法はありますか?または、EC2に移行する必要がありますか?
前もって感謝します :)
dictionary - Hunspellのユーザー辞書の作り方
hunspell のユーザー辞書の作成について質問があります。私は現在、一般的な英語の辞書と接辞ファイルを使用しています。ユーザーごとにユーザー指定の単語をその辞書に追加するにはどうすればよいですか?
emacs - hunspell を使用した Win32 上の Emacs - 個人辞書が保存されない
そのため、wikiの指示に従った後、hunspellを使用してWindows 7でEmacs(v23.3.1)をセットアップしました。
http://www.emacswiki.org/emacs/InteractiveSpell
ドキュメント ( ) のスペル チェックを行うと、キーストロークまたはM-x ispell
を使用してフラグ付き単語を個人辞書に挿入するオプションが emacs に表示されます。最後に、変更した個人辞書を保存するかどうかを尋ねられ、はいを選択します。'i'
'u'
問題は、個人辞書がディスクに保存されず、以前に強調表示された単語が新しいセッションで再びフラグが立てられることです。
他の場所で推奨されている次のことを試してみましたが、役に立ちませんでした。
(setq ispell-personal-dictionary (展開ファイル名 "~/personal-dictionary.txt") )
誰かがこれに対する解決策または回避策を持っていますか? 個人辞書に保存できる場合は、関連するビットを投稿してください。.emacs
.net - Microsoft Word で NHunspell?
NHunspellを Microsoft Wordと統合する方法があるかどうか知っている人はいますか?
Microsoft Word でオープンソースのスペル チェック辞書を使用して、現在 Microsoft から直接スペル チェックを行うオプションがない言語のサポートを有効にする方法を見つけようとしています。しかし、解決策を見つけることができませんでした。
私は特にクメール語を扱っています (私はHunspellのクメール語スペル チェック辞書の作成者の1 人です)。多くの人がクメール語のスペル チェックを使用しない理由の 1 つは、Microsoft Word がサポートされていないためです。Microsoft Word との統合が試みられています ( PAN Cambodiaには Word 用のスペル チェック アドインがありますが、非常に遅くて不正確であるため、基本的に使用できません。
更新: NHunspell を使用して、クメール語と Microsoft Word のスペル チェックを作成できました。ソースコードと一緒にここからダウンロードできます(別の言語にフォークできます)。
bash - 条件付き検索/置換にawkを使用する
一般的ですが非常に具体的な問題を解決したいと思います。OCRエラーのため、多くの字幕ファイルに「l」(小文字のL)ではなく「I」(大文字のi)が含まれています。
私の攻撃計画は次のとおりです。
- ファイルを単語ごとに処理する
- 各単語をhunspellスペルチェッカーに渡します(「echothe-word | hunspell -l」は、有効な場合は応答をまったく生成せず、不良の場合は応答を生成します)
- それが悪い単語であり、大文字のIsが含まれている場合は、これらを小文字のlに置き換えて、再試行してください。現在有効な単語である場合は、元の単語を置き換えます。
スクリプトでファイル全体をトークン化して再構築することは確かにできましたが、そのパスをたどる前に、単語レベルでこれらの種類の条件付き操作にawkやsedを使用できるかどうか疑問に思いました。
他の提案されたアプローチも大歓迎です!
dictionary - Open Spell-Checkers の辞書ファイル構造
FreeDict、Aspell、Hunspell/OpenOffice 辞書のファイル構造、特に各ファイルの各行の末尾にあるスイッチに関する説明ドキュメントやチュートリアルはあり.dic
ますか? 私の推測では、スイッチは単語の意味解釈を説明していると思います。
- 名詞
- 形容詞
- 副詞
- 副詞
- 等
または上記の任意の組み合わせ。しかし、これらをスイッチ文字に一致させる方法がわかりません。
.aff
また、ファイルに記述されている内容についても興味があります。
c++ - Hunspell:確かな例はありますか?
hunspellをダウンロードしてコンパイルしました。今、私はwxWidgetsでテストアプリを作りたいと思っており、例やチュートリアルを探し始めました。これまでのところ、私は何も見つけていません。「例」の実行可能ファイルは見つかりましたが、コードが見つかりません(どこかに隠されている可能性があります)。3日間のインターネット全体で、私は何も見つかりませんでした。私が見つけた最高のものは、私が理解できない言語であるこれです。
簡単な例、チュートリアルへのポインタ、またはそのことに関して価値のあるものをいただければ幸いです。どうもありがとう!
java - Lucene と Hunspell を組み合わせて PDF ドキュメントを検索するには?
hunspell を lucene に実装しようとしています。タスクは、pdf ドキュメント内の単語を検索するアプリケーションを作成することです。私は一般的に何をしなければならないかを知っていますが、具体的ではありません。ドキュメントの単語のルートを含むインデックスを使用してリストを作成し、そのリストを検索する必要があることはわかっています。
しかし: 私は Java の初心者なので、どのように始めたらよいかわかりません。どのアドバイスも参考になります。