問題タブ [hunspell]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1166 参照

php - HuntSpellChecker クラスを使用した UTF-8 テキストのスペル チェック

HunSpellChecker クラスを使用して文字列のスペル チェックを試みています ( https://web.archive.org/web/20130311163032/http://www.phpkode.com/source/s/php-spell-checker/php-を参照)。 spell-checker/HunSpellChecker.class.php ) および hunspell スペリング エンジン。関連する関数は次の場所にコピーされます。

ASCII 文字列では問題なく動作しますが、アクセント付き文字 (necessário、segurança など) を含むさまざまな言語の文字列や、非ラテン アルファベット (ギリシャ語、アラビア語など) の文字列をチェックする必要があります。

これらの場合の問題は、ASCII 以外の単語が正しくセグメント化されておらず、Hunspell に送信された「スペルミス」の単語が実際には完全な単語ではなく部分文字列であることです (必要に応じて、セグラン)。

問題が発生した場所を追跡しようとしましたが、文字列がリソースに変換されたとき (またはその後のどこか) に、上記のリンクされたクラスの 072 行目にあるに違いないと思います。行 072 には以下が含まれます。

fwrite($pipes[0], $text);

クラスはコメントされていないので、そこで何が起こっているのかよくわかりません。

誰かが同様の問題に対処しましたか、または誰かが助けてくれますか?

このクラスは、examples/HunspellBased.php ファイル ( http://titirit.users.phpclasses.org/package/5597-PHP-Check-spelling-of-text-and-get-fix-suggestions.htmlからダウンロードしたパッケージ) に含まれています。 )。Enchant を使用しようとしましたが、まったく機能しませんでした。

ありがとうございました!乾杯、マヌエル

0 投票する
0 に答える
231 参照

html - Hunspell を使用して Aptana Studio で HTML をチェックしますか?

Hunspell Eclipse プラグイン (バージョン 0.8.7.201205281622) を備えた Aptana Studio 3 (ビルド: 3.4.3.201308090259) を使用しています。環境設定でスペルチェックが有効になっています。スペルミスのある単語は、コメント ブロックやその他の場所で強調表示されます (これがデフォルトの動作だと思います)。

ただし、スペルミスのある単語はHTML 要素で強調表示されません。たとえば、次の場合はフラグが立てられません。

<p>スペルミス</p>

HTML 要素のチェックをオンにする方法はありますか? Aptana/Eclipse の設定で、チェックするものとチェックしないものを指定するものは何も見つかりません。これを変更するためにプラグインの構成ファイルを掘り下げることは嫌いではありませんが、変更を加える適切な場所を見つけることができません。

0 投票する
0 に答える
173 参照

meteor - Meteor に適したスペルチェッカー

Meteor と相性の良いスペルチェッカーはありますか? オープンソースで、純粋な JS 環境で連携するものを探しています。

0 投票する
2 に答える
146 参照

c# - 間違った単語をすべて表示する方法

richTextBox1 にテキストがあります。

  1. 単語を頻度順に並べ替えて、 に表示する必要がありrichTextBox2ます。うまくいくようです。

  2. 間違った単語をすべて見つけて、 に表示する必要がありrichTextBox4ます。ハンスペルを使用しています。どうやら私は何かが欠けているようです。richTextBox4間違った単語だけでなく、ほぼすべての単語が表示されます。

コード:

0 投票する
1 に答える
620 参照

r - Aspell パッケージ/ライブラリを Windows にインストールするにはどうすればよいですか?

Windows の R に Aspell パッケージをインストールしたいのですが、Aspell パッケージのバイナリ ファイルがありません。

何らかの方法を提案してください。

以下は、インストールしようとしたときに表示されるメッセージです。

0 投票する
0 に答える
402 参照

c# - カスタム NHunspell 辞書を作成するには?

NHunspell とその英語辞書を使用して、C# Windows アプリケーションを作成しました。

私が必要としているのは、辞書を作成するための英単語の別のリストです (すべての英単語ではありません)。.dic テキスト ファイル内のすべての単語を削除し、次のように単語リストを追加すると、正しく機能しますか?

0 投票する
1 に答える
698 参照

compilation - win 7 Ultimateでcygwinを使用してhunspell-1.3.2をコンパイルする

ハンスペルが必要です。私はウィンドウズユーザーです。私はwin 7のUltimate Englishを使用しています。

OS 名 Microsoft Windows 7 Ultimate バージョン 6.1.7601 サービス パック 1 ビルド 7601 その他の OS 説明 利用不可 OS メーカー Microsoft Corporation システム名 NURAS-PC システム メーカー Sony Corporation システム モデル VPCW21M1E システム タイプ x64 ベースの PC プロセッサ Intel(R) Atom(TM ) CPU N450 @ 1.66GHz、1666 Mhz、1 コア、2 論理プロセッサ BIOS バージョン/日付 INSYDE R0240E2、07-Dec-09 SMBIOS バージョン 2.6 Windows ディレクトリ C:\Windows システム ディレクトリ C:\Windows\ system32 ブート デバイス \Device\HarddiskVolume1 ロケール 米国 ハードウェア アブストラクション レイヤー バージョン = "6.1.7601.17514" ユーザー名 nuras-PC\nuras タイム ゾーン トルコ 夏時間 インストール済み物理メモリ (RAM) 2.00 GB 合計物理メモリ 1.99 GB 使用可能な物理メモリ 704 MB仮想メモリの合計 4.23 GB 使用可能な仮想メモリ 1.84 GB ページ ファイル スペース 2.24 GB ページ ファイル C:\pagefile.sys

昨日、Cygwin x86 をインストールしたところ、hunspell で書かれたすべてのパッケージが読み取られました。2. Cygwin 環境でのコンパイル make gcc-g++ 開発パッケージ mingw 開発パッケージ (cygwin.dll フリーのネイティブ Windows コンパイル用) ncurses、readline (ユーザー インターフェイス用) iconv (文字変換) 最初にほぼすべての dev および util パッケージを選択しました。 "C:\cygwin\bin\cygwin1.dll" から "c:\Windows\system32\" への最初のプッシュ時、Cygwin コンソールがコマンド "mkdir dene" を書き込んでから、パスを Windows パスに追加し、ダウンロードした hunspell を 2 つ解凍しました。回 7zip を使用し、「dene」ディレクトリの下にコピーして貼り付けてから、Cygwin コンソールをプッシュしました

nuras@nuras-PC ~ $ cd dene

nuras@nuras-PC ~/dene $ ls hunspell-1.3.2

「readlineパッケージ」のインストールを忘れていたようで、これからインストールしてみます。

コンパイルに成功した場合、Cygwin はどのディレクトリに huspell の実行可能ファイルを置きますか? 誰かが私に助けをくれれば、私は感謝します。ありがとうございました。美術

0 投票する
2 に答える
1130 参照

regex - 多言語テキストの単語区切り文字に一致する正規表現

ユーザーが任意の言語で任意のテキストを入力できるテキスト ボックスがあり、そのテキストを単語に分割して、それらの単語を hunspell スペル チェックに渡すことができるようにする必要があります。分割には、単語の区切り記号に一致する正規表現を使用します。

最初は\W、テキストを単語に分割するための単語区切りとして使用していましたが、それは英語などのラテン文字でしか機能しません。ラテン語以外の言語を使用すると、すべての文字が として扱われ\Wます。これ\Wは、 が である任意の文字として定義されているためです[^a-zA-Z0-9_]

これまでのところ、(?![-'])[\pP|\pZ|\pC]英語、スペイン語、ロシア語を正しくトークン化しているようです。基本的に、すべての句読点文字 (ハイフンとアポストロフィを除く)、すべての区切り文字、およびすべての「その他の」文字 (制御、私的使用など) を単語の区切り文字として扱うように指示します。ハイフンとアポストロフィは通常、単語の区切り記号として扱われるべきではないため、除外しました。

私はそれをあまりテストしていませんが、今日思いついたので、多言語テキストで単語区切り文字を一致させるのにより適した正規表現を誰かが知っているかどうか尋ねるのが賢明だと思いました.

日本語、中国語、タイ語など、トークン化できない言語には関心がないことに注意してください。

更新:人々が私が使用している言語を尋ねてきたので (おそらくそれほど重要ではないはずですが)、私は C++ と Qt5 のQRegularExpressionクラスを使用しています。