“misspelling”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

640 参照

javascript - Post メソッドでエラーがスローされる

チュートリアルhttps://docs.angularjs.org/tutorial/step_00のアプリに基づいてテストアプリを実行しようとしています。それは正常に動作しますが、ポストメソッドを使用しています。

index.html

controllers.js

Get メソッドは正常に動作し (表示された html コードにはその使用法が含まれていません)、chiliSpicy 関数も動作します。しかし、 sendData 関数はエラーをスローします (成功関数がある場所)

実際、サーバーはデータを受信しますが、success 関数は通過しません。何か案が？ありがとう。

2015-01-10T16:29:04.480

0 投票する

1 に答える

636 参照

php - 不足している文字を処理できる MySQL クエリ

MySQL クエリを改善しようとしています。

次のような形式の URL で構成される入力を取得しました。

URL からゲーム名を取得し、これを SQL クエリの入力として使用します。

$query = "明白な光景"
$query = "テックス・マーフィー火星人覚書"
$query = "フライン"
$query = "ペンギンアリーナセドナの世界"

データベースでは、一致する名前に ' ! などの文字が含まれることがあります。

例：

「プレーンサイト」
「テックス・マーフィー：火星人覚書」
「フライン」
「ペンギンアリーナ：セドナの世界！」

そのため、URL から取得した名前を入力すると、2 番目、3 番目、4 番目の例では結果が得られません。だから私がしたことは、％文字を使用することでした。

$query = "plain%sight"
$query = "tex%murphy%martian%memorandum"
$query = "フライン"
$query = "penguins%arena%sednas%world"

これにより、1 番目と 2 番目の例の結果が得られます。

.

私の質問に：

私の質問は、3 番目と 4 番目のものも機能するようにこれを改善するにはどうすればよいですか?

各文字の前後に % を追加することを考えています:

$query = "%f%l%y%n%"
$query = "%p%e%n%g%u%i%n%s%a%r%e%n%a%s%e%d%n%a%s%w%o%r%l %d%"

しかし、それがどのようにパフォーマンスを向上させるのか、これが最善の解決策であるかどうかはわかりません。

% を追加することは良い解決策ですか?

うまく機能するクエリを作成する方法に関するその他のヒントはありますか?

進捗：

少しテストした後、多くのワイルドカード (%) を追加することはお勧めできないことがわかりました。データベースから予期しない結果が返されることがあります。これは、単純に、多くの一致方法を追加したためです。

slug メソッドを使用することが唯一のオプションのようです。

php mysql misspelling

2015-02-14T12:58:56.213

0 投票する

1 に答える

173 参照

tokenize - スタンフォードNLPトークナイザー

StanfordNLP を使用して、スマートフォンで書かれた一連のメッセージをトークン化します。これらのテキストには多くのタイプミスがあり、句読点の規則が守られていません。多くの場合、空白が欠落してトークン化に影響します。

たとえば、次の文では、"California.This" と "university,founded" の空白が抜けています。

スタンフォード大学はカリフォルニア州にあります。この大学は 1891 年に設立された素晴らしい大学です。

トークナイザーは以下を返します。

{"Stanford", "University", "is", "located", "in", "California.This" , "university", "is", "a", "great", "university", "," 、「設立」、「」、「1891」、「。」}

観察されたように、彼らは "California.This" 以外のすべてのトークンを適切に分割しました (3 つのトークン {"California" "." "this"} があると予想しています)。トークン化ルールを調べたところ、単語の正規表現が単語の文末に使用される句読点を受け入れることがわかりました。

WORD = {文字}({文字}|{数字}) ([.!?]{文字}({文字}|{数字}) )*

最後の部分を削除して再コンパイルしましたが、トークナイザーはまだ動作を変更しません。

誰かがこの望ましくない動作を回避する方法を知っていますか? または誰か、このタイプのテキストでうまく機能する別のトークナイザーを教えてもらえますか?

tokenize stanford-nlp misspelling

2015-02-27T10:27:14.983

0 投票する

2 に答える

806 参照

java - App Engine Search API は、部分一致やスペルミスの一致を許可しますか?

私のフォーラムでは、Google App Engine Search Api を使用しています。したがって、当然、部分的なスペルミスの単語を見つけられるようにしたいと考えています。しかし、APIはそれをしません。このAPIの回避策またはより良い代替手段を知っている人はいますか?

部分一致の場合、フォーラムコメントの各単語を一連の部分文字列に分解することを想像できます。しかし、それはかなり高価なようです。考えてみてください: コメントが 60 語 (たとえば合計 500 文字) の場合、その 1 つのフォーラム投稿を保存すると、ドキュメントに巨大なテキストフィールドが追加されます。

これはかなりばかげています。特に正規表現マッチャーの方がはるかに経済的です。ここで疑問が生じます: 部分的な単語を検出できるように、クエリが正規表現マッチングを使用しないのはなぜですか? スペルミスに関しては、これを行うためのアルゴリズムがいくつかありますが、App Engine Seach API がそれを提供していないのはなぜですか?

もちろん、私が間違っていて、Search Api が実際にこれらすべての機能を提供していることを誰かが教えてくれることを期待して、ここに投稿しています。私はオンラインで多くのチュートリアルを見てきましたが、これまでのところあまりありません。もう一度質問します。App Engine Search API はpartial text matchingand を許可しmisspelled text matchingますか? そうでない場合、どうすればハッキングできますか?

java regex google-app-engine google-search-api misspelling

2015-03-26T19:10:52.193

0 投票する

1 に答える

370 参照

elasticsearch - Elastic Suggesters のウムラウト

現在、Google のスペルミス修正に似たサジェスタを設定しようとしています。次のクエリでElastic Suggestersを使用しています。

次の提案が得られます。

今私が抱えている問題は、オプション内と提案内の返されたテキストにあります。私が送信したテキストと返されたテキストは、「hule」ではなく「hüle」である必要があります。さらに、返されるオプションテキストは、実際には「hulle」ではなく「hülle」である必要があります。クエリとサジェスタに同じフィールドを使用しているため、通常のクエリ結果ではなく、サジェスタでのみウムラウトが欠落しているのはなぜだろうか。

ここでクエリ結果を参照してください。

elasticsearch search-suggestion misspelling

2016-02-13T11:04:59.120

0 投票する

1 に答える

359 参照

algorithm - レーベンシュタイン距離は、スペルミスのある単語をすべての辞書の単語と比較するのではなく、別の方法があります

スペル修正用の AI アルゴリズムを探していたところ、2 つの文字列の類似性を比較するレーベンシュタイン距離アルゴリズムが見つかりました。はいの場合、時間の実行が遅くなるからです。そして私の2番目の質問は、このアルゴリズムが同じ長さを持たない2つの文字列に実装できるかどうか、事前に感謝します

algorithm artificial-intelligence levenshtein-distance misspelling

2016-04-27T21:14:08.127

0 投票する

1 に答える

947 参照

nlp - スペル修正モデルの評価は?

私はスペル修正モデルを調査しており、いくつかの評価指標を見つけようとしています。偽陰性は既に正しい単語を修正しようとするものであり、偽陽性は誤りを見逃すものであると考える場合、精度、再現率、および精度を計算できます。ただし、これらのメトリクスは、修正モデルの品質 (間違った単語をユーザーが入力しようとしていたものに正しく修正したかどうか) については何も述べておらず、修正機能ではなくスペルチェック機能のみを評価しています。

nlp spell-checking spelling misspelling

2016-06-29T01:47:13.293

問題タブ [misspelling]

Reference