“word-boundary”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

5060 参照

c# - C# 正規表現で \b を使用しても機能しませんか?

次の正規表現が一致しないのはなぜだろうか。

から単語境界文字 (\b) を削除すると、patternうまく一致することに注意してください。これをつまずかせている可能性のある '\b' について何かありますか?

c#regex word-boundary

2010-03-15T17:59:00.483

0 投票する

5 に答える

12724 参照

javascript - javascriptのutf-8単語境界正規表現

JavaScript の場合:

正しく私に与えます：

ただし、utf-8文字を使用する場合:

単語境界演算子が機能していないようです:

これに対する解決策はありますか？

javascript regex unicode utf-8 word-boundary

2010-05-21T11:01:52.753

0 投票する

5 に答える

4258 参照

javascript - JavaScript 正規表現と境界

同僚から正規表現の問題について尋ねられましたが、見つけて答えられないようです。

テキストエディターで特定の長さのテキストを強調表示するために境界を使用していますが、問題を示すサンプルコードを次に示します。

問題は、最初のリテラル str.replace は機能しますが、RegExp オプションは機能しません。

IE と FF で同じ動作をしていますが、その理由を知っている人はいますか?

javascript regex word-boundary

2010-06-03T13:46:29.150

0 投票する

2 に答える

601 参照

java - Java 正規表現の単語境界内で先頭または末尾のドル記号 ($) を引用できるようにする必要がありますか?

Java (1.6.20) で一致する先頭/末尾の $ を持つ正規表現を取得するのに問題があります。

このコードから:

次の結果が得られます。

最初の 2 つのブロックの先頭の false が問題のようです。つまり、先頭/末尾の $ (ドル記号) は、\b (単語境界) マーカーのコンテキストで適切に取得されません。

\b を .* に置き換えるか、すべて一緒に削除すると、目的の結果が得られるため、ブロック内の真の結果は、引用符で囲まれたドル記号自体ではないことを示しています。

最後の 2 つの「真」の結果は、問題が内部的に引用された $ にも、引用された式「\Q ... \E」内の単語境界 (\b) の一致にもないことを示しています。

これは Java のバグですか、それとも何か不足していますか?

java regex unicode word-boundary dollar-sign

2010-07-23T16:08:02.577

0 投票する

5 に答える

1939 参照

regex - 単語境界での Perl 正規表現の置換。「/」を単語境界として検出する

奇妙な正規表現の問題が発生しています....置換を行っているドキュメントがあります...例として、「DEXX」を「DEXX/AREX」に置き換えてから、次の置換で置き換えたい.. . 「AREX」と「AREX/CUBE」

DEXX と AREX は次のようにハッシュに格納されます.... "DEXX" => "AREX", "AREX" => "CUBE"

私が持っている正規表現はこれです.....

何が起こっているかというと、「DEXX」が「DEXX/AREX」に置き換えられているということですが、「DEXX/AREX」が検出されると、正規表現は「DEXX/AREX」を「DEXX/AREX/CUBE」に置き換えます。「DEXX/AREX」のような別の組み合わせの一部としてではなく、独立した単語として検出された場合は「AREX」

「/」を単語境界として検出するようです。誰かがこれに遭遇したか、それに関する修正を知っていますか? どうもありがとう！エイミー

regex perl word-boundary

2010-08-12T02:41:17.160

0 投票する

2 に答える

951 参照

php - PHPの非ラテン文字の単語境界

この例は正常に動作します:

「u」修飾子を使用しても、これはロシア語の文字が使用されていても機能しません。

それで問題は、これを修正するにはどうすればよいですか？
ありがとう。

php regex word-boundary non-latin

2010-08-29T13:57:18.430

0 投票する

3 に答える

1495 参照

java - テキストからの単語境界の検出

単語境界の識別でこの問題が発生しています。ウィキペディアドキュメントのすべてのマークアップを削除しました。次に、エンティティのリストを取得したいと思います（意味のある用語）。文書のバイグラム、トリグラムを取り、辞書（wordnet）に存在するかどうかを確認する予定です。これを達成するためのより良い方法はありますか？

以下はサンプルテキストです。エンティティを識別したい（二重引用符で囲まれているように表示）

Vulcans are a humanoid species in the fictional "Star Trek" universe who evolved on the planet Vulcan and are noted for their attempt to live by reason and logic with no interference from emotion They were the first extraterrestrial species officially to make first contact with Humans and later became one of the founding members of the "United Federation of Planets"

java algorithm data-structures text word-boundary

2010-09-04T03:11:37.853

0 投票する

2 に答える

3082 参照

javascript - アクセント付き文字を考慮した正規表現を作成するにはどうすればよいですか?

基本的に2文字の単語を見つけるJavaScript正規表現があります。問題は、アクセント付きの文字を単語の境界として解釈することです。確かに、そのようです

単語境界 ("\b") は、片側に "\w" があり、反対側に "\W" がある 2 つの文字の間のスポットです (どちらの順序でも)。 "\W" に一致する文字列の先頭と末尾。 AS3 RegExp は、境界型の文字を含む単語に一致します

それ以来

\w は、アンダースコア ([a-zA-Z0-9_] の略) を含む任意の英数字 (単語文字) と一致します。\W は、単語以外の任意の文字に一致します ([^a-zA-Z0-9_] の略) http://www.javascriptkit.com/javatutors/redev2.shtml

明らかにアクセントのある文字は考慮されません。のような言葉で問題になりますMontréal。éが単語境界と見なされる場合、はal2 文字の単語です。アクセント付き文字を許可する単語境界の独自の定義を作成しようとしましたが、単語境界は文字でさえないため、それを見つける方法が正確にはわかりません..

何か助けはありますか？

以下は、正規表現userInputを使用して 2 文字の単語を検索して見つける、関連する JavaScript コードです。re_state

javascript regex diacritics word-boundary

2010-09-12T04:28:31.547

0 投票する

3 に答える

16454 参照

regex - PostgreSQL 正規表現の単語境界?

PostgreSQL はサポートしています\bか?

私は試し\bAB\bていますが、何にも一致しませんが、一致(\W|^)AB(\W|$)します。この 2 つの表現は本質的に同じですよね。

regex postgresql word-boundary

2010-09-29T20:41:33.217

0 投票する

1 に答える

1848 参照

javascript - jQuery（Javascript）で段落内の「単語」インデックスを見つける

テキストの段落を表す文字列があります。

この段落で「単語」のインデックスを検索し、「単語」と完全に一致させたいと考えています。たとえば、「古い」を検索する場合。「コールド」の「古い」の一致は無効であるため、2 つではなく 1 つの結果しか取得できません。

javascript regex word-boundary

2010-10-19T17:01:00.377

問題タブ [word-boundary]

Reference