問題タブ [word-boundary]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java のすべての単語を置き換えます
文字列内の一致する単語を置き換えるために、Java replaceAll() メソッドを使用しています。私の場合、この単語がコンマ (,) ピリオド (.) などの隣にある場合、この単語は置き換えられません。
例:および。そして、そして; と(
これはコードです:
この文字列内のすべての単語を識別できる正規表現を教えてください。
python - pandas str.contains で \b 単語境界を使用するには?
str.contains を使用する場合に相当するものはありますか?
次のコードは、「Sa」が原因で、カテゴリに「Said Business School」を誤ってリストしています。単語境界を作成できれば、問題は解決します。これをめちゃくちゃにした後にスペースを入れます。私はdfsであるパンダを使用しています。正規表現を使用できることは知っていますが、文字列を使用して高速化できるかどうかに興味があります
ruby - 単語境界「または」[@#] を一致させるにはどうすればよいですか?
#
ハッシュタグ、@
、または単語境界のいずれかに一致する正規表現を取得できないようです。目標は、文字列を Twitter のようなエンティティとトピックに分割することです。
"anotherString"
大きすぎる単語を除いて、単語だけを取得するのは簡単です。
戻り["Hello", "world", "ruby"]
ます。@
残念ながら、これにはハッシュタグとsが含まれていません。それは簡単に動作するはずです:
しかし、それは戻ります["@world", "#ruby"]
。これにより、単語の境界は定義上文字ではないため、「単一の文字」のカテゴリに分類されず、一致しないことに気付きました。さらにいくつかの試み:
戻ります["", "", "@world", "", "#ruby", "", "", ""]
。
正しいものと一致しますが[[""], ["@"], ["#"], [""]]
、中括弧は囲まれたすべてをキャプチャすることも意味するため、期待どおりに返されます。
作品の種類。返します[["Hello", ""], ["@world", "@"], ["#ruby", "#"]]
。これで、すべての正しいアイテムがそこにあり、各サブ配列の最初の要素に配置されています。次のスニペットは技術的に機能します。
collect
これを単純化して、後処理を必要としない正規表現だけで正しい部分文字列を一致させて返すことは可能ですか?
regex - 単語境界または非数字での正規表現一致
正規表現パターン (Java) を使用して、3 桁のシーケンスと 3 桁のみが連続するものを見つけようとしています。4 桁が一致しません、2 桁が一致しません。
私にとって明らかなパターンは次のとおりです。
これは、次のような多くのソース文字列のケースと一致します。
ただし、c/1 境界と 3/d 境界は、\b クラスが期待する「単語境界」の一致としてカウントされないため、「abc123def」のソース文字列とは一致しません。
解決策として、非数字 (\D) と単語境界 (\b) の両方を含む文字クラスを追加することを期待していました。しかし、それは違法な構文のようです。
次のようなソース文字列の状況で「123」を抽出する式として何を使用できるか知っている人はいますか?
助けていただければ幸いです。はい、Java では \b のようなコードを \b にダブルエスケープする必要があることは理解していますが、それは私の問題ではなく、これを Java 関係者に限定したくありませんでした。
javascript - Javascript - 正規表現 - 単語境界 (\b) の問題
\b
正規表現でギリシャ文字を使用するのが困難です。
この例 [a-zA-ZΆΈ-ώἀ-ῼ]*
では、必要なすべての単語 (ギリシャ語と英語の両方) をマークすることに成功しています。今、2文字の単語を見つけたいと考えてください。英語の場合、次のようなものを使用します
\b[a-zA-Z]{2}\b
。ギリシャ語の単語を 2 文字でマークする正規表現を書くのを手伝ってくれませんか? (なぜですか?私の最終的な目標はそれらを削除することです)。
使用したテキスト:
Greek MONOTONIC: Το γάρ ούν και παρ' υμίν λεγόμενον, ώς ποτε Φαέθων Ηλίου παίς το του πατρός άρμα ζεύξας δια το μή δυνατός είναι κατά την του πατρός οδόν ελαύνειν τα τ' επί της γής ξυνέκαυσε και αυτός κεραυνωθείς διεφθάρη, τούτο μύθου μέν σχήμα έχον λέγεται、τοδέαληθέςεστιτωνπερίγήνκαικατ 'ουρανόν対厚ωνπαρλλαξιςκαιδι最初のρ主ελλρα反な眉するでしょう。
Greek POLYTONIC: Τὸ γὰρ οὖν καὶ παρ' ὑμῖν λεγόμενον, ὥς ποτε Φαέθων Ἡλίου παῖς τὸ τοῦ πατρὸς ἅρμα ζεύξας διὰ τὸ μὴ δυνατὸς εἶναι κατὰ τὴν τοῦ πατρὸς ὁδὸν ἐλαύνειν τὰ τ' ἐπὶ τῆς γῆς ξυνέκαυσε καὶ αὐτὸς κεραυνωθεὶς διεφθάρη, τοῦτο μύθου μὲν σχῆμα ἔχον λέγεται、τὸδὲὲληθέςἐστιτῶνπερὶγῆνκαὶκατ 'οὐρανὸνὸνὸνἰνἰντωνπαρλαξιςκαὶδι掛式展§§展覧会するまらしいするするするするするするっと
日本語: 実のところ、私たちの国だけでなくあなたの国でも語られている話ですが、むかしむかし、ヘリオスの息子であるファエトンが、父親の戦車をくびきでつないで、父親がたどったコースに沿ってそれを運転することができなかったからです。 、地球上にあったすべてのものを焼き尽くし、落雷によって彼自身が死んだ--その話は、語られているように、伝説のようですが、その真実は、天での体の移動の発生にありますそれは地球の周りを移動し、長い間隔で繰り返される激しい火による地球上のものの破壊.
私がこれまでに試したこと:
ここで私の質問に2と3が提案されました:Javascript - regex - 指定された長さの単語を削除する方法
編集
また読む:
regex - 負の先読みの語長を超える正規表現での語境界の使用
そのタイトルが私の問題を完全に説明していない場合は申し訳ありません. 昨日、誰かがここからの行き方を親切に指摘してくれました:
それは私に次のような結果を与えていました
- STREET: 彼はドライブする
単語境界を使用して:
?(?!The|Long)\b\w+ ドライブ)
これは魅力のように機能しました (STREET は「The Street」に一致するものが返されませんでした)。しかし、「Drive」の 1 単語の接頭辞を探していて、1 単語の除外があるにもかかわらず、その方法を理解できないという問題に直面しています。除外を長くします。例えば
- マイルドライブ
大丈夫ですが
- マイルドライブ
- クイックマイルドライブ
ではありません。これは実際には単なる例であり、この 1 つの特定のインスタンスを解決しようとしているわけではありません。パターンの単一の単語部分から用語と単語を除外する方法。
php - ブラックリストに登録された ID の配列で見つかった ID サブストリングが値に含まれている場合、ファイルパスの配列をフィルタリングします
配列 1 のいずれかの要素が含まれている場合、配列 2 の要素を削除したいと考えています。調査の結果、array_filter を使用する可能性があることがわかりましたが、これを行う方法について混乱しました。次に、配列キーをリセットする必要があります。誰でも方法を提案できますか?
たとえば、「123998」を正確に含む要素は配列 2 から削除されます。「1239986」は削除されません。
配列 1
アレイ 2