問題タブ [word-boundaries]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - \bの正規表現
JavaでUnicodeテキストの正規表現を書いています。ただし、私が使用している特定のスクリプト(デーバナーガリー(0900〜097F))では、単語の境界に問題があります。\ bは、従属母音(093E-094Cなど)である文字と一致します。これらはスペース文字のように扱われるためです。
例:次の文字列があるとします。同様に最後の言葉で。これにより、\bは「कमाल」の「ल」を正規表現\b \ w \ bと一致させますが、これは言語によっては正しくありません。
この例がお役に立てば幸いです。
特定の文字と一致しないことを除いて、\ bのように動作する正規表現を記述できますか?フィードバックはありがたいです。
regex - 単語の境界に関する正規表現のヘルプ(例外が必要)
このテキストが与えられた:
私はそれをこの正規表現と一致させることができます:
キャッチは私がこれを持っているかどうかです:
その2番目のダッシュは単語の境界と見なされるため、一致は「world」で終了します
正規表現で「単語の境界がダッシュでない限り、次の単語の境界で停止する」とはどうすればよいですか?
これは.jsにあります。
python - re モジュールの正規表現は単語境界 (\b) をサポートしていますか?
正規表現についてもう少し学習しようとしているときに、チュートリアルで を使用し\b
て単語境界を一致させることができると提案されました。ただし、Python インタープリターの次のスニペットは期待どおりに機能しません。
何かが一致した場合、それは一致オブジェクトであったはずですが、None
.
式は\b
Python でサポートされていませんか、それとも使い方が間違っていますか?
javascript - 単語境界と比較した、正規表現(\ B)の非単語境界とは何ですか?
単語境界と比較した、正規表現(\ B)の非単語境界とは何ですか?
ruby - irbの単語境界
SnowLeopardでTerminalを使用しています。
コマンドラインで入力foo.bar.baz.bang.quuz.quux
した場合、オプションBをタップすると、カーソルが単語ごとに後方に移動します。ピリオドは単語の境界と見なされるため、ピリオドごとに停止します。同様に、オプションFは単語ごとに進みます。
irb(0.9.5、ruby 1.8.7)では、オプションBと-Fもこの動作をしますが、ピリオドは単語の境界として扱われなくなり、これらのキーボードショートカットの有用性が大幅に低下します。
どうすればこれを変更できますか?
編集:好奇心旺盛で好奇心旺盛:同じirbバージョンとrubyバージョンを持つEC2インスタンスでは、ピリオドは単語の境界として扱われます。
java - 括弧「(」を含み、単語境界を使用して単語を見つける方法は?
大きなテキストで「成功する(そして失敗から学ぶ!) 」というフレーズを探しています。角かっこがあるので、quote(...) を使用してそれを許可しましたが、単語の境界 "\b" も使用したいので、このフレーズがそのようなテキストで見つかった場合は無視されます "Kin successes (そして、彼らの成功から学ぶ)失敗!)」。
これが私のコードです:
前述のように、このコードは "\b" を使用しているため false を返します。「\b」を省略した場合、マッチャーは true を返します。quote(...) + "\b" という 2 つの条件を使用しているときにこれを修正する方法はありますか?
c# - 言葉の境界のためのオーディオマイニング
私がやろうとしていること:
英語のアクセントを(専門的な訓練なしで)開発したい。
エグゼクティブサマリーによる私の推論の背後にある公理のセット:
以下は、故意に単純化しすぎています。申し訳ありません。私は質問を短くしようとしました。
パート1:学習の仕組みを理解する。
現時点では、ブローカ野とウェルニッケ野は言語を認識している必要があり、既存の音声アルファベットによる筋肉の記憶がスピーチを構築すると思います。アクセントは、音のアルファベットの同化によって時間の経過とともに自然に形成されます。
Googleを使用して、音声シャドウイングが音声記号の同化に使用できる可能性があることを発見しました。一方、筋肉の記憶は、反復的な行動によって簡単に訓練することができます。そして、これは、23〜24歳で、集中力を失うと効果的な学習曲線の勾配が劇的に減少する可能性があるため、手に解釈できない時間がたくさんある場合に最も効果的です。この種の手続き記憶は、おそらく、設計されたスリープパターンでメモリにフラッシュするように最適化できます。
パート2:行動パターンの設計
- アクセントになりたい流暢なスピーカーを探す。
- ターゲットアクセント音素と電話を区別します。
- ターゲットのアクセントを生成するために筋肉の記憶をトレーニングします。
パート3:私が聞こえたいアクセントの流暢なスピーカーを見つける。
Youtubeは強力な無料のリソースです。サンプルオーディオ、私が選ぶのが難しい:
-HDの
Someone Like You
アデル(カバー) 。
高音の女性の声だと気になりません。
パート4:ターゲットアクセント音素と電話を区別する。
それは簡単な作業ではありません-話された電話が正しいかどうかを識別して判断します。そして、具体的なテキストが人間によってどれほど正しく話されているか。実際には非常に複雑に見えるので、わざわざ自動化せず、ベースラインとしてIPAを使用します。
上記のサンプルオーディオのアメリカのIPAでの単語ストレスのある最初の詩篇は次のとおりです。
著作権の侵害は意図されていません。そして、画像はupodn(代替:photransedit)で作成されます。
パート5:ターゲットアクセントを生成するための筋肉記憶のトレーニング。
同期を模倣してアーカイブするのは楽しいことですが、単語を音声ファイルとして抽出するツールを作成することをお勧めします。したがって、winampまたはipodを使用して、必要な単語をループおよびシャッフルできます。
これにはMS式エンコーダーを使用できると思います。
質問
オーディオファイル(例:wav形式、サイズ<32mb)とそれに相当するテキスト(有限の単語数、例:2000)が与えられた場合、それを複数のファイルに分割する方法。それぞれに1つの単語が含まれます。Wordには余分な空白を含めることができ、境界チェックはユーザーが承認できます。正確でない場合は、単語の境界を適切に推定するための最良の方法は何ですか。
主な目的は、これが手動で行われる場合、私が行うであろう作業を減らすことです。
regex - 拡張された文字セットを持つ単語境界
\w
に一致するのは私には少し奇妙に思え[a-zA-Z0-9_]
ます。なぜ0-9
と_
は単語文字の間に数えられ、なぜ単語文字の間に数えられないのだろうか-
。
文を分割したい場合:
This is counter-example.
これにより、反例(\w*\b)
という単語が2つの部分に分割されます。同様に、にのみ一致します。(count.*?\b)
counter
単語文字()に含まれる\b
結果のようなものを持つことは可能でしょうか?-
\w
それとも私はの使用法を誤解しました\b
か?これの標準的な使用法の例はありますか?
html - リスト項目はリストおよび div 領域の外で実行されます
メニューの順序付けられていないリストに問題があります。これにより、リスト項目は境界を超えて実行され<ul>
、<div>
画面の端に到達すると次の行のみが開始されます。
ウェブサイトはこちら: http://finalonline.co.uk/mypics/gallery/categories/
jtextarea - テキストを追加すると JTextArea setWrapStyleWord(true) が機能しない
Oracle at JTextArea documentationによると、行を折り返し、文字の境界ではなく単語の境界で折り返したい場合は、次のようにコードを使用する必要があります。
jtaOutputPrimes は myJTextArea
上の myの名前であることに注意してくださいJPanel
。
次のようにメソッド append を使用して JTextArea にテキストを追加すると、問題が発生します。
この場合、setWrapStyleWord
設定は機能しません。単語の境界ではなく、文字の境界を引き続き使用します。
ここで同じ問題が発生している別の人を見つけました: setWrapStyleWord の問題
JApplet
さて、 this を持つを実行しているとしましょうJTextArea
。テキスト領域に入力すると、ワード ラップは正常に行われますが、append メソッドから渡されたテキストは機能しません。
これはバグだと思いますが、オラクルがそのように認めている場所はどこにもありません。
誰でも助けることができますか?ありがとう!