問題タブ [unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - .NETで一致する部分文字列の終わりを見つける
特定のカルチャ(System.CultureInfoから提供)の下で別の文字列と一致する文字列内の部分文字列のインデックスを見つけようとしています。
たとえば、文字列「ass」は、ドイツの文化では「straße」のサブ文字列「aß」と一致します。
を使用して試合開始のインデックスを見つけることができます
しかし、ブルートフォースに頼ることなく、3文字ではなく2文字が一致したことを識別する簡単な方法はありますか?
sql - MySQL-操作「UNION」の照合(utf8_general_ci、COERCIBLE)と(latin1_swedish_ci、IMPLICIT)の不正な組み合わせ
そのエラーを完全に修正するにはどうすればよいですか?MySQLでユニオンができるようになりたいだけです。
(MySQLにその問題を無視させるか、最善の推測をするオプションのようなショートカットを探しています。何百ものテーブルの照合を変更することは考えていません...少なくとも今日はそうではありません)
javascript - ダッシュ文字を含む Punycode を Unicode に変換する
NIATO-OTABD
Punycodeをに変換する必要がありnñiñatoñ
ます。
先日JavaScriptでテキストコンバーターを見つけたのですが、途中にダッシュがあるとpunycode変換がうまくいきません。
「ダッシュ」の問題を修正するための提案はありますか?
c# - .NET 文字列で Unicode エスケープ シーケンスを Unicode 文字に変換するにはどうすればよいですか?
テキスト ファイルを文字列に読み込んで、すべての Unicode エスケープを文字列内の実際の Unicode 文字に変換したいとします。
例:
「次は Unicode の整数文字 '\u2320' の上半分で、これは下半分の '\U2321' です。」
regex - これらの Unicode 文字 (コードポイント) は、この正規表現で何を意味しますか?
私は次の正規表現を持っています: 私は次のような部分のほとんどを見つけました:
検証式の最後の部分を理解するのに助けが必要です:
誰でもこれが何を意味するのか分かりますか?
html - MS Officeハイパーリンクはコードページを変更しますか?
次のURLをIEに貼り付ける場合:http ://technet.microsoft.com/en-us/sysinternals/bb897434.aspx、ページの右側のリンクには、「Zoomitをダウンロード(77KB)」と書かれています。リンクをOfficeドキュメント(Word、Excel、PowerPoint-Office 2003を使用してテスト済み)に貼り付け、ドキュメントからリンクをアクティブ化すると、同じテキストが2つのA-サーカムフレックス記号を取得します。これは、ソースHTMLに「 」が含まれているためです。Unicode 00A0に変換されるエンティティ(ノーブレークスペース)。UTF-8では、これはX'C2A0'として表され、X'C2'はAサーカムフレックスとして表示されます。コードページがこのように混同される方法を完全には理解していませんが、nbsp-entityを含むページがリンクされている場合でも正しく表示されるHTMLメタhttp-equiv文字セット値を見つけたいと思います。 Officeドキュメント。
java - Java、Alfresco Web サービス API、および Unicode NamedValues
Java を使用して Alfresco コンテンツ サーバーにアクセスし、その Web サービス API を介して一部のコンテンツをインポートしています。コンテンツには、いくつかの NamedValue プロパティが UTF-8 (キリル文字) 文字列に設定されている必要があります。Sax パーサーの例外が発生し続けます。
コードは次のようになります。
この問題を解決する方法を知っている人はいますか?
delphi - Delphi 2009 で文字が 1 バイトまたは 2 バイトを使用しているかどうかを確認する方法はありますか?
Delphi 2009 では、文字列型が 2 バイトを使用して文字を表すように変更されました。これにより、Unicode 文字セットがサポートされるようになりました。sizeof(string) を取得すると、 length(String) * sizeof(char) が取得されます。Sizeof(char) は現在 2 です。
私が興味を持っているのは、文字ごとに1バイトに収まるかどうかを確認できる方法を誰かが知っているかどうかです。たとえば、文字がasciiかUnicodeかを確認します。
私が主に知りたいのは、文字列がデータベース (oracle、Documentum) に送られる前に、文字列が何バイト使用するかということです。
データベースを変更せずに、事前に、そして理想的には (大規模なインストール ベースがあるため) 制限を適用できる必要があります。文字列フィールドが 12 バイトを許可する場合、Delphi 2009 では、長さ 7 の文字列は常に 14 バイトを使用していると表示されますが、データベースに到達すると、ascii の場合は 7、2 バイトの場合は 14、または混合。
ruby-on-rails - act_as_taggable_on_steroids の Unicode の問題
フランス語の文字を含むタグを使用してブログを実装しています。私の質問は、URL 内のスペースと Unicode (utf-8) 文字を処理する方法に関するものです。
ohlàlà! というタグがあるとします。タグクラウドに次のコードがあります。
この問題にどう対処すればよいですか?
python - Pythonの文字列がASCIIであるかどうかを確認するにはどうすればよいですか?
文字列がASCIIであるかどうかを確認したい。
私は知っていますord()
、しかし、私が試みるときord('é')
、私は持っていTypeError: ord() expected a character, but string of length 2 found
ます。私はそれが私がPythonを構築した方法によって引き起こされていることを理解しました(ord()
のドキュメントで説明されているように)。
確認する別の方法はありますか?