問題タブ [utf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - ASP.NET/SQLServer - 特殊文字を含むファイル名を保存すると、保存されたファイル名が変換されます...なぜですか?
奇妙な問題があります。ファイルを保存する ASP.NET アプリがあります。ユーザーがアップロードしたファイルに関するファイル情報を格納するテーブル (SQL 2008 R2) があります。
ときどき、外国のユーザーから特殊文字を含むファイル名を保存すると、データベース テーブルに保存するときに名前が変換されます。 元のファイル名の例: Łinename.mov 保存されるファイル名: Linename.mov
ファイル名を取得してパス/ファイル文字列を作成すると、名前が一致せず、ファイルが見つかりません。
テーブルにはファイル名が nvarchar として格納されており、ユニコード文字が許可されると思いました。
何か案は?サーバー上のファイルの名前を変更せずに、元のファイル名を保存することをお勧めします。
編集: 問題は、問題の文字が UTF-8 文字セットにないことだと思います。私は生活をシンプルにすることでこれを解決しました。私は UTF-8 をサポートしており、ファイルが UTF-8 として保存されたときに変換された場合、それが私のサーバー ファイル名です。
c# - c#でUTF-16文字を文字列として保存するには?
UTF-16 表現が feff2031 である文字を印刷するにはどうすればよいですか?
次のことを試してみると、「?」が表示されます。結果として:
欲しいキャラは「パーミリオン」。詳しくはPER MILLEをご覧ください。
utf - 多言語のcmsにutf-8、utf-16、またはutf-32を使用する必要がありますか?
文字の格納方法の違い以外に、utf-32で表示できる言語とutf-8で表示できない言語の特殊文字はありますか?
mysql - MySQLで漢字を保存する方法
mySQL5.5に文字を保存できません。照合utf8mb4とutf32を試しました。中国語と英語の両方の文字を同じテーブルに格納する必要があります。
php - PHP str_word_count() マルチバイトは安全ですか?
str_word_count()
UTF-8 文字列で使用したい。
これはPHPで安全ですか?そうあるべきだと私には思えます(特に がないことを考えるとmb_str_word_count()
)。
しかし、php.net では、関数の独自の「マルチバイト互換」バージョンを提示することで、混乱を招いている人がたくさんいます。
だから知りたいんだろうな…
str_word_count
(スペース)で区切られたすべての文字シーケンスを単純にカウントすることを考えると" "
、文字シーケンスを必ずしも認識していなくても、マルチバイト文字列で安全であるはずですよね?ASCII (スペース) ではない、UTF-8 に相当する「スペース」文字はあり
" "
ますか?#
ここに問題があると思います。
encoding - 「©」文字を含むファイルの名前を変更
アプリケーション (Windows 上で実行) への入力として、ファイルのリストを受け取りました。これらのファイルは、スクリプトを使用してデータベースから自動的に抽出されました。
一部の名前には特殊文字 (アクセントなど) が含まれているようで、これらの文字は「©」として表示されます。
これらのテキスト ファイル (約 900,000) の名前をプログラムで変更して、この文字を取り除くにはどうすればよいですか? ソースを変更することも、ファイルを再抽出することもできません。問題は、この文字が原因で、システムに関連する別のプログラムがファイルを受け入れないことです。
c - エンコーディングに依存しない方法で端末に出力する
エンコーディング (UTF-8,16,32) に関係なく、文字列を画面に出力したいと思います。この文字列は char 配列で表されるため、null バイトを無視して stdout への出力を続行する必要があります。これにより、printf の家族や友人は問題外になります。
この目的のために、上記のソリューションを選択して、すべての UTF エンコーディング形式を印刷できるようにしました。特定の端末では文字が正しく表示されないことは理解していますが、アプリケーションの外部で構成可能なオプションであるため、それは私の懸念事項ではありません。
私のアプリケーションには、ロードするメッセージ カタログ (en_EN.UTF-8 など) に関する設定がありますが、現在選択されているロケールに基づいてコードで文字列変換を行う必要がないようにしたいと考えています。
公開する前に、このアプローチのレビューをお願いできますか?
c# - 文字列を「InvariantCulture」に変換します
私は次の文字列を持っています
よく見ると違うことがわかります!
このような2つの文字列を比較するために、私はこの解決策を見つけました:
だから私は2つの質問があります
W3Cが文字を実行した方法は、異なる言語でも同じであるため、比較の問題を作成します
C#で文字列を「InvariantCulture」に変換するにはどうすればよいですか
編集:
このリンクは問題をよりよく説明するかもしれません
前もって感謝します
c - C などのプログラミング言語での文字エンコーディング
C に関するチュートリアルや本を読んだことで、世界中で使用されているプログラミング言語である C に (ローマ字やその他のあらゆる種類のアルファベット/スクリプトのテキスト形式として) UTF に関する知識を結びつけようと懸命に努力しています。
C は ASCII 文字を使用するようです。
たとえば、中国語で入出力を行うプログラムを書きたい場合、これを C でどのように実装すればよいでしょうか。
python - 文字列をファイルに保存するPython。Unicodeエラー
PythonのSpreadsheetAPIを使用してGoogleスプレッドシートからデータを抽出しています。スプレッドシートのすべての行をforループでコマンドラインに印刷できますが、一部のテキストには摂氏度記号(小さな円)などの記号が含まれています。これらの行をコマンドラインに出力するときに、ファイルに書き込みたいと思います。しかし、これを行うと、さまざまなUnicodeエラーが発生します。手動で解決してみましたが、多すぎます。
エラーが発生しないようにするにはどうすればよいですか?例えば
UnicodeEncodeError:'ascii'コーデックは位置1394の文字u'\ xa0'をエンコードできません:序数が範囲内にありません(128)