問題タブ [encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - ISO-8859-1 エンコーディングで XmlTextWriter を使用して XML ファイルを書き込む
C# を使用してノルウェー語の文字を XML ファイルに書き込む際に問題が発生しています。ノルウェー語のテキスト (æøå のような文字) を含む文字列変数があります。
XmlTextWriter を使用して XML を作成し、内容を次のように MemoryStream に書き込みます。
次に、ノルウェー語のテキストを次のように追加します。
次に、次のようにファイルをディスクに書き込みます。
問題は、これに関するファイルでは、すべてのノルウェーのキャラクターがおかしく見えることです。
私はおそらく上記のことを愚かな方法で行っています。それを修正する方法について何か提案はありますか?
python - Python でのファイルからの文字読み取り
テキスト ファイルに、「I don't like this」という文字列があります。
しかし、文字列に読み込むと「I don\xe2\x80\x98t like this」となります。\u2018 が "'" の Unicode 表現であることは理解しています。私が使う
読み取りを行うコマンド。
さて、文字列に読み込まれたときに、「I don\xe2\x80\x98t like this like this」ではなく、「I don't like this」となるような方法で文字列を読み取ることは可能ですか?
2番目の編集:この問題を解決するためにマッピングを使用する人を見てきましたが、実際には、この種の ANSI から Unicode (およびその逆) への変換を行う組み込みの変換はありませんか?
encoding - ブラウザのファイル ダウンロード ボックスに非 ASCII ファイル名を表示するにはどうすればよいですか?
非ASCII形式でヘッダーパラメータを送信する方法は受け入れられていないようです。
通常、ファイル ダウンロードのヘッダーは次のようになります。
Content-disposition: 添付ファイル。ファイル名="theasciifilename.doc"
ファイル名パラメーターで utf8 でエンコードされた文字列を壊した場合を除いて、Firefox は問題なく処理しますが、IE はスローします。
ファイル名をエンコードする方法を説明するドキュメントが CodeProject にあります。
このドキュメントは、Bản Kiểm Kê.doc を、バイトを 16 進法でエンコードして B%e1%ba%a3n%20Ki%e1%bb%83m%20K%c3%aa.doc にエンコードします。
問題 #1: その文字列の最初の文字: ả の値は ả です -- その数値を 16 進数にエンコードすると、%a3%1e が得られます。この男はどのようにして %e1%ba%a3 を手に入れたのですか? (ここでは明らかに単純なものが欠けています)
問題 #2: IE はこのエンコーディングを認識しますが、Firefox は認識しません! 何をすべきか?
python - Python スクリプトから POST を使用してファイルを送信する
これは、 Send file using POST from a Python scriptのほぼ複製ですが、注意点を追加したいと思います: フィールドと添付ファイルのエンコーディングを適切に処理するものが必要です。非ASCII文字を含むUnicode文字列をミックスに投入すると、私が見つけた解決策は爆発します。また、ほとんどのソリューションでは、7 ビットをクリーンに保つためにデータを base64 エンコードしません。
python - 英数字+「&」および「;」を含む正規表現を探しています
ここに問題があります:
この正規表現は、正規表現を処理する場合は問題なく機能しますが、のような単語を含む表現が必要になる場合がありますkäyttäj&aml;auml;
。
&
と;
文字を含めるには、正規表現に何を追加する必要がありますか?
mysql - UTF-8 でエンコードされたダンプを MySQL にロードする
私は昨日、この問題について数時間耳を傾けてきました。
エンコードが「UTF-8 Unicode (utf8)」に設定された MySQL 4.1.22 サーバー上のデータベースがあります (phpMyAdmin によって報告されています)。このデータベースのテーブルのデフォルトの文字セットはlatin2に設定されています。しかし、それを使ったWebアプリケーション(PHPで書かれたCMS Made Simple)はutf8でページを表示する...
これがどのように台無しにされたとしても、実際には機能します。Web アプリは文字を正しく表示します (主にチェコ語とポーランド語が使用されます)。
「mysqldump -u xxx -p -h yyy dbname > dump.sql」を実行します。これにより、次のような SQL スクリプトが得られます。
- UTF-8で表示すると、任意のエディター (Notepad+ など) で完璧に見えます- すべての文字が正しく表示されます
- スクリプト内のすべてのテーブルでは、デフォルトの文字セットがlatin2に設定されています
- 「/*!40101 SET NAMES latin2 */;」があります。最初の行(他の設定の中で)
ここで、このデータベースを MySQL 5.0.67 で実行されている別のサーバーにエクスポートしたいと考えています。サーバーのエンコードは「UTF-8 Unicode (utf8)」に設定されています。CMS Made Simple インストール全体をコピーし、dump.sql スクリプトをコピーして、「mysql -h ddd -u zzz -p dbname < dump.sql」を実行しました。その後、CMSMS Web ページを表示するときにすべての文字がスクランブルされます。
設定してみました:
SET character_set_client = utf8;
SET character_set_connection = latin2;
そして、すべての組み合わせ (私には意味がなくても念のため): latin2/utf8、latin2/latin2、utf8/utf8 など - 役に立ちません。すべての文字はまだスクランブルされていますが、場合によっては別の方法で:)。
また、スクリプト内のすべての latin2 設定を utf8 に置き換えてみました (テーブルの名前とデフォルトの文字セットを設定します)。何もない。
このエンコーディング全体が実際にどのように機能するかをほんの数語で説明できる MySQL の専門家がここにいますか? 9.1.4を読みました。接続文字セットと照合順序を調べましたが、そこには何も役に立ちませんでした。
ありがとう、マット
java - アプリケーション内の 1 つのタペストリー 4 ページに ISO-8859-1 エンコーディングを設定するが、そうでなければ完全に UTF-8 である
ページを UTF-8 として提供する Tapestry アプリケーションがあります。つまり、サーバーの応答には次のヘッダーがあります。
このアプリケーション内には、ISO-8859-1 エンコーディングで提供する必要がある単一のページがあります。つまり、サーバーの応答には次のヘッダーが必要です。
これを行う方法?アプリケーション全体のデフォルトのエンコーディングを変更したくありません。
Google検索に基づいて、次のことを試しました:
ただし、@Meta アノテーションを使用してこれらの値を設定することも、getOutputEncoding メソッドをオーバーライドすることもできません。
Tapestry 4.0.2 を使用しています。
編集:私は、サブクラス化された HttpServletResposeWrapper を持つサーブレットフィルターでこれを行うことになりました。ラッパーは setContentType() をオーバーライドして、応答に必要なエンコードを強制します。
html - Internet Explorer のフォーム送信での文字エンコードの設定
フォームを含むページがあります。このページは、コンテンツ タイプ text/html;charset=utf-8 で提供されます。ISO-8859-1 文字エンコーディングを使用して、このフォームをサーバーに送信する必要があります。これは Internet Explorer で可能ですか?
このように form 要素に accept-charset 属性を設定すると、Firefox や Opera などでは機能しますが、IE では機能しません。
編集: このフォームはサーバー A によって作成され、サーバー B に送信されます。サーバー B を制御することはできません。
文字セットISO-8859-1でコンテンツを提供するようにサーバーAを設定すると、すべてが機能しますが、サーバーAのエンコーディングを変更せずにこれを機能させる方法を探しています。サーバー A でのエンコーディングの設定について、別の質問があります。
windows - ファイルに dos2unix が必要なのはなぜですか? ただし、日食のみ
Eclipse でファイルを開くと、不適切な行間が表示され、すべての行の間に余分な改行が表示されます。メモ帳またはワードパッドでファイルを開くと、Eclipse のみが表示するこれらの余分な改行は表示されません。これらの改行なしでメモ帳やワードパッドのようなこれらのファイルをEclipseに読み取らせるにはどうすればよいですか?
-編集:すべてのファイルでこの問題が発生するわけではありませんが、ローカルで変更を加えた一部のファイルのみを選択し、それらをサンステーションにアップロードし、それらのファイルを将来の変更のためにローカルワークステーションにプルしました。
excel - Microsoft Excel は .csv ファイルの分音記号をマングルしますか?
プログラムで (PHP 5.2 を使用して) データを .csv テスト ファイルにエクスポートしています。
データの例: Numéro 1
(アクセント付きの e に注意してください)。データはutf-8
(先頭に BOM なし) です。
このファイルを MS Excel で開くと、次のように表示されNuméro 1
ます。
これを正しく表示するテキスト エディター (UltraEdit) で開くことができます。UE は、キャラクターが であると報告しますdecimal 233
。
できればインポート ウィザードやデフォルト以外のウィザード設定を強制的に使用せずに、MS Excel がテキスト データを正しくレンダリングできるように、テキストデータを .csv ファイルにエクスポートするにはどうすればよいですか?