問題タブ [byte-order-mark]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PythonでのUTF-8番号の処理
3つのコンマ区切りの数字を含むファイルを読んでいると仮定します。ファイルは不明なエンコーディングで保存されましたが、これまでのところ、ANSIとUTF-8を扱っています。ファイルがUTF-8にあり、値が115,113,12の1行である場合、次のようになります。
これを投げるだろう:
最初の数字は常にこれらの'\xef \ xbb\xbf'文字でマングルされます。残りの2つの数値については、変換は正常に機能します。'\ xef \ xbb \ xbf'を''に手動で置き換えてから、int変換を実行すると、機能します。
エンコードされたファイルのタイプに対してこれを行うためのより良い方法はありますか?
vb.net - バイト オーダー マーク (BOM) なしでテキスト ファイルを書き込みますか?
BOM なしで、UTF8 エンコーディングの VB.Net を使用してテキスト ファイルを作成しようとしています。誰でも私を助けることができますか、これを行う方法は?
UTF8エンコーディングでファイルを書き込むことはできますが、バイトオーダーマークを削除するにはどうすればよいですか?
edit1: このようなコードを試しました。
1.html は UTF8 エンコーディングのみで作成され、2.html は ANSI エンコーディング形式で作成されます。
単純化されたアプローチ - http://whatilearnttuday.blogspot.com/2011/10/write-text-files-without-byte-order.html
python - BOM 付きの UTF-8 HTML および CSS ファイル (および Python で BOM を削除する方法)
まず、いくつかの背景: Python を使用して Web アプリケーションを開発しています。すべての (テキスト) ファイルは現在、BOM 付きの UTF-8 で保存されています。これには、すべての HTML テンプレートと CSS ファイルが含まれます。これらのリソースは、DB にバイナリ データ (BOM とすべて) として保存されます。
DB からテンプレートを取得するときは、 を使用してそれらをデコードしますtemplate.decode('utf-8')
。HTML がブラウザーに到着すると、HTTP 応答本文の先頭に BOM が表示されます。これにより、Chrome で非常に興味深いエラーが生成されます。
Extra <html> encountered. Migrating attributes back to the original <html> element and ignoring the tag.
Chrome<html>
は、BOM を見てコンテンツと間違えると、タグを自動的に生成するようで、実際の<html>
タグをエラーにします。
では、Python を使用して、UTF-8 でエンコードされたテンプレートから BOM を削除する最良の方法は何ですか (存在する場合、将来これを保証することはできません)。
CSS のような他のテキストベースのファイルの場合、主要なブラウザーは BOM を正しく解釈 (または無視) しますか? それらは、.xml のないプレーン バイナリ データとして送信されます.decode('utf-8')
。
注: Python 2.5 を使用しています。
ありがとう!
java - java: BOM なしで文字列をバイト配列に変換できますか?
次のコードがあるとします。
メッセージにバイト配列を表示すると、結果は次のようになります。
ご覧のとおり、最初に BOM があります。
どうやって:
- 文字列から BOM のない UTF-16 バイト配列を生成しますか?
- UTF-16 文字を含むが BOM がないバイト配列から文字列に変換しますか?
postgresql - psqlを介してSQLスクリプトを実行すると、PgAdminでは発生しない構文エラーが発生します
テーブルを作成するための次のスクリプトがあります。
PgAdminのクエリツールで正常に実行されます。しかし、psqlを使用してコマンドラインから実行しようとすると、次のようになります。
以下に示すような構文エラーが発生します。
pgAdminではなくpsqlを使用して構文エラーが発生するのはなぜですか?
php - PHP ストリーミング CSV は常に UTF-8 BOM を追加します
次のコードは、「レポート行」を配列として取得し、fputcsv を使用して CSV に変換します。私が使用する文字セットに関係なく、ファイルの先頭に UTF-8 bom を配置しているという事実を除いて、すべてがうまく機能しています。A) 私は iso を指定しており、B) 多くのユーザーが UTF-8 bom をガベージ文字として表示するツールを使用しています。
結果を文字列に書き込んで、UTF-8 BOM を削除してから、それをエコーアウトして取得しようとしました。問題が Apache にある可能性はありますか? fopen をローカル ファイルに変更すると、UTF-8 BOM なしで問題なく書き込みます。
objective-c - BOM 付きの UTF-8 文字列を作成する
MD5 関数と Base64 エンコーディングを使用してユーザー シークレットを生成しています (使用される API のデータ レイヤーにログインするために使用されます)。
私はJavaScriptでコードを作成しましたが、それは問題ありませんが、Objective CではBOMに苦労しています
私のコードは次のとおりです。
上記のコードを使用して、メモリに入ります:
(ソース: balexandre.com )
魔女は私が本当に必要としているものではない...
私も試してみました
運悪く…
usingUTF8String
は、C# のように BOM を自動的に追加する継ぎ目はありません :-(
BOM を正しく追加するにはどうすればよいですか?
saxparser - saxparserはバイトオーダーマークを無視します
私たちのsaxparserは、ファイルの先頭に表示されるバイト順マークを無視しません
。
saxパーサーにバイト順マークを無視させるにはどうすればよいですか?