問題タブ [byte-order-mark]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
9716 参照

python - PythonでのUTF-8番号の処理

3つのコンマ区切りの数字を含むファイルを読んでいると仮定します。ファイルは不明なエンコーディングで保存されましたが、これまでのところ、ANSIとUTF-8を扱っています。ファイルがUTF-8にあり、値が115,113,12の1行である場合、次のようになります。

これを投げるだろう:

最初の数字は常にこれらの'\xef \ xbb\xbf'文字でマングルされます。残りの2つの数値については、変換は正常に機能します。'\ xef \ xbb \ xbf'を''に手動で置き換えてから、int変換を実行すると、機能します。

エンコードされたファイルのタイプに対してこれを行うためのより良い方法はありますか?

0 投票する
10 に答える
86779 参照

vb.net - バイト オーダー マーク (BOM) なしでテキスト ファイルを書き込みますか?

BOM なしで、UTF8 エンコーディングの VB.Net を使用してテキスト ファイルを作成しようとしています。誰でも私を助けることができますか、これを行う方法は?
UTF8エンコーディングでファイルを書き込むことはできますが、バイトオーダーマークを削除するにはどうすればよいですか?

edit1: このようなコードを試しました。

1.html は UTF8 エンコーディングのみで作成され、2.html は ANSI エンコーディング形式で作成されます。

単純化されたアプローチ - http://whatilearnttuday.blogspot.com/2011/10/write-text-files-without-byte-order.html

0 投票する
4 に答える
18819 参照

python - BOM 付きの UTF-8 HTML および CSS ファイル (および Python で BOM を削除する方法)

まず、いくつかの背景: Python を使用して Web アプリケーションを開発しています。すべての (テキスト) ファイルは現在、BOM 付きの UTF-8 で保存されています。これには、すべての HTML テンプレートと CSS ファイルが含まれます。これらのリソースは、DB にバイナリ データ (BOM とすべて) として保存されます。

DB からテンプレートを取得するときは、 を使用してそれらをデコードしますtemplate.decode('utf-8')。HTML がブラウザーに到着すると、HTTP 応答本文の先頭に BOM が表示されます。これにより、Chrome で非常に興味深いエラーが生成されます。

Extra <html> encountered. Migrating attributes back to the original <html> element and ignoring the tag.

Chrome<html>は、BOM を見てコンテンツと間違えると、タグを自動的に生成するようで、実際の<html>タグをエラーにします。

では、Python を使用して、UTF-8 でエンコードされたテンプレートから BOM を削除する最良の方法は何ですか (存在する場合、将来これを保証することはできません)。

CSS のような他のテキストベースのファイルの場合、主要なブラウザーは BOM を正しく解釈 (または無視) しますか? それらは、.xml のないプレーン バイナリ データとして送信されます.decode('utf-8')

注: Python 2.5 を使用しています。

ありがとう!

0 投票する
1 に答える
65417 参照

c# - BOM なしのテキスト ファイルの作成

私は成功せずにこのアプローチを試みました

私が使用しているコード:

結果:

ここに画像の説明を入力

何があってもBOMを書き込んでおり、特殊文字(Æ Ø Åなど)は正しくありません: - /

私は立ち往生しています!

私の目的は、エンコーディングとしてUTF-8、CharSetとして8859-1を使用してファイルを作成することです

これを達成するのはとても難しいですか、それとも私はただ悪い日を迎えているだけですか?

すべてのヘルプは大歓迎です、ありがとう!

0 投票する
1 に答える
2636 参照

java - java: BOM なしで文字列をバイト配列に変換できますか?

次のコードがあるとします。

メッセージにバイト配列を表示すると、結果は次のようになります。

ご覧のとおり、最初に BOM があります。

どうやって:

  1. 文字列から BOM のない UTF-16 バイト配列を生成しますか?
  2. UTF-16 文字を含むが BOM がないバイト配列から文字列に変換しますか?
0 投票する
4 に答える
6186 参照

postgresql - psqlを介してSQLスクリプトを実行すると、PgAdminでは発生しない構文エラーが発生します

テーブルを作成するための次のスクリプトがあります。

PgAdminのクエリツールで正常に実行されます。しかし、psqlを使用してコマンドラインから実行しようとすると、次のようになります。

以下に示すような構文エラーが発生します。

pgAdminではなくpsqlを使用して構文エラーが発生するのはなぜですか?

0 投票する
8 に答える
52718 参照

php - PHP ファイルの UTF-8 BOM 署名

0 投票する
2 に答える
3949 参照

php - PHP ストリーミング CSV は常に UTF-8 BOM を追加します

次のコードは、「レポート行」を配列として取得し、fputcsv を使用して CSV に変換します。私が使用する文字セットに関係なく、ファイルの先頭に UTF-8 bom を配置しているという事実を除いて、すべてがうまく機能しています。A) 私は iso を指定しており、B) 多くのユーザーが UTF-8 bom をガベージ文字として表示するツールを使用しています。

結果を文字列に書き込んで、UTF-8 BOM を削除してから、それをエコーアウトして取得しようとしました。問題が Apache にある可能性はありますか? fopen をローカル ファイルに変更すると、UTF-8 BOM なしで問題なく書き込みます。

0 投票する
3 に答える
6310 参照

objective-c - BOM 付きの UTF-8 文字列を作成する

MD5 関数と Base64 エンコーディングを使用してユーザー シークレットを生成しています (使用される API のデータ レイヤーにログインするために使用されます)。

私はJavaScriptでコードを作成しましたが、それは問題ありませんが、Objective CではBOMに苦労しています

私のコードは次のとおりです。

上記のコードを使用して、メモリに入ります:

代替テキスト
(ソース: balexandre.com )

魔女は私が本当に必要としているものではない...

私も試してみました

運悪く…

usingUTF8Stringは、C# のように BOM を自動的に追加する継ぎ目はありません :-(

BOM を正しく追加するにはどうすればよいですか?

0 投票する
2 に答える
1242 参照

saxparser - saxparserはバイトオーダーマークを無視します

私たちのsaxparserは、ファイルの先頭に表示されるバイト順マークを無視しません

saxパーサーにバイト順マークを無視させるにはどうすればよいですか?