問題タブ [byte-order-mark]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1995 参照

php - ダウンロード後に PHP ファイルを読み取れない

こんにちは、ファイルを作成してサーバーに保存するスクリプトがあります。このファイルは UTF-8 でエンコードされており、cmap ソフトウェア用の一種の xml ファイルです。

サーバーから直接ファイルを開くと、問題はなく、ファイルを読み取ることができます。

ユーザーが特定の URL にアクセスしたときに、このファイルのダウンロードを強制しています。このようなダウンロードの後、ファイルは cmap ソフトウェアで読み取ることができません。テキスト エディタ (notepad++) でエンコーディングを UTF-8 から BOM なしの UTF-8 に変更する必要があります。

間違ったヘッダーを送信していますか? ファイルをダウンロードしているときにphpはファイルに何かをしていますか?

これに関するアドバイスをいただければ幸いです。

チアーズ・ドリュー

編集

申し訳ありませんが、いくつかの異なるクラスに関連する多くのコードがあります。ファイルをブラウザに送信するために使用しているコードを含めました。

(XMLWriter を使用して) xml を生成するコードが必要な場合は、それも投稿できます。

編集

ここで要求されているのは、xml が生成されているコードです。これは別のクラスにあります。

0 投票する
1 に答える
6646 参照

python - Ascii ファイルの Python BOM エラー

Python 2.6 で奇妙で厄介な問題が発生しました。Embedded Linux ARM ボードで、このファイル (およびその他のファイル) を実行しようとしています。 http://svn.tuxisalive.com/software_suite_v3/smart-core/smart-server/trunk/TDSService.py

次のエラーが表示されます。

ファイル "tuxhttpserver.py"、1 行目の SyntaxError: エンコードの問題: BOM あり

エラーはBOMバイトなどに関するものであることは知っていますが、BOMバイトはありません。プレーンなAsciiです。Hexeditor で確認したところ、Linux の File コマンドで Ascii と表示されました。

私はここでおかしくなりました...コードは私のSheevaplug(ARMベースのシステムでもあります)でうまくいきました。

0 投票する
1 に答える
12639 参照

eclipse - Eclipseでのutf-8ファイルの操作

非常に率直な質問です。BOMの有無にかかわらずutf-8でエンコードされたテキストファイルを処理するようにEclipseを構成する方法はありますか?

これまで、utf-8エンコーディングでEclipseを使用してきましたが、BOMを含む別のエディターで生成されたファイルを編集しようとすると、Eclipseが適切に処理せず、「非表示の文字が表示されます」ファイルの先頭(BOM)。EclipseにBOMを使用してutf-8でエンコードされたファイルを認識させる方法はありますか?

0 投票する
2 に答える
1302 参照

php - mootoolsxmlhttprequestへのphp応答のUTF-8BOM

私は最初の小さなAJAX対応のJoomlaコンポーネントを書いています。私はmootoolsを使用しています。Joomlaコンポーネントに接続するためのxmlhttprequestを取得しましたが、コンポーネントは応答を返します-phpによってエコーされたプレーンテキストのように

応答がクライアント側のjavascriptによって読み取られるときに、応答の前に\ 357 \ 273 \ 277 \ 357 \ 273 \ 277が付加されるとwiresharkが指示することを除いて、すべて正常に機能しています。これは、スクリプトが表示するアラートボックスの応答の前に、小さな四角で表示されます。

xmlhttprequestでエンコーディングを明示的に設定していません。mootoolsのドキュメントによると、デフォルトではUTF8になっています。

これを処理する正しい方法は何ですか?リクエストに応じてエンコーディングを設定する必要がありますか?MIMEタイプ?javascriptはそれを取り除くべきですか?応答にUTF8を必要とする文字を含める予定はないので、プレーンな古いASCIIを使用しても問題ありません。

ありがとう

0 投票する
5 に答える
12891 参照

c# - XmlReader が UTF-8 BOM で壊れる

アプリケーションに次の XML 解析コードがあります。

カスタム逆シリアル化のために、WCF サービスに送信された文字列を XML ドキュメントに解析するために使用しています。

ファイルを読み込んでネットワーク経由で送信すると(リクエスト)、正常に動作します。BOM が送信されていないことを確認しました。私のリクエスト ハンドラでは、レスポンス オブジェクトをシリアル化し、文字列として送り返しています。シリアライゼーション プロセスでは、文字列の前に UTF-8 BOM が追加されるため、応答を解析するときに同じコードが壊れます。

この 1 時間ほどで行った調査では、XmlReader は BOM を尊重する必要があるようです。文字列の先頭から BOM を手動で削除すると、応答 xml は正常に解析されます。

明らかな何か、または少なくとも陰湿な何かが欠けていますか?

編集:応答を返すために使用しているシリアル化コードは次のとおりです。

BOM が正しく含まれていない xml の問題である場合は、次のように切り替えます。

しかし、私の調査では、BOM が実際の XML 文字列で違法であることはまったく明らかではありませんでした。たとえば、c# Byte Array から xml エンコーディングを検出しますか? を参照してください。

0 投票する
2 に答える
801 参照

c++ - ツールチェーンにカスタム ツールを追加して、コンパイル前に UTF-8 BOM を削除する

私の質問は、 Code::Blocks とその微調整バージョンの MinGW、および Notepad++ のコンテキストにあります。

UTF-8 を使用し、BOM を使用しない限り、ソースに Unicode リテラルを含めることができるようにしたいと考えています。

これはある程度までは問題なく動作しますが、ファイルを再度開くたびに BOM アウト (悪い駄洒落) になります。これには (当然のことながら) Unicode を ANSI 形式で表示するという神経質な副作用があります。:(

これらの非常に便利でありながら非常に煩わしい 3 バイトがそこにある必要があり、それからそれらを削除する必要があります。(コンパイル時)。

ソースファイルを前処理し、最初の 3 バイトを破棄するだけです (UTF-8 BOM の場合)...

コンパイルするたびに (手動で削除することによって) プロセッサになるつもりはないので、これらのリテラルには BOM なしの #include ファイルを使用することにしましたが、これはいくつかの観点から問題があります。それはことわざの苦痛であり、私はそれらを「見る」ことができないということです! ..多くのジャグリングなしで。

カスタム プリプロセッサを使用してツールチェーンを利用する方法はありますか? ...または、明らかな解決策を見逃している場合は、それについて聞いていただければ幸いです。

0 投票する
7 に答える
47738 参照

utf-8 - BOM を UTF-8 ファイルに追加する

バッチ ファイルとして機能し、UTF-8 テキスト ファイルに BOM がない場合は BOM を先頭に追加できるスクリプトを (成功せずに) 検索しています。

それが書かれている言語 (perl、python、c、bash) も、動作する OS も、私には関係ありません。さまざまなコンピュータにアクセスできます。

多くの Windows プログラムでは、BOM がないと UTF-8 テキスト ファイルを読み取るのに問題があるため、逆の処理 (BOM を削除する) を行うスクリプトを多数見つけました。

明らかなことを見逃しましたか?

ありがとう!

0 投票する
4 に答える
10567 参照

php - エンコーディングの問題

PHP を使用して Web サイトを開発していますが、これらの奇妙な文字 "" がページの上部に表示されます。私のコードはこれです:

しかし、ブラウザでソース コードを見ると、次のように表示されます。

使用しているエンコーディングと関係があるかどうかはわかりません。文字セットを変更するcharset=utf-8と消えますが、iso-8859-1 を使用する必要があるためです。

0 投票する
23 に答える
224965 参照

php - ファイルの先頭からを削除するにはどうすればよいですか?

geditを使用して開くと見栄えのするCSSファイルがありますが、PHPで読み取ると(すべてのCSSファイルを1つにマージするため)、このCSSには次の文字が付加されます。

PHPはすべての空白を削除するため、コードの途中にあるランダムなが全体を台無しにします。前述したように、geditでファイルを開いたときにこれらの文字が実際に表示されないため、簡単に削除できません。

私は問題をグーグルで検索しましたが、ファイルエンコーディングに明らかに問題があります。これは、さまざまなテキストエディタを使用してftpおよびrsyncを介してファイルを別のLinux/Windowsサーバーに移動しているためです。しかし、私は文字エンコードについてあまりよく知らないので、助けていただければ幸いです。

それが役立つ場合、ファイルはUTF-8形式で保存されており、geditではISO-8859-15形式で保存できません(ドキュメントには、指定された文字エンコードを使用してエンコードできない1つ以上の文字が含まれています)。WindowsとLinuxの行末で保存しようとしましたが、どちらも役に立ちませんでした。

0 投票する
1 に答える
545 参照

xml - SSRS XML エクスポート - BOM の削除

SSRS を使用して、XSLT を使用して XML ファイルを生成します。XML ファイルが「EF BB BF」という文字で始まることを除いて、すべて問題ありません。これを取り除く必要があります。それなしで XML ファイルを生成するにはどうすればよいですか?