問題タブ [mojibake]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
151 参照

character-encoding - TinyMCE メニューバーのアイコンがゴミ・文字化けする

tinymce の新しいコピーをダウンロードしてアップロードし、UTF-8 でエンコードされた Web サイトで使用しようとしました。

メニュー バーのアイコンは、プレゼンテーション ファイル (フォント?) が見つからないためにゴミであるか、10000 個のファイルの 1 つのエンコーディングが間違っています。

このバグを知っている人はいますか?私は何も変更せず、アップロードしただけです..

ここに画像の説明を入力

もちろん、TinyMCE は私のドイツ語の lang ファイルも使用しません。jsファイルを「langs」フォルダーに配置しました。

パス、ベースパスなどの構成を設定する必要がありますか??

tinymce への実際のパスはscripts/tinymce/tinymce.min.js. 出荷されたパッケージによって提供された元のパスはtinymce/tinymce/js/tinymce/tinymce.min.js、正直なところ、この種のネストされたフォルダーであり、理由はありません..

更新:パスは機能しており、直接リンクされていないファイル (theme.min.js など) を正常に読み取ります。

0 投票する
1 に答える
198 参照

python - PythonでUnicodeタイプのオブジェクトをファイルに書き込む

Python で Unicode 文字列をファイルに書き込もうとしていますが、Linux の「cat」または「less」を使用してファイルを読み取ると、正しい文字が書き込まれず、代わりにゴミとして表示されます。

Oracle データベースからオブジェクトを読み取っています。タイプを出力すると(aはデータベース結果の行です):

それは出力します:

次のように書き込み用にファイルを開きます。

そして、次のようにファイルに行を書き込みます。

しかし、出力ファイルを読むと、正しくアクセント付きの文字が表示されず、代わりにゴミが表示されます:

PythonでUnicode文字列オブジェクトをファイルに正しく書き込むにはどうすればよいですか?

0 投票する
1 に答える
147 参照

mysql - エンコーディングを識別して文字を変換する

時折、中国の顧客が私のサイトで注文を出し、名前と住所の情報が、私が識別または翻訳できない一連の文字で MySQL データベースに書き込まれることがあります。

たとえば、最近の顧客の発送先都市は次のように表示されます。

·s\_\«ªo¾ô°Ï

データベース自体、および顧客情報を保持するフィールドが utf8_general_ci 照合に設定されていることは確かです。Web サイト自体のヘッダーには、次のコンテンツ タイプ宣言が含まれていました。

しかし、これはここ数週間でコメントアウトされました。私は、一部の中国の注文情報がそのような文字で保存されている理由を発見しようとしていると信じています. コメントアウトされる前は、上記と同じ情報が次のように表示されます。

�s�_���o����

これらの形式のいずれかのテキスト ブロックを、DHL または別の配送サービスが使用できる読み取り可能な形式に変換するために使用できるオンライン ユーティリティはありますか? また、将来、情報がそのように保存されるのを確実に防ぐにはどうすればよいでしょうか?

0 投票する
1 に答える
3253 参照

python - Unbaking mojibake

When you have incorrectly decoded characters, how can you identify likely candidates for the original string?

I know for a fact that this image filename should have been some Japanese characters. But with various guesses at urllib quoting/unquoting, encode and decode iso8859-1, utf8, I haven't been able to unmunge and get the original filename.

Is the corruption reversible?

0 投票する
1 に答える
521 参照

xml - 改ざんされた文字 - XML からのポンド記号

XML フィードから £ 記号を抽出しようとしています (完全版はこちら > http://mjsiphone.com/scotjobsnet/ )

ミニバージョンはこちら > http://scotjobsnet.co.uk.ni.strategiesuk.net/testfeed.xml

フィードのソースやソース サーバー、フィードのフォーマット方法、使用するヘッダーなどを制御することはできません。

データを抽出して独自のサイト データベースに保存する .NET 4.5 コンソール アプリケーションを作成するだけです。

また、すべての HTML を (ジョブの説明から) 削除し、HTML エンコードされた文字をすべて削除して、実際の値に置き換える必要があります。

したがって、MS SQL 2008 DB では、£20,000 や £20,000 などではなく、実際の £ 記号を nvarchar データ型で保存する必要があります。

フィードのソースを表示すると、先頭に UTF-8 があります。

ただし、ブラウザのソースでフィードを表示すると、要求/応答ヘッダーとして UTF-8 についての言及は見られず、要求ヘッダー (Chrome) には次のようにしか表示されません。

Accept-Language:en-GB、en-US;q=0.8、en;q=0.6

ブラウザまたはコンソールから SQL に文字をコピー アンド ペーストしてチェックすると、正しい ASCII 文字エンコーディングである 163 が返されます。

ブラウザでフィードを表示すると、ポンド記号は問題なく表示されます。

コンテンツを Windows コマンド コンソールにパイプするだけで、£ 記号として問題なく表示されます。

ただし、それらをDBに保存するか、コンソールデバッグをEditPlusのファイルにパイプアウトしようとすると(文字エンコーディングがUTF8またはASCIIに設定されています)、CMDなどの記号の代わりに数字の前に四角が表示されます

[.exe へのパス] > [debug.log ファイルへのパス]

コンソールがコンテンツをエディターに正しくパイプできないか、正しいエンコーディングを使用するか、より多くのヘッダーを渡すか、XML を別の方法で抽出する必要があります。

これをテストするために使用しているコードの例を次に示します。これは、£ 記号を使用するフィールドを 1 つだけ使用してブレークします。

どんな助けでも大歓迎です。

渡す必要があるのは単なるヘッダーであるか、XML コンテンツをエディターに出力する際の問題であると確信しています。

Windows コンソールで出力を表示する前に述べたように、£ は問題なく表示されます。

ありがとう

0 投票する
1 に答える
66 参照

mysql - JSF2.0: primefaces4.0 のモジバケ

文字化け問題

[netbeans を使用 - jsf 2.2 - primefaces 4.0 - Mysql データベース]

私は JSF アプリケーションでアラビア語を使用していますが、残念ながらアラビア語の値はこのような他の文字としてサーバーに送信され (بÙÙØ³ ÙØ¨ ) (デバッガーによって表示される)、このようにデータベースに保存されます。

プロジェクトは最初はうまく機能しますが、プロジェクトで他のタスクを実行した後、この問題が発生しますが、問題の原因はわかりません

次の解決策は実行されましたが、効果はありません

すべての jsf ページ (.xhtml ページ) で次の行を使用します。

次のフィルタを使用します

また、私は自分の書いたフィルターを試します

私はこのようなフォームを使用します

誰でも私を助けることができます

0 投票する
1 に答える
1659 参照

python - utf-8 での文字のエンコードの問題

を介して美しいスープ ライブラリを使用して、Web ページからリンクを取得しますa.get('href')。リンク先に変な文字®がありますが、手に入れたら になりまし®た。どうすれば正しくエンコードできますか?私はすでにページの先頭に追加しました# -*- coding: utf-8 -*-

0 投票する
2 に答える
457 参照

python - Pythonでutf-8文字列を数字で分割する方法は?

生のutf-8文字列を取得しました:

そして、それを文字列に変換します

その数字の 1 を残りの文字列と分けたいと思います。

それから私は試しました:

私が思っていたものではありません。

最後に輝きが頭に浮かびました。

しかし、問題は、他のそのような組み合わせの utf-8 コードが '\xe6' で始まることを保証できないため、数値を任意の utf-8 コードと区別して分割する方法が必要なことです。

それは可能ですか?

0 投票する
2 に答える
958 参照

python - Python Codecs パッケージがバイトをデコードできない

Python 2.7.3 と BeuatofulSoup を使用して Web サイトのテーブルからデータを取得し、codecsコンテンツをファイルに書き込むために使用しています。私が収集する変数の 1 つに、時々文字化けがあります。たとえば、Web サイトのテーブルが次のようになっているとします。

したがって、City変数を生成するときは、常に次のようにエンコードしますutf-8

私が作成したカンマ区切りの文字列のリストの内容が呼び出されRowDataRowHeadersこのように見えるように

次に、次のコードを使用してこれをファイルに書き込もうとします

次のエラーが表示されます

私は csv ライター パッケージを使用でき、RowsData正常に動作します。入りたくない理由により、コーデックを使用して csv ファイルを出力する必要があります。何が起こっているのかわかりません。誰でもこの問題を解決するのを手伝ってもらえますか? 前もって感謝します。