問題タブ [mojibake]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
character-encoding - TinyMCE メニューバーのアイコンがゴミ・文字化けする
tinymce の新しいコピーをダウンロードしてアップロードし、UTF-8 でエンコードされた Web サイトで使用しようとしました。
メニュー バーのアイコンは、プレゼンテーション ファイル (フォント?) が見つからないためにゴミであるか、10000 個のファイルの 1 つのエンコーディングが間違っています。
このバグを知っている人はいますか?私は何も変更せず、アップロードしただけです..
もちろん、TinyMCE は私のドイツ語の lang ファイルも使用しません。jsファイルを「langs」フォルダーに配置しました。
パス、ベースパスなどの構成を設定する必要がありますか??
tinymce への実際のパスはscripts/tinymce/tinymce.min.js
. 出荷されたパッケージによって提供された元のパスはtinymce/tinymce/js/tinymce/tinymce.min.js
、正直なところ、この種のネストされたフォルダーであり、理由はありません..
更新:パスは機能しており、直接リンクされていないファイル (theme.min.js など) を正常に読み取ります。
python - PythonでUnicodeタイプのオブジェクトをファイルに書き込む
Python で Unicode 文字列をファイルに書き込もうとしていますが、Linux の「cat」または「less」を使用してファイルを読み取ると、正しい文字が書き込まれず、代わりにゴミとして表示されます。
Oracle データベースからオブジェクトを読み取っています。タイプを出力すると(aはデータベース結果の行です):
それは出力します:
次のように書き込み用にファイルを開きます。
そして、次のようにファイルに行を書き込みます。
しかし、出力ファイルを読むと、正しくアクセント付きの文字が表示されず、代わりにゴミが表示されます:
PythonでUnicode文字列オブジェクトをファイルに正しく書き込むにはどうすればよいですか?
mysql - エンコーディングを識別して文字を変換する
時折、中国の顧客が私のサイトで注文を出し、名前と住所の情報が、私が識別または翻訳できない一連の文字で MySQL データベースに書き込まれることがあります。
たとえば、最近の顧客の発送先都市は次のように表示されます。
·s\_\«ªo¾ô°Ï
データベース自体、および顧客情報を保持するフィールドが utf8_general_ci 照合に設定されていることは確かです。Web サイト自体のヘッダーには、次のコンテンツ タイプ宣言が含まれていました。
しかし、これはここ数週間でコメントアウトされました。私は、一部の中国の注文情報がそのような文字で保存されている理由を発見しようとしていると信じています. コメントアウトされる前は、上記と同じ情報が次のように表示されます。
�s�_���o����
これらの形式のいずれかのテキスト ブロックを、DHL または別の配送サービスが使用できる読み取り可能な形式に変換するために使用できるオンライン ユーティリティはありますか? また、将来、情報がそのように保存されるのを確実に防ぐにはどうすればよいでしょうか?
python - Unbaking mojibake
When you have incorrectly decoded characters, how can you identify likely candidates for the original string?
I know for a fact that this image filename should have been some Japanese characters. But with various guesses at urllib quoting/unquoting, encode and decode iso8859-1, utf8, I haven't been able to unmunge and get the original filename.
Is the corruption reversible?
xml - 改ざんされた文字 - XML からのポンド記号
XML フィードから £ 記号を抽出しようとしています (完全版はこちら > http://mjsiphone.com/scotjobsnet/ )
ミニバージョンはこちら > http://scotjobsnet.co.uk.ni.strategiesuk.net/testfeed.xml
フィードのソースやソース サーバー、フィードのフォーマット方法、使用するヘッダーなどを制御することはできません。
データを抽出して独自のサイト データベースに保存する .NET 4.5 コンソール アプリケーションを作成するだけです。
また、すべての HTML を (ジョブの説明から) 削除し、HTML エンコードされた文字をすべて削除して、実際の値に置き換える必要があります。
したがって、MS SQL 2008 DB では、£20,000 や £20,000 などではなく、実際の £ 記号を nvarchar データ型で保存する必要があります。
フィードのソースを表示すると、先頭に UTF-8 があります。
ただし、ブラウザのソースでフィードを表示すると、要求/応答ヘッダーとして UTF-8 についての言及は見られず、要求ヘッダー (Chrome) には次のようにしか表示されません。
Accept-Language:en-GB、en-US;q=0.8、en;q=0.6
ブラウザまたはコンソールから SQL に文字をコピー アンド ペーストしてチェックすると、正しい ASCII 文字エンコーディングである 163 が返されます。
ブラウザでフィードを表示すると、ポンド記号は問題なく表示されます。
コンテンツを Windows コマンド コンソールにパイプするだけで、£ 記号として問題なく表示されます。
ただし、それらをDBに保存するか、コンソールデバッグをEditPlusのファイルにパイプアウトしようとすると(文字エンコーディングがUTF8またはASCIIに設定されています)、CMDなどの記号の代わりに数字の前に四角が表示されます
[.exe へのパス] > [debug.log ファイルへのパス]
コンソールがコンテンツをエディターに正しくパイプできないか、正しいエンコーディングを使用するか、より多くのヘッダーを渡すか、XML を別の方法で抽出する必要があります。
これをテストするために使用しているコードの例を次に示します。これは、£ 記号を使用するフィールドを 1 つだけ使用してブレークします。
どんな助けでも大歓迎です。
渡す必要があるのは単なるヘッダーであるか、XML コンテンツをエディターに出力する際の問題であると確信しています。
Windows コンソールで出力を表示する前に述べたように、£ は問題なく表示されます。
ありがとう
mysql - JSF2.0: primefaces4.0 のモジバケ
文字化け問題
[netbeans を使用 - jsf 2.2 - primefaces 4.0 - Mysql データベース]
私は JSF アプリケーションでアラビア語を使用していますが、残念ながらアラビア語の値はこのような他の文字としてサーバーに送信され (بÙÙØ³ ÙØ¨ ) (デバッガーによって表示される)、このようにデータベースに保存されます。
プロジェクトは最初はうまく機能しますが、プロジェクトで他のタスクを実行した後、この問題が発生しますが、問題の原因はわかりません
次の解決策は実行されましたが、効果はありません
すべての jsf ページ (.xhtml ページ) で次の行を使用します。
次のフィルタを使用します
また、私は自分の書いたフィルターを試します
私はこのようなフォームを使用します
誰でも私を助けることができます
python - utf-8 での文字のエンコードの問題
を介して美しいスープ ライブラリを使用して、Web ページからリンクを取得しますa.get('href')
。リンク先に変な文字®
がありますが、手に入れたら になりまし®
た。どうすれば正しくエンコードできますか?私はすでにページの先頭に追加しました# -*- coding: utf-8 -*-
python - Pythonでutf-8文字列を数字で分割する方法は?
生のutf-8文字列を取得しました:
そして、それを文字列に変換します
その数字の 1 を残りの文字列と分けたいと思います。
それから私は試しました:
私が思っていたものではありません。
最後に輝きが頭に浮かびました。
しかし、問題は、他のそのような組み合わせの utf-8 コードが '\xe6' で始まることを保証できないため、数値を任意の utf-8 コードと区別して分割する方法が必要なことです。
それは可能ですか?
python - Python Codecs パッケージがバイトをデコードできない
Python 2.7.3 と BeuatofulSoup を使用して Web サイトのテーブルからデータを取得し、codecs
コンテンツをファイルに書き込むために使用しています。私が収集する変数の 1 つに、時々文字化けがあります。たとえば、Web サイトのテーブルが次のようになっているとします。
したがって、City
変数を生成するときは、常に次のようにエンコードしますutf-8
。
私が作成したカンマ区切りの文字列のリストの内容が呼び出されRowData
、RowHeaders
このように見えるように
次に、次のコードを使用してこれをファイルに書き込もうとします
次のエラーが表示されます
私は csv ライター パッケージを使用でき、RowsData
正常に動作します。入りたくない理由により、コーデックを使用して csv ファイルを出力する必要があります。何が起こっているのかわかりません。誰でもこの問題を解決するのを手伝ってもらえますか? 前もって感謝します。