問題タブ [character-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
character-encoding - yamlファイルで文字エンコードを設定する方法
新しいRails2.2i18nシステムの単純なバックエンドを使用しており、yamlファイルでエンコーディングを設定するための適切な構文を知りたいと思いました。
言い換えれば、このxmlのyamlは何ですか?
java - Java アプリ: iso-8859-1 でエンコードされたファイルを正しく読み取ることができません
iso-8859-1 としてエンコードされ、ô などの文字を含むファイルがあります。
次のようなJavaコードでこのファイルを読んでいます:
ただし、ô 文字は常に文字化けし、通常は ? として出力されます。.
私はこの件について読みました(そして途中で少し学びました)。
- http://www.joelonsoftware.com/articles/Unicode.html
- http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=4508058
- http://www.ingrid.org/java/i18n/utf-16/
しかし、まだこれを機能させることはできません
興味深いことに、これはローカル PC (xp) では機能しますが、Linux ボックスでは機能しません。
次を使用して、jdkが必要な文字セットをサポートしていることを確認しました(これらは標準であるため、これは驚くことではありません)。
java - Java:ストリームの正しい文字セットエンコーディングを決定する方法
次のスレッドを参照してください 。Javaアプリ:iso-8859-1でエンコードされたファイルを正しく読み取ることができません
入力ストリーム/ファイルの正しい文字セットエンコーディングをプログラムで決定するための最良の方法は何ですか?
私は以下を使用してみました:
しかし、ISO8859_1でエンコードされていることがわかっているファイルでは、上記のコードはASCIIを生成しますが、これは正しくなく、ファイルの内容をコンソールに正しくレンダリングすることはできません。
excel - ファイルを保存するときに Microsoft Excel が使用する文字セットは何ですか?
Excel で作成された CSV ファイルを読み取る Java アプリがあります (2007 など)。これらのファイルを保存するためにMS Excelが使用する文字セットを知っている人はいますか?
私は次のいずれかを推測したでしょう:
- windows-1255 (Cp1255)
- ISO-8859-1
- UTF8
しかし、これらの文字セット タイプのいずれかを使用して、拡張文字 (たとえば、フランス語のアクセント付き文字) をデコードできません。
ruby-on-rails - Rails アプリケーションで非 UTF8 コンテンツを適切に処理する
ユーザーが RSS フィードなどを使用してさまざまなソースから情報をインポートできるようにする Rails アプリケーションがあります。私のデータベースのデフォルトのエンコーディングは UTF8 で、UTF8 以外のデータがシステムを通過し、データベースにヒットするとクラッシュするという例外をたくさん受け取りました。
is_utf8 を使用して非 UTF8 データを適切に検出するのですか? 保存が完了する前に属性のメソッドを実行しますが、それを処理する方法を思いつきませんでした。変換するiconvを見てきましたが、変換元のエンコーディングの種類を判断できる必要があるようです。
推測変換を行う簡単な方法や、UTF8 以外の文字を削除してデータベースに保存する方法はありますか?
ありがとう!
unix - UnixとWindowsの文字のレンダリング
FreeBSDとWindowsで開いたときに表示が異なるテキストファイルがあります。
FreeBSDの場合:AnÂ・lisiseInvestigaciÛ n
Windowsの場合:AnálisiseInvestigación
ウィンドウの表現は明らかに正しいです。その結果をbsdにする方法について何かアイデアはありますか?
c# - バイトストリームから返された奇妙な文字?
HLDS(Half-Life Dedicated Server)からのバイトストリームをテキストボックスに表示しようとすると、次のような奇妙なブロック状の疑問符文字が表示されます。
これがバイトストリームからのサンプル行です(奇妙な文字の代わりに[?]が付いています):
バイトストリームを文字列として表示する方法は次のとおりです。
文字は[CR][LF]
通常表示されるはずの場所に表示されます。なぜ奇妙な文字が表示されるのですか?奇妙な文字を削除したり、エンコーディングを修正したりするにはどうすればよいですか?
ジョンスキートは正しい答えを提供しました。ログは、改行(\ r \ nではなく)に対して\ nを返し、ストリーミングされた各ログ行の最後に\0を返します。\ nをEnvironment.NewLineに、\0をstring.Emptyに置き換えました。奇妙な文字はなくなりました。ジョンありがとう。
html - それでもhtmlエンティティを使用する必要がありますか?なんで?
HTMLエンティティはまだ有用ですか、それともUTF-8でエンコードされたHTMLドキュメントを作成するだけですか?その理由を説明してください。