問題タブ [character-set]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text - 文字セット間でテキスト ファイルを変換する最良の方法は?
文字セット間でテキスト ファイルを変換するための最も速くて簡単なツールまたは方法は何ですか?
具体的には、UTF-8 から ISO-8859-15 に、またはその逆に変換する必要があります。
お気に入りのスクリプト言語のワンライナー、コマンド ライン ツール、または OS 用のその他のユーティリティ、Web サイトなど、すべてが揃っています。
これまでのベストソリューション:
Linux/UNIX/OS X/cygwin の場合:
Troels Arvinによって提案されたGnu iconvは、フィルタとして最適に使用されます。一般的に入手可能のようです。例:
Benが指摘したように、 iconv を使用したオンライン コンバーターがあります。
Cheekysoftが提案するrecode ( manual ) は、 1 つまたは複数のファイルをその場で変換します。例:
これは短いエイリアスを使用します:
Recode は、異なる行末タイプとエンコーディング間の変換に使用できるサーフェスもサポートしています。
改行を LF (Unix) から CR-LF (DOS) に変換します。
Base64 エンコード ファイル:
それらを組み合わせることもできます。
Unix 行末を持つ Base64 でエンコードされた UTF8 ファイルを Dos 行末を持つ Base64 でエンコードされた Latin 1 ファイルに変換します。
Windows でPowershell ( Jay Bazuzi ) を使用する場合:
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(ただし、ISO-8859-15 はサポートされていません。サポートされている文字セットは、Unicode、utf7、utf8、utf32、ascii、bigendianunicode、default、および oem であると記載されています。)
編集
iso-8859-1 サポートのことですか? 「文字列」を使用すると、たとえばその逆の場合にこれが行われます
注: 可能な列挙値は、「Unknown、String、Unicode、Byte、BigEndianUnicode、UTF8、UTF7、Ascii」です。
- CsCvt - Kalytta の Character Set Converterは、Windows 用のもう 1 つの優れたコマンド ライン ベースの変換ツールです。
mysql - 文字セットと照合とは正確にはどういう意味ですか?
MySQLのドキュメントを読むことができますが、かなり明確です。しかし、どの文字セットを使用するかをどのように決定するのでしょうか? 照合はどのデータに影響しますか?
2つの説明と選び方をお願いしています。
php - 文字セットの問題
私はphpで構築された小さなajaxアプリケーションを持っています。
phpMyAdminを使用して、mysqlデータベースをutf-8に設定し、utf-8データを含むテキストファイルをインポートしました。
これは、my.cnfファイルにcharacter-set-server=utf8とdefault-character-set=utf8を追加した後、easyphpを使用するWindowsマシンで正常に機能しました。
これを構成ファイルにアクセスできない本番サーバーに移動しようとしましたが、ウムラウトなどの文字が表示されません。
これを修正するために(構成ファイルではなく)phpコードで設定できるもの、またはmysqlに与えることができるコマンドはありますか?
ALTER DATABASE vweb_50
DEFAULT CHARACTER SET utf8 COLLATE utf8_bin with phpMyAdminを試して、utf8_general_ciから試してみましたが、違いはありませんでした。
oracle - Oracle データベースの文字セット
こんにちは、日本語の文字をサポートするためにデータベースの文字セットを変更または変更するにはどうすればよいですか
vb.net - vb.net 文字セット
MSDN vb.netによると、この拡張文字セットを使用します。私の経験では、実際にこれを使用しています:
- 私は何が欠けていますか?なぜ一方を使用し、もう一方を使用すると言うのですか?
- 私は何か間違ったことをしていますか?
- 元の文字セットへの何らかの変換ツールはありますか?
sql-server - SQL Server: 文字セットを設定します (照合ではありません)
SQL Server でテーブルを作成するときに、フィールドの既定の文字セットを設定するにはどうすればよいですか? MySQL では、次のようにします。
ここで文字セットを 2 回設定していることに注意してください。冗長です。デモンストレーションのために両方の方法を追加しました。
照合が別のものであることを示すために、照合も設定します。照合の設定については尋ねていません。SQL Server の文字セットとエンコーディングに関するほとんどの 質問は照合で回答されますが、これは同じではありません。
visual-studio - Visual Studio の「文字セット」オプションについて
Visual Studio の「文字セット」オプションについて問い合わせがあります。文字セットのオプションは次のとおりです。
- 設定されていません
- Unicode 文字セットを使用
- マルチバイト文字セットを使用する
Character Set の 3 つのオプションの違いを知りたいですか?
また、それらのいずれかを選択すると、英語以外の言語 (RTL 言語など) のサポートに影響しますか?
java - ISO-8859-1 対 US-ASCII 文字セットの決定
使うか検討中です
また
Javaコードを介して同じエンコーディングで作成する必要があるサンプルファイルの文字セットを決定するために、すべての文字セットについて読んでいました。
サンプル ファイルに「ヨーロッパ」文字 (ノルウェー語: å ø æ) が含まれている場合、次のコマンドを実行すると、ファイル エンコーディングが「iso-8859-1」であることがわかります。
ただし、同じサンプル ファイルのコピーを取得し、ノルウェー語のテキストを使用せずに別のデータを含むように変更すると (たとえば、「Bjørn」を「Bjorn」に置き換えます)、同じコマンドでファイルのエンコーディングが「 us-ascii".
これは何を意味するのでしょうか?「ヨーロッパ」文字が含まれていない場合、ISO-8859-1 は実際には US-ASCII と同じですか?
文字セット「ISO-8559-1」を使用するだけで問題ありませんか?
database - Firebirdで文字セットをISO8859_1からUTF8に変換するには?
Firebird 2.5 にデータが入ったデータベースがあります。UTF-8
文字セットをからに変更する必要がありますISO8859_1
。
しかし、うまくいきません。文字セットを変換するにはどうすればよいですか?