問題タブ [encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Changing the default encoding for String(byte[])
Is there a way to change the encoding used by the String(byte[]) constructor ?
In my own code I use String(byte[],String) to specify the encoding but I am using an external library that I cannot change.
The output for this is :
I have tried changing the system property file.encoding
but it does not work.
encoding - Linuxで最高のhe-aacエンコーダー?
mp3 ファイルを he-aac (別名 aac+) に変換できるエンコーダーが必要です。これまでのところ、私が見つけた最高のものはnero aac encodingです。これには 2 つの問題があります。 - 入力形式は 1 つだけです: wav。mp3 ファイルを wav に変換してから he-aac に変換するのは少し遅いです。-非営利目的の無料ライセンス。
残念ながら、ffmpeg は he-aac をサポートしていません... 商用ソリューションon2 flixがありますが、私が行う必要がある単純なタスクのゴールデン ハンマーのようです。
c# - C# には JavaScript の encodeURIComponent() に相当するものがありますか?
JavaScript の場合:
C# アプリケーションに相当するものはありますか? 私が使用したHTML文字をエスケープするために:
しかし、一致を JS が使用する正しい 16 進数形式に変換する方法がわかりません。たとえば、このコード:
の代わりに"%a9%221a"
を返します。文字列をバイトか何かに分割する必要があるようです。"©√"
"%C2%A9%E2%88%9A"
編集: これは Windows アプリ用です。使用できる項目System.Web
はAspNetHostingPermission
、AspNetHostingPermissionAttribute
、およびのみAspNetHostingPermissionLevel
です。
java - Javaで文字列をUTF8バイト配列との間で変換する方法
Javaでは、文字列があり、それをバイト配列としてエンコードしたい(UTF8または他のエンコードで)。または、バイト配列 (既知のエンコーディング) があり、それを Java String に変換したいと考えています。これらの変換を行うにはどうすればよいですか?
c# - テキストファイルのエンコーディング/コードページを検出するにはどうすればよいですか?
このアプリケーションでは、さまざまなソースからテキストファイル(、など)を受け取り.txt
ます.csv
。読み取るときに、これらのファイルにはガベージが含まれることがあります。これは、ファイルが別の/不明なコードページで作成されたためです。
テキストファイルのコードページを(自動的に)検出する方法はありますか?
コンストラクターdetectEncodingFromByteOrderMarks
上の、は、およびその他のUnicodeでマークされたファイルに対して機能しますが、、などの コードページを検出する方法を探しています。StreamReader
UTF8
ibm850
windows1252
あなたの答えをありがとう、これは私がしたことです。
私たちが受け取るファイルはエンドユーザーからのものであり、コードページについての手がかりはありません。受信者はエンドユーザーでもあります。これは、コードページについて知っていることです。コードページは存在し、煩わしいものです。
解決:
- 受信したファイルをメモ帳で開き、文字化けしたテキストを確認します。誰かがフランソワか何かと呼ばれているなら、あなたの人間の知性であなたはこれを推測することができます。
- ユーザーがファイルを開くために使用できる小さなアプリを作成し、正しいコードページが使用されたときにファイルに表示されることをユーザーが知っているテキストを入力します。
- すべてのコードページをループし、ユーザーが提供したテキストで解決策を提供するコードページを表示します。
- 複数のコードページが表示される場合は、ユーザーにさらにテキストを指定するように依頼してください。
ruby-on-rails - ソースなしで Ruby on Rails アプリケーションを配布できますか?
ソースコードなしで本番用に RoR アプリを配布することは可能でしょうか? SO でこの投稿を見たことがありますが、私の状況は少し異なります。これは手がかりのある人が管理するアプリになるので、顧客側で Apache/Mongrel/MySQL のセットアップが必要であることには問題ありません。私が本当に望んでいるのは、ソースが保護されることだけです。エンコーディングは、PHP アプリを配布するための一般的な方法のようです (例: Helpspot )。
これらの潜在的な解決策を見つけました:
- Zenobfuscate - ただし、すべてのタイプの Ruby コードがサポートされているわけではないため、それはカウントされません。
- Ruby エンコーダー- PHP エンコーダーは問題ないように見えるため (私はまだ試していません)、最適なオプションかもしれませんが、まだ利用できません。以前、PHPでIONcubeを使ったことがあり、うまくいきましたが、まだIONcubeに興味がないようです。
- Slingshot - 他の SO 投稿で言及されていましたが、別の問題を解決し、ソースがまだ表示されています。
- RubyScript2Exe - doco からは、本番環境に対応していないため、カウントされません。
JRuby を使用してバイトコードを配布することで、これを実現できる可能性があると聞いたことがありますが、JRuby を使用したことがないので、何が関係しているのかわかりません。
誰でもアイデアや既知の例を提供できますか? 理想的には、ある種の自動化されたビルド シナリオも用意したいと考えています。
c++ - C++ 文字列: UTF-8 または 16 ビット エンコーディング?
私はまだ、(ホーム) プロジェクトでUTF-8文字列 (必要に応じて追加の UTF-8 固有の関数を使用して std::string で実装) を使用するか、16 ビット文字列 (std: として実装) を使用するかを決定しようとしています。 :wstring)。このプロジェクトは、プログラミング言語と環境です (VB のように、両方を組み合わせたものです)。
いくつかの希望/制約があります:
- メモリが限られているコンピュータなど、限られたハードウェアで実行できれば素晴らしいと思います。
- Windows、Mac、および (リソースが許せば) Linux でコードを実行したいと考えています。
- GUI レイヤーとしてwxWidgetsを使用しますが、そのツールキットと対話するコードをコードベースの隅に閉じ込めたいと考えています (非 GUI 実行可能ファイルを用意します)。
- ユーザーに表示されるテキストとアプリケーションのデータを操作するときに、2 つの異なる種類の文字列を操作することは避けたいと思います。
現在、必要な場合にのみ UTF-8 操作関数を使用する目的で、std::string を使用しています。必要なメモリが少なくて済み、とにかく多くのアプリケーションが進んでいるようです。
exception - Tomcat で EOF または isHexDigit メッセージで java.io.CharConversionException が発生する原因は何ですか?
この例外は、単純な 'getParameter()' 呼び出しで本番環境のカタリナ ログに表示されます。
または時々:
java - Add non-ASCII file names to zip in Java
What is the best way to add non-ASCII file names to a zip file using Java, in such a way that the files can be properly read in both Windows and Linux?
Here is one attempt, adapted from https://truezip.dev.java.net/tutorial-6.html#Example, which works in Windows Vista but fails in Ubuntu Hardy. In Hardy the file name is shown as abc-ЖДФ.txt in file-roller.
Unlike java.util.zip, truezip allows specifying zip file encoding. Here's another sample, this time explicitly specifiying the encoding. Neither IBM437, UTF-8 nor ISO-8859-1 works in Linux. IBM437 works in Windows.
python - unicode() がエンコーディングなしでのみオブジェクトに str() を使用するのはなぜですか?
ASCII ではない utf-8でエンコードされたデータを含む文字列変数を作成することから始めます。
その上で使用unicode()
するとエラーが発生します...
...しかし、エンコーディングがわかっている場合は、それを2番目のパラメーターとして使用できます:
__str__()
メソッドでこのテキストを返すクラスがあるとします。
unicode(r)
上記str()
と同じエラーが発生するため、使用しているようです。unicode(text)
これまでのところ、すべてが計画どおりです!
しかし、誰も予想していなかったように、unicode(r, 'utf-8')
試してさえいません:
なんで?この一貫性のない動作はなぜですか? バグですか?それは意図されていますか?非常に厄介です。