問題タブ [encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
encoding - ELF の NEEDED エントリの標準エンコーディングはありますか?
私は自分のコードの一部を純粋な ascii 以外のシステムにもう少し使いやすくしようとしていますが、ELF バイナリの NEEDED エントリに使用される特定の文字エンコーディングがあったのか、それともかなり標準的ではなく、作成システムに基づいているのか疑問に思っていましたファイルシステムのエンコーディング(または、バイナリを作成したものに渡されたバイトだけでも直接)(もしそうなら、バイナリにエンコーディングを指定する場所はありますか?現在のシステムのエンコーディングが私の使用法ではうまく機能しないと仮定すると) 、ASCII以外の名前はほとんど禁止されていますか、それとも何か他のものですか?
java - Oracle から XML に文字をエンコードする方法は?
私の環境では、Java を使用して結果セットを XML にシリアル化します。基本的に次のように発生します。
XML は Firefox では次のようになります。
しかし、XML を解析すると、
org.xml.sax.SAXParseException: 文字参照 " " は無効な XML 文字です。
私の質問は次のとおりです。どの文字を置き換える必要がありますか、またはどのように文字をエンコードする必要がありますか?それらは有効な XML になりますか?
.net - XML 用にテキスト データをエンコードする最良の方法
Xml 要素または属性で使用する文字列をエンコードするための .Net のジェネリック メソッドを探していましたが、すぐに見つからなかったので驚きました。では、先に進む前に、組み込み関数が不足している可能性はありますか?
本当に存在しないと仮定して、独自のジェネリックEncodeForXml(string data)
メソッドを作成し、これを行うための最善の方法を考えています。
この全体を促した私が使用しているデータには、&、<、" などの不適切な文字が含まれている可能性があります。また、適切にエスケープされたエンティティ &、<、および " が含まれている場合もあります。 CDATA セクションは最良のアイデアではないかもしれません.それはちょっと不格好に思えます.xml で直接使用できる素敵な文字列値で終わるほうがずっとましです.
過去に正規表現を使用して悪いアンパサンドをキャッチしたことがありますが、この場合と最初のステップで正規表現を使用してキャッチし、他の文字を単純に置き換えることを考えています。
それで、これを複雑にしすぎずにさらに最適化することはできますか?私が見逃しているものはありますか? :
C# のみの皆さん、申し訳ありませんが、どの言語を使用するかはあまり気にしませんが、Regex を静的にしたかったのですが、C# ではメソッドの外で宣言しないとそれを行うことができないため、これは VB になります。 。ネット
最後に、私はまだ私が働いている .Net 2.0 を使用していますが、誰かが最終製品を取得して、それを文字列クラスの拡張メソッドに変えることができれば、それもかなりクールです。
更新最初のいくつかの応答は、.Net には実際にこれを行う組み込みの方法があることを示しています。しかし、私が始めたので、EncodeForXml() メソッドを楽しみのために終わらせたいと思っているので、まだ改善のアイデアを探しています。特に: エンティティとしてエンコードする必要がある文字のより完全なリスト (おそらくリスト/マップに格納される) と、不変の文字列に対してシリアルで .Replace() を実行するよりも優れたパフォーマンスが得られるもの。
linux - UNIX/Linux 環境と対話するときに UTF-8 エンコーディングが使用されるのはなぜですか?
慣習なのはわかるけどなんで?他の方法が本当に悪い考えになる本当の技術的な理由はありますか、それともエンコーディングと下位互換性の歴史に基づいているだけですか? さらに、 を使用せずUTF-8
に他のエンコーディング (特にUTF-16
) を使用することの危険性は何ですか?
編集:相互作用することによって、私は主に と を意味しshell
ますlibc
。
encoding - 理論: 「レキシカルエンコーディング」
私は「レキシカル エンコーディング」という用語を、より適切な用語がないために使用しています。
文字とは対照的に、言葉は間違いなくコミュニケーションの基本単位です。Unicode は、既知のすべてのアルファベットの各文字に数値を割り当てようとします。ある言語にとっての文字は、別の言語にとってのグリフです。Unicode 5.1 は現在、これらのグリフに 100,000 を超える値を割り当てています。現代英語で使われている約18万語のうち、約2,000語の語彙があれば一般的な会話ができると言われています。「字句エンコーディング」は、各文字ではなく各単語をエンコードし、それらをセンテンス内にカプセル化します。
この例では、文字列内の各トークンが整数としてエンコードされています。ここでのエンコーディング スキームは、単語の使用状況の一般化された統計的ランキングに基づいて int 値を割り当て、疑問符に定数を割り当てただけです。
最終的には、単語には綴りと意味の両方があります。「字句エンコーディング」は、文全体の意味と意図を保持し、言語固有ではありません。英文は「...言語に中立な意味の原子要素...」にエンコードされ、構造化された構文形式と文法構造を持つ任意の言語に再構成できます。
「レキシカルエンコーディング」技術の他の例は何ですか?
単語の使用統計がどこから来たのか興味がある場合:
http://www.wordcount.org
python - Python を使用してファイルの形式を Unicode から ASCII に変換するにはどうすればよいですか?
ファイルを Unicode 形式で出力するサードパーティ ツールを使用しています。ただし、ASCII にすることをお勧めします。このツールには、ファイル形式を変更するための設定がありません。
Python を使用してファイル形式全体を変換する最良の方法は何ですか?
java - ロシア語の cp1251 エンコーディングをサポートするように Tomcat 6 を構成する
Struts アプリケーションを Websphere から Tomcat 6 に移行していますが、アプリケーションはロシア語をサポートしています。Websphere では、JVM パラメーター -Dclinet.encoding.override=cp1251 を渡すために使用しますが、Tomcat で JVM 引数 -DFile.encoding=cp1251 を渡してこれを試したところ、システムは入力を受け入れません (私は検索のような任意のテキスト ボックスです)。画面)、無効な入力で応答します。
また、Websphere と同じパラメーター (-Dclinet.encoding.override=cp1251) を渡そうとしましたが、問題は解決しませんでした。
java - URL パラメータを Java でエンコードする必要があるかどうかを確認する方法
エンコードされている場合とされていない場合がある URL パラメーター値を受け入れる Java アプリを作成しています。パラメータ文字列をエンコードする必要があるかどうかを簡単に判断する方法が必要です。
つまり、boolean needsEncoding(String param)
文字列 "foo@test.com" を渡すと true を返し、"foo%40test.com" を渡すと false を返す function が必要です。この考えの問題点は、これがあいまいであるということです。後者の文字列の「%」記号をエンコードする必要があるかどうかは、どうすればわかりますか? これを処理する 1 つの方法は、コントラクトを変更することです。クライアントにエンコードされていない文字列を渡すように要求して、常にエンコードする必要があることを認識できるようにします。考え?
iphone - iPhone「Webサイトエラー」
iPhone アプリ用に PHP でサーバー側プログラムを作成しています。そして、私はiPhoneを持っていません。:P
iPhone アプリは、ユーザーが iPhone アプリを実行するたびに、サイトから XML ファイルを要求します。XML ファイルについては、http ://www.appvee.com/iphone/adsまたはhttp://www.appvee.com/iphone/latestにアクセスしてください。
また、メッセージ ボックスに次のエラー メッセージが表示されます。
おそらく、header("Content-type: text/xml"); を追加する必要があります。PHPファイルの先頭に?私はこの行を追加しませんでしたが、以前はうまく機能していました。
どんな助けでも大歓迎です。