問題タブ [cjk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 中国語の文字をJavaでファイルに保存するには?
以下のコードで漢字を.txtファイルに保存しているのですが、ワードパッドで開いたら読めませんでした。
私に何ができる ?漢字をカット アンド ペーストしてワードパッドに貼り付ければ、.txt ファイルに保存できます。Javaでそれを行うにはどうすればよいですか?
unicode - 漢字を含むファイルは、1 文字あたりの使用バイト数をどのように知るのですか?
Joel の記事「すべてのソフトウェア開発者が絶対に、積極的に Unicode と文字セットについて知っておく必要がある絶対的な最小値 (言い訳はありません!)」を読みましたが、まだすべての詳細を理解していません。例は私の問題を説明します。以下のファイルを見てください。
(ソース: yart.com.au )
バイナリ エディタでファイルを開き、最初の漢字の隣にある 3 つの a の最後の文字を詳しく調べました。
(ソース: yart.com.au )
ジョエルによると:
UTF-8 では、0 ~ 127 のすべてのコード ポイントが 1 バイトに格納されます。128 以上のコード ポイントのみが 2、3、実際には最大 6 バイトを使用して格納されます。
編集者は次のように述べています。
- E6 (230) はコード ポイント 128 より上です。
- したがって、次のバイトを 2、3、実際には最大 6 バイトとして解釈します。
もしそうなら、解釈が 2 バイト以上であることを示すものは何ですか? これは、E6 に続くバイトによってどのように示されますか?
漢字は 2、3、4、5、または 6 バイトで保存されますか?
mobile - 中国のモバイルソフトウェア開発?
私の推測 () によると、何億もの中国の携帯電話 (またはブランドの携帯電話のクローン) が存在します。そして、これらの携帯電話のファームウェアと OS は同じようです。これらの電話機は設計が異なるだけで、ハードウェアである可能性があります。
それらの携帯電話用の開発キットまたはソフトウェア開発サポートがあるかどうか疑問に思っていました. それらの電話内のOSおよび/またはファームウェアは何ですか? それらはオープンソースですか、それともオンラインで入手できますか? これらの電話は Java をサポートしていますか? これらの電話とそのソフトウェアに関する詳細情報は、オンラインでどこで入手できますか?
よろしくお願いします。
database - 中国語テキストの制御された使用を許可する
.netへの注文入力のためのasp.oldWebアプリのオーバーホールを監督しています。これまでのところ簡単なことですが、プロジェクトは興味深い方向に進んでいます。中国語のテキストのデータ入力をサポートできるようにする必要もあります。
今のところデータ入力を見ているだけです。
データ入力が英語でのみ許可されなければならない条件(注文が中国以外の国を含む場合)と、中国語などでの入力が許可される条件(注文がローカルのみである場合)があるという点で、私は問題にぶつかりました。
データベースは現在シングルバイトストレージです。これに対応する方法について何か提案はありますか?現在の考えは次のとおりです。i)中国語のテキスト用に個別のマルチバイトデータベースを維持します。ii)。ラテン語のテキストのみを適用するためのフロントページのJavascript...
当然、私は短いタイムスケールを持っています-私はCJKVの11ページまでしかそれを達成していません。どんな指導もありがたいです!ありがとう。
encoding - Tcl エンコード コマンドを使用して繁体字中国語から簡体字中国語に変換する
繁体字中国語 (big5) でデータを表示する Tcl で書かれた Web サイトをサポートしています。次に、mandarintools.com の翻訳コードを使用して Java サーブレットを作成し、ページ リクエストを簡体字中国語に翻訳します。変換コードに指定されている変換は、UTF-8 から UTF-8S です。Javaは、データが入ってくると、データをUTF-8に正しく変換しているようです。
Java 変換コードは機能しますが、速度は遅く、Web サイトは Tcl で書かれているため、別のリストの誰かがそれを使ってみることを勧めました。残念ながら、Tcl は UTF-8S をサポートしていないため、代わりにどの翻訳を使用すればよいかわかりません。私はgb2312、gb2312-raw、gb1988、euc-cnを試しました...すべて意味不明になります。私の推測では、Tcl も入ってくると UTF-8 に変換されますが、最初に big5 からの変換を試みましたが、役に立ちません。
私のテストコードは次のようになります。
私も試してみました
しかし、何も変わりませんでした。
私がそれを理解するのを助けるのに十分な経験を持っている人はいますか?
eclipse - Eclipse コンソール出力に漢字を表示する
Eclipse コンソールで GB2312 エンコーディングでいくつかの漢字を表示しようとしています。[実行ダイアログ] -> [共通] タブ -> [コンソール エンコーディング] で、デフォルトの CP1252 以外のエンコーディングを選択できることに気付きました。ただし、GB2312 などのエンコーディングを追加するにはどうすればよいですか?
ありがとう。