問題タブ [internationalization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - C スレッドでのファイル解析を中断することなく、組み込み Python で locale.setlocale を使用する
組み込みの Python インタープリターでコードを記述できるようにし、呼び出し可能な API を公開するサードパーティのミドルウェア製品を使用しています。これらの API 呼び出しの一部では、さまざまな種類のファイルを読み込むことができます。読み込みコードは C で実装されています。ファイルの読み込みは別のスレッドで行われ、データが利用可能になると Python にコールバックされます。これまでのところ、すべて順調です。
私たちは製品を i14ing (へー) してきましたが、やりたいことの 1 つは、ユーザーのロケール設定に従ってユーザー向けの数値出力をフォーマットすることです。したがって、Python から次のようにします。
現在、これは機能します (ユーザーに表示される数字がロケールに合わせて正しくフォーマットされているという点で)。ただし、ユーザーのロケールがデフォルトの C ロケールと異なる場合、その後ロードされたファイルは正しくないデータを返します。これはおそらく、すべての文字列から float への変換が金属に至るまで影響を受けているためです。
ロケール対応のファイル読み込みを実装することでこれを回避することはできないため、現在の回避策は、ユーザーの出力をフォーマットするときにのみロケールを設定し、後で再度設定することです。つまり、次のようなものです。
これは少し不格好に思えますが、これがユーザー向けにロケール対応出力をフォーマットするための一般的なアプローチであるかどうか疑問に思っていました。私のもう 1 つの懸念は、これが明らかにスレッド セーフではないことです。そのため、ロケールが変更されたときに別のスレッドでファイルの解析が行われると、問題が発生する可能性があります。
ベストプラクティスに関する情報は大歓迎です - 私はこの種のことについてあまり経験がありません.
php - ユーザーが入力した国際文字を含むデータが破損しないようにするにはどうすればよいですか?
MySQL DB、テーブル、およびフィールドの照合がutf8_general_ciに設定されていても、éなどの文字がéに変換されることがよくあります。ページのContent-TypeのエンコーディングもUTF8に設定されています。
utf8_encode / decodeについては知っていますが、どこでどのように使用するかについてはよくわかりません。
「すべてのソフトウェア開発者が絶対に、Unicodeと文字セットについて絶対に知っておく必要があります(言い訳はありません!)」の記事を読みましたが、MySQL/PHP固有のポインターが必要です。
ユーザーが入力した国際文字を含むデータが破損しないようにするにはどうすればよいですか?
java - Java、Unicode、およびフォント
私は Java のドキュメントを見て、特定のフォント (Monospace など) を使用した国際文字に対する Java のサポートに関する情報をネットで探しましたが、明確な具体的な答えを得ることができませんでした。
Java 1.4 と Java 1.5/1.6 の間で変更がありました。たとえば、Java 1.4 で JTextArea のフォントを Monospace に設定すると、外部文字を処理できなくなります (代わりに四角形を取得します) が、Java 1.5/1.6 では問題なく動作するようです。
これらの違いや改善されたサポートはどこかに明確に文書化されていますか?
ありがとう
algorithm - 日本語ソースから英訳単語数を推定するアルゴリズム
私は、日本語からの翻訳が英単語の数になると見積もる方法を考え出そうとしています. 日本語には、漢字、ひらがな、カタカナの 3 つの主なスクリプトがあり、それぞれの文字と単語の平均比率が異なります (漢字が最も低く、カタカナが最も高い)。
例:
- computer: コンピュータ (カタカナ - 6 文字); 計算機(漢字:3文字)
- クジラ: くじら (ひらがな -- 3 文字); 鯨(漢字:1文字)
データとして、私は日本語の単語とその英訳の大規模な用語集と、一致する日本語の原文文書とその英訳のかなり大きなコーパスを持っています。ソーステキストの漢字、ひらがな、カタカナの文字数を数え、これが英単語の数になる可能性を見積もる式を考え出したい.
internet-explorer - ファイルのダウンロード時のファイル名の破損 (IE)
簡単なファイルのアップロードとダウンロードのメカニズムを実装しました。ユーザーがファイル名をクリックすると、ファイルは次の HTTP ヘッダーとともにダウンロードされます。
日本語のファイル名にも対応しています。そのために、次の Java メソッドを使用してファイル名をエンコードします。
誰かが長いファイル名でうまく動作しないことに気付くまで、これまでのところうまくいきました。例: あああああああああああああああ2008.10.1あ.doc
. 半角ドットの 1 つを半角アンダーラインに変更するか、最初の文字を削除すると、問題なく動作します。つまり、ドット文字の長さと URL エンコードに依存します。以下にいくつかの例を示します。
これは壊れています ( あああああああああああああああ2008.10.1あ.doc
):
これで問題ありません ( あああああああああああああああ2008_10.1あ.doc
):
これでもいいです ( あああああああああああああああ2008.10.1あ.doc
):
誰にも手がかりがありますか?
php - PHPコードベースのi18nに適したツール/フレームワークは何ですか?
動的 php アプリケーションのローカリゼーションと国際化を有効にするためのいくつかのオプションを検討してきました。gettext や Yahoo の R3 など、さまざまなツールが利用できるようです。開発者と翻訳者の両方から、どのツールを使用するのが良いか、実装と翻訳の作業を容易にするためにどの機能が重要かを聞くことに興味があります。
language-agnostic - Web アプリケーションの国際化のベスト プラクティスは?
Web アプリケーションの国際化は常に面倒に思えます。プラグ可能な言語をどれだけ前もって計画しても、エンコーディングの問題、テンプレートに合わない変な言い回し、その他の問題が常にあります。
プログラマーが Web アプリの国際化を決定する際に注意すべき一連の事項について、SO コミュニティの意見を得ることが役立つと思います。
php - 既存のWebアプリを多言語アプリにどのように変換しますか?
かなり大きなWebアプリを微調整して複数の言語を処理する必要があるプロジェクトに取り組みます。手作りのPHPコードで動作しますが、かなりクリーンです。
私はそれを行うための最良の方法は何でしょうか?
実際の建築に合わせて、自分で何かを作っています。
私のためにi18nを管理するフレームワーク(例えば、Symfony)を使用してその大部分を書き直しますか?
オプション1の場合、i18nデータをどこに保存する必要がありますか?* .po、xliff、純粋なDB?
別の方法を考えました。翻訳にのみSymfonyを使用しますが、コントローラーを設定してWebサイトを既にロードするようにします。速いが汚い。一方で、それは私たちが次の変更を行うことを可能にし、ゆっくりと完全なSymfonyに移行します:このWebサイトは本当にそのための良い候補です。
しかし、おそらく、Webフレームワーク全体よりもうまく機能するスタンドアロンの翻訳エンジンがいくつかあります。バズーカを使ってハエを殺すのと少し似ています...
ruby - RubyとRoRでUTF8を実装するために現在どのようなオプションがありますか?
Rubyの開発に非常に密接に続いて、詳細な文字エンコードがRuby1.9に実装されていることを学びました。今のところ私の質問は次のとおりです。UTF8にすべてのデータを格納するデータベースと通信するために、現時点でRubyをどのように使用できますか?
背景:私は、Ruby/RoRが少なくともオプションである新しいプロジェクトに携わっています。ただし、プロジェクトは国際化された文字セット(多くの国に広がっている)、できればUTF8に依存する必要があります。
では、どのように対処しますか?前もって感謝します。
javascript - OpenSocial ガジェット アプリのローカライズ
OpenSocial アプリケーションに多言語サポートを追加しようとしています。ガジェットの XML マークアップで、独自のメッセージ バンドルにリンクできることがわかりました。
しかし、実際にそれらから値を抽出するにはどうすればよいでしょうか?