問題タブ [unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ms-access - チルダ区切り文字を使用したUnicodeとしてのMSAccessテーブルのエクスポート
MSAccess2003からいくつかのテーブルの内容をエクスポートしたいと思います。テーブルにはUnicode日本語文字が含まれています。それらをチルダ区切りのテキストファイルとして保存したいと思います。
これは、ファイル/エクスポートを使用して手動で行うことができ、[詳細設定]ダイアログで、フィールド区切り文字としてチルダを選択し、コードページとしてUnicodeを選択します。
これをエクスポート仕様として保存できますが、これはテーブル固有のようです。
VBAコードを使用して多くのテーブルをエクスポートしたい。
これまでに試しました:
Sub ExportTables()
サブ終了
これを実行すると、例外が発生します。
実行時エラー「3011」:Microsoft Jetデータベースエンジンがオブジェクト「Allowance1#txt」を見つけることができませんでした。オブジェクトが存在し、その名前とパス名のスペルが正しいことを確認してください。
この時点でデバッグすると、予想どおり、TableNameは「Allowance1」になります。
私のUnicodeTildeエクスポート仕様はテーブル固有であると思うので、複数のテーブルに使用することはできません。
解決策は何ですか?TransferText以外のものを使用する必要がありますか、それともプログラムでエクスポート仕様を作成する必要がありますか?
助けていただければ幸いです。
c++ - 組み込みアプリケーション用に std::string から std::wstring に切り替えますか?
これまで、組み込みシステム (ルーター、スイッチ、通信機器など) の C++ アプリケーションで std::string を使用してきました。
次のプロジェクトでは、Unicode サポートのために std::string から std::wstring に切り替えることを検討しています。これにより、たとえば、エンド ユーザーはコマンド ライン インターフェイス (CLI) で漢字を使用できるようになります。
どのような合併症 / 頭痛 / 驚きが予想されますか? たとえば、まだ std::string を使用しているサードパーティのライブラリを使用するとどうなりますか?
国際文字列のサポートは、私が取り組んでいる組み込みシステムの要件としてはそれほど強力ではないので、大きな頭痛の種にならない場合にのみサポートします。
c - WindowsのUTF-8
C WindowsプログラムでコードページをUTF-8に設定するにはどうすればよいですか?
fopenを使用してファイルを開くサードパーティのライブラリがあります。wcstombsを使用して、Unicodeファイル名を現在のコードページに変換できますが、ユーザーがコードページの外に文字を含むファイル名を持っている場合、これは機能しません。
理想的には、_setmbcp(65001)を呼び出してコードページをUTF-8に設定しますが、_setmbcpのMSDNドキュメントには、UTF-8はサポートされていないと記載されています。
どうすればこれを回避できますか?
sql-server - MicrosoftSQLServerおよびUnicodeによるコード変更の回避
MSSQLサーバーがデフォルトでUnicodeデータをVARCHARまたはNVARCHAR列に受け入れるようにするにはどうすればよいですか?
フィールドに配置する文字列の前にNを配置することでそれを実行できることは知っていますが、正直なところ、これは2008年、特にSQLServer2005の使用では少し古風なようです。
php - Zend Framework を使用して utf-8 マルチバイト文字を含む PDF ファイルを生成する方法
Zend Framework Zend_Pdf クラスに「小さな」問題があります。マルチバイト文字は、生成された pdf ファイルから削除されます。たとえば、aąbcčdeę と書くと、リトアニア文字が取り除かれた abcd になります。
それが特に Zend_Pdf の問題なのか、一般的な php の問題なのかはわかりません。
ソース テキストは utf-8 でエンコードされ、ジョブを実行する php ソース ファイルも同様です。
よろしくお願いします。
PS Zend Framework v. 1.6 を実行し、FONT_TIMES_BOLD フォントを使用しています。FONT_TIMES_ROMAN は動作します
python - Python を使用してファイルの形式を Unicode から ASCII に変換するにはどうすればよいですか?
ファイルを Unicode 形式で出力するサードパーティ ツールを使用しています。ただし、ASCII にすることをお勧めします。このツールには、ファイル形式を変更するための設定がありません。
Python を使用してファイル形式全体を変換する最良の方法は何ですか?
php - Word のスマート クォーテーションと全角ダッシュを文字列に変換するにはどうすればよいですか?
テキストエリアのあるフォームがあります。ユーザーは、データベースに保存されているテキスト ブロックを入力します。
ユーザーは、スマート クォーテーションやエムダッシュを含むテキストを Word から貼り付けることがあります。これらの文字は、データベースでは「、」、「、、」として表示されます。</p>
スマート クォートを通常のクォートに変換し、emdash を通常のダッシュに変換するには、入力文字列に対してどの関数を呼び出す必要がありますか?
私はPHPで働いています。
更新: これまでに素晴らしい回答をありがとうございました。エンコードに関する Joel のサイトのページは非常に有益です: http://www.joelonsoftware.com/articles/Unicode.html
私の環境に関するいくつかのメモ:
MySQL データベースは UTF-8 エンコーディングを使用しています。同様に、コンテンツを表示する HTML ページは、メタ コンテンツ タイプを明示的に設定することにより、UTF-8 (Update:) を使用しています。
これらのページでは、スマート クォートと em ダッシュがクエスチョン マーク付きのひし形で表示されます。
解決:
返信ありがとうございます。解決策は次の 2 つでした。
- データベースと HTML ファイルが明示的に UTF-8 エンコーディングを使用するように設定されていることを確認してください。
htmlspecialchars()
の代わりに 使用しhtmlentities()
ます。
c++ - ICU ライブラリを使用した UTF-8 から ASCII への変換
UTF-8 文字を含む std::string があります。
文字列を ASCII 文字に最も近いものに変換したいと考えています。
例えば:
Łódź => Lodz
Assunção => Assuncao
Schloß => Schloss
残念ながら、ICU ライブラリは非常に直感的ではなく、その使用法に関する適切なドキュメントが見つからないため、使用方法を習得するには時間がかかりすぎます。時間がありません。
誰かがこれをどのように行うことができるかについて少し例を挙げてもらえますか??
ありがとう。
java - エンコーディング 'UTF-8' は Java ランタイムでサポートされていません
SUN Java (ビルド 1.6.0_10-rc2-b32 およびその他の 1.6.x ビルド) で Apache Felix (OSGi) ベースのアプリケーションを起動するたびに、コンソールに次のメッセージ出力が表示されます (通常は Ubuntu 8.4 で)。
警告: エンコーディング 'UTF-8' は、Java ランタイムではサポートされていません。
Tomcat と Resin の両方を実行しているときにも、このメッセージが表示されることがあります。Java が Unicode と UTF-8 をサポートしている場合、このメッセージの原因は何ですか? 私はまだ参照を見つけていないか、他の場所でこれに答えていません。
c++ - SQLite の大文字と小文字を区別しない UTF-8 文字列照合 (C/C++)
SQLiteのカスタム照合関数で使用するために、大文字と小文字を区別しない方法で C++ の UTF-8 文字列を比較およびソートする方法を探しています。
- このメソッドは、理想的にはロケールに依存しない必要があります。しかし、私が知る限り、照合は言語に大きく依存しているため、ロケールの切り替えを意味する場合でも、英語以外の言語で動作するものは何でも動作します。
- オプションには、標準の C または C++ ライブラリ、または小規模(組み込みシステムに適した) および非 GPL (プロプライエタリ システムに適した) サードパーティ ライブラリの使用が含まれます。
私がこれまでに持っているもの:
strcoll
C ロケールでは およびstd::collate
/std::collate_byname
は大文字と小文字が区別されます。(これらの大文字と小文字を区別しないバージョンはありますか?)POSIX strcasecmp を使用しようとしましたが、それ以外のロケールでは定義されていないようです
"POSIX"
POSIX ロケールでは、strcasecmp() と strncasecmp() は上位から下位への変換を行い、次にバイト比較を行います。結果は、他のロケールでは指定されていません。
実際、GLIBC を使用する Linux ではロケール間での結果は
strcasecmp
変わりません。これは印刷されます:
/li>
PS