問題タブ [python-unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
67437 参照

python - python2.7の文字列内のUnicode \u2026のような文字を削除する

私はこのようにpython2.7に文字列を持っています、

これに変換するにはどうすればよいですか、

0 投票する
1 に答える
1668 参照

google-app-engine - Google App EngineのPILで使用できるシステムフォントは何ですか?

App EngineのPILで使用できるフォントは何ですか?

アプリケーションの一部としてフォントをアップロードできることは知っていますが、基本的に必要なのは、見栄えの良いHelvetica(または代替)であるUnicode文字で動作するsans-serifを提供するシステムです。Googleサーバーにはすでにいくつかのフォントがインストールされている可能性があります。これについて、私はいくつかの洞察を求めています。

日本語やその他の文字がPILを使用して適切にレンダリングされるように、Unicode対応のフォントを見つけたいと思います。

font-familyを使用してUnicode文字を適切にレンダリングするWebページがあります:'Helvetica Neue'、Helvetica、Arial、sans-serif;

PILを使用して同じUnicode文字をレンダリングすると、正しくレンダリングされません。アプリの一部としてアップロードしたフォントには、フォントに必要なUnicode文字が含まれていません。

これが私が今使っているものからの関連するPythonのコード行です。

0 投票する
2 に答える
689 参照

python - Python2.7でスペースを含むユニコードキーにアクセスする

私はExcelファイル(を介して読み込まれるxlrd)とそれらの地理コードアドレスを取得しようとしているプロジェクトに取り組んでいます。このために、私はディレクトリのリストを使用しており、各ディレクトリエントリは別々のサイトになっています。

次のようなaddressList[0]結果になります。

(そして、スプレッドシートで「所属」のつづりが間違っていることに気づきました。まあ。)

さて、Pythonのキーにはスペースが含まれている可能性があり、これは問題にならないはずです。ただし、入力addressList[0]['Site Phone']するとKeyErrorが発生します。実際、「時間」キーの値を取得しようとすると、同様のKeyErrorが発生します。

Unicodeキーに関する質問に基づいて、私は次のことを試しました。

その結果、次のようなエントリを持つ辞書が作成されました。

を介して値にアクセスする必要があることを除いて、これはかなり問題ありませんSTRING_DATA["text:u'Site Name'"]。これは苦痛のようです。

キーを使用するためのより迅速で簡単な方法はありますか?

0 投票する
1 に答える
100 参照

python - Django : Django でエンコーディングがわかりません

このアプリケーションは Python 2.7 で正常に動作しています。

たとえば、「من」を「mn」に変更します。

これを Django Function に変更したところ、奇妙な動作が発生しました!

ジャンゴ関数:

私は結果がどうなるかをテストしているだけです!そして今、これはhtmlページに表示されるものです:

u''文字の前に置くと、次のようになります。

何が起こっているのか教えてください。html ページに文字が表示されないのはなぜですか?

0 投票する
3 に答える
95462 参照

python - PythonでWindows-1252(cp1252)ファイルからテキストを正しく読み取る

タイトルが示唆しているように、私が抱えている問題は、Pythonでwindows-1252でエンコードされたファイルから入力を正しく読み取り、その入力をSQLAlchemy-MySqlテーブルに挿入することです。

現在のシステム設定:
ファイルを出力する「Roger Access Control System」を備えた Windows 7 VM。
「Python 2.7.3」を使用してファイルにアクセスできるように、Windows システムへの共有フォルダーを持つ Ubuntu 12.04 LTS VM。

実際の問題として、入力ファイルとして、Roger Access Control System (詳細については roger.pl) を介して Windows 7 システムで生成されるファイルを含む「VM 共有フォルダー」があります。このファイルは「 PREvents.csv」は、その内容に「;」を示唆しています。区切られたデータのリスト。

データのフォーマット例:

4 番目のフィールドにはカード所有者の名前が含まれ、5 番目には所有者の姓が含まれ、6 番目には所有者が割り当てられたグループが含まれます。

この問題は、上記の 3 つのフィールドのいずれかにラトビア語固有の文字が含まれる可能性があるという事実に起因します。例のファイルでは、「Jānis」という単語に文字「ā」が含まれており、Unicode では 257 です。

慣れているように、次のようにファイルを開きます。

これまでのところ、すべてが機能しています-ファイルが開かれるので、ファイルの各行を繰り返し処理します(これは継続的に実行されるスクリプトなので、ループを許してください):

そして、これが問題の始まりです。私が理解している限り、正しくないprint repr(firstname)出力が表示された場合u'J\xe2nis'、「\xe2\」はラトビア文字の「ā」を表していません。
イベントの種類に応じて、ループをさらに下って、変数を SQLAlchemy オブジェクトに割り当て、挿入/更新します。

答えを探す中で、使用するデフォルトのエンコーディングを定義する方法を見つけました。

それは私をまったく助けませんでした。

基本的に、これはすべて、ラトビア固有の文字が含まれている場合、所有者に割り当てられたグループ名だけでなく、正しい所有者の姓/名を挿入できないことにつながります。次に例を示します。

また、「PREvents.csv」ファイルのエンコーディングを変更することはできず、「RACS」システムは UTF-8 または Unicode ファイルへの挿入をサポートしていないことも付け加えたいと思います。ラトビア固有の文字。

他の情報が必要な場合は、今すぐお知らせください。喜んで提供します:)

どんな助けでも大歓迎です。

0 投票する
1 に答える
349 参照

sqlite - SQLite の UnicodeDecodeError

2 要素のタプルのリストを取得してテーブルに追加しようとしていSQLiteます。

タプルの最初の要素は文字列 ( でエンコードunicode utf-8) で、2 番目の要素はmurmurhash3 hashそのutf-8文字列の です。

これは違反行です: for result in

エラーはUnicodeDecodeError次のとおりです。

このエラーの原因は何ですか?

0 投票する
1 に答える
756 参照

python - Pythonでの英語以外のファイル名に対するファイル操作

この問題は私たちの多くが直面している可能性がありますが、私は Unicode の処理が苦手です。問題は次のとおりです。これはコード スニペットです。.exe ファイルを実行しようとして、ファイル パスが存在するかどうかを確認していますが、うまくいきません。

「パスが見つかりません」という結果が常に得られます。path.decode('utf-8'): を使用しようとしまし
たが、スクリプトはファイルパスを次のように読み取りました。

このファイル パスは存在しないため、else ブランチに移動します。

この Unicode の問題を処理するためのヒントと、cmd またはログ ファイルでファイル パスを表示するようにユーザーに表示できるかどうかを教えてください。

これが重複した投稿のように思われる場合は、お詫び申し上げます。

0 投票する
1 に答える
721 参照

regex - Pythonを使用してログファイルを解析し、sqliteを使用してデータベースに有効な値を保存する

こんにちは、python の初心者です。特定の Web サイトのロード ログ ファイルを解析し、有効なデータをデータベースの特定のフィールドに格納する小さなプログラムを作成しています。 (非 ASCII 文字 ' xe6')。

私もこの質問の解決策を適用しようとしました。 ユニコードをsqliteに挿入しますか? しかし、このコーデックはデコードできず、UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 84: character maps to を提供できません。