問題タブ [non-ascii-characters]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - 表の列でASCII以外の文字が出現するたびに検索し、それを対応するHTMLに置き換えるmysqlクエリ
HTML 文字列を含む列があり、その中に ® や ™ などの文字が含まれています。そのようなすべての文字を HTML に相当するものに置き換えたいと思います。これは可能ですか?
java - Javaでの^ÛY、^ÛRなどの特殊文字の扱い
^ÛY、^ÛR などの特殊文字に遭遇した人はいますか?
Q1. これらの文字を含むファイルの ftp を実行するにはどうすればよいですか? AIX(biまたはascii)でftpを実行すると、文字が表示されないため、これらを置き換えるプログラムが機能していることを確認できません。
Q2. ファイル内でこれらを明示的に (^ÛY, ^ÛR ) 検索しても、私の Java プログラムはこれらを認識しないか、置換しないようですが、正規表現を使用した置換は機能するようです (ファイルの長さの違いしかわかりません)。ストリング)。私のプログラムは AIX で実行されます。Javaがこれらを認識できない理由はありますか?
Q3. Oracle データベースはこれらの文字を認識しますか? プログラムが文字列の長さが短く、これらの文字がないことを示しているが、更新する文字列にこれらの文字が含まれているため、データベースが「列に対して値が大きすぎる」と不平を言う場合、更新が失敗します。
前もって感謝します、
RJ
doctrine - 非ASCII文字で検索可能なDoctrine
私はトルコ語のテキストを持っています:「selamgünaydın」。Doctrine searchableは、それをテーブル内のキーワードに変換します:-selam -guenaydin
したがって、「guenaydin」はキーワード「günaydın」としてテーブルに保存されたので、誰かが検索「günaydın」に書き込んでも何も得られません。どうすればよいですか。
python - Python で非 ASCII 文字を置き換えるヘルプ
Python で HTTPLIB2 パッケージを使用してダウンロードした HTML ファイルがたくさんあります。' ' は 'Â ' として表示されます。
Python'Â '
でをに置き換えるにはどうすればよいですか? ' '
どうもありがとう!
winforms - テキスト ファイル内の英語以外の英数字
C# WinForm アプリケーション
編集: 外国語の互換性について懸念があるようです。
これは問題ではありません。
私がこのユーティリティを作成しているカード ゲームは主に英語です。将来、私は他の言語をサポートするかもしれませんが、プログラムとゲームのルールの両方で主要なキーである英語の名前はすべてキーオフされます.
英語の名前とそれに続く翻訳されたテキストを含むテーブルを追加するだけで、すべて問題ありません。
.
私のプログラムの一部は、名前を含むテキスト ファイルから入力を読み取り、それを別の名前のリストと比較します。これらの名前には英語以外の文字が含まれている場合があり、特にアクセント付きの「o」と入力ファイルのラテン語の AE が含まれています。
このテキスト入力を名前と比較すると、英語以外の文字が問題を引き起こしています。ほとんどの場合、"[accented o]" -> "o" のように、これらの文字を英語の対応する文字でオーバーレイする方法を見つけたいと思います。
.
私は検索/置換テーブルをコーディングすることに完全に満足しています (問題の文字は 12 ~ 30 文字しかないと予想しています) が、いくつかの障害があります。
1) 検索/置換テーブル (「.cs」ファイル内) をハードコーディングすると、コンパイラが文字を好まないため、エラーが発生します。
誰かがこれを修正するためのトリックを知っていますか、またはこのプロセスの前に読み取られる検索/置換テキスト ファイルを作成する必要がありますか?
2) 文字を識別するのはイライラしますが、一致が見つからない場合にのみ置換ロジックに到達します。これは、英語以外の文字が原因で不一致が発生した場合、またはリストにまだ含まれていない場合に発生します。
これは 3 か月ごとにトリガーされる手動の更新プロセスであるため、一致しない各文字列の 1 文字ずつのチェックの非効率性についてはあまり心配していません。おそらく、1 文字の Bianary コード レベルまで下げるとうまくいくはずですが、うまくいきませんでした。
3) 前述の [AE] 文字は頻繁に使用されますが、他の文字のように置き換えるつもりはないので、少なくともプログラム内でこの文字を使用できるようにするとよいでしょう。[AE] 文字を問題なくデータベースにロードしました。また、"Ae"、"AE"、および "[AE]" を使用した検索は SQL レベルで問題を引き起こさなかったので、その機能で問題ありません.
他の非英語文字の検索は直感的ではないというだけです.
.
では、私の問題があります。これは、実際には、深刻な問題というより厄介な問題です。それでも、どんな助けやアドバイスも大歓迎です。
java - Java (Groovy) LDAP 非 ASCII 文字
私は成功せずに自分のお尻をグーグルで調べてきました。だから私はここに来ました。誰かが私を助けてくれることを願っています! 私は Groovy を使用して LDAP 検索を行っていますが、人の名前に å、ä、または ö が含まれていると、たとえば Jens R√§fteg√•rd と表示されます。私はもう試した:
new String(attrs.get("name")?.get(0)?.getBytes(), "UTF-8")
そして試してみました:
def charsets = Charset.availableCharsets() charsets.each() { key, value -> value.aliases().each() { alias -> println new String(attrs.get("name")?.get(0) ?.getBytes()、エイリアス) } }
誰でも手がかりを得ましたか?
php - アクセント付き文字の置換php
アクセント記号付きの文字を通常の置換文字に置き換えようとしています。以下は私が現在行っていることです。
これは私に与えます:
上記のようric cantona
に、出力をにしたいと思いますeric cantona
。
誰かが私が間違っているところを手伝ってくれる?
java - Javaで「セクション文字」を正規表現で下書きする
テキスト ファイル内のすべての特殊文字を XML 解析可能な特殊文字に変換するために、一連の正規表現置換 (つまり、String.replaceAll 呼び出し) を実行しています。例えば:
「セクション文字」、つまりこの小さな波線を置き換えることでつまずきにぶつかりました: §
まず、vi で編集を行っているため、そこに文字を貼り付けることさえできず、標準または拡張 ascii のメンバーではありません。同じ理由で、正規表現で16進コードで指定することもできません。
この文字を正規表現の代替としてどのように指定しますか? または、立ち寄って、私が手動で行っている文字変換を行う関数がどこかに隠れていることを教えてくれれば、それもクールです。
php - 偽の非ASCII文字を削除するが、スペースと改行を保持する方法は?
ASCII以外の文字を含むテキストファイルがいくつかありますが、それらを削除したいのですが、書式設定文字は保持します。
私は試した
しかし、それは改行や他のフォーマットを取り除くように見え、ヘブライ語にも問題があり、それがこれを変換しました
משפטיםנוספיםמהמומחה。נסוותהנו!חגחנוכהשמח****************************************חדש--האפליקציההיחידהשאומרתלךמה מצבהסוללהשלך**バージョン1.1の新機能-専門家による講演!!! *
これに
1.4: "、..." "...""50..."。、。!****************************************-**バージョン1.1の新機能-エキスパート話します!!! *
php - 非ASCII文字をCSVファイルに印刷する
PHPを使用してCSVファイルを作成しようとしています。非ASCII文字を印刷するにはどうすればよいですか?