問題タブ [punycode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mod-rewrite - ドメイン名を Punycode ではなく元の IDN に書き換えるにはどうすればよいですか?
ラテン文字以外の IDN ドメイン名を購入しました。それは良いのですが、ドメイン名にアクセスすると、アドレスバーに実際のドメインではなくドメインのピュニコードが表示され、ユーザーが覚えにくいでしょう.
とにかく、ドメイン名をpunycodeではなく元のIDNに書き換えることはできますか?
例: IDN =افلاماونلاين.com
アドレスバーに表示されるpunycode =xn--mgbaaa1ksacgkcs1a.com
php - intl拡張子なしでphpで独自のpunycodeコンバーターを書くことは可能ですか?
拡張機能をインストールするためにリモートサーバーをそれほど制御することはできません。phpは5.3.8です。しかし、utf-8 文字列を pcre で分割できることに気付きました。
たとえば、次のようになります。preg_split('@@u','bücher',-1,PREG_SPLIT_NO_EMPTY);
与えます:Array ( [0] => b, [1] => ├╝, [2] => c, [3] => h, [4] => e, [5] => r )
または中国語の単語:中国/中华の場合:Array ( [0] => ńŞş, [1] => ňŤŻ, [2] => /, [3] => ńŞş, [4] => ňŹÄ )
(結果は非ユニコード表示によるものです)が、国際的な拡張子なしで文字列を分割できることは明らかでutf-8
あり、(私が思うに)文字コードを取得してそれらを計算してASCII URLを作成できるはずです。
delphi - Delphi: Punicode デコード
Punycode: Cyrillic domain nameでエンコードされた情報を見つけましたが、どうすれば元に戻すことができますか (キリル文字の Punycode)?
database-design - IDNA 変換されたドメイン名の最大長は?
まず最初に:
すべてのドメイン名を IDNA バージョンに変換した後、複数のドメインをデータベースに保存しています。データベース フィールドの最大長を定義できるように、そのような IDNA 変換されたドメイン名の最大長を知る必要があります。
既知の事実:
現在、ドメイン名 (サブドメインを含む) の最大文字数は 255 文字であることを知っています。
紛失した場所:
一見簡単ですが... これは、国際文字の通常の ASCII 文字 (UTF-8 エンコーディングと考えてください) を意味するのでしょうか?
例を挙げると、ドメイン「müller.de」は、「ü」がより多くのバイトを表す必要がある国際文字であることを無視すると、9 文字になります。「müller.de」の IDNA バージョンは「xn--mller-kva.de」で、16 文字です。これは、IDNA 変換されている場合とされていない場合の "if" によって、確実に最大長に違いがあることを示しています。
それらが意味する文字の種類に応じて、最大 255 文字は、国際文字バージョン、IDNA 変換バージョン、またはその両方になる可能性があります。
そして、それは私がそれを少し失ったところです...特に、すべてのドメインが正気であるとは限らず、「öüßüöäéèê.example.äöüßüöäéèê-äöüßüöäéèê.test.äöüßüöäéèê.com」のようなものであり、さらに悪いことに予想された。
したがって、「推測」や「最善を期待する」ことはできません。私は確かに知る必要があります...
質問は:
ドメイン名 (サブドメインを含む) の最大文字数は 255 文字であるという既知の事実に基づいて... IDNA 変換されたドメイン名の最大長は?
それとも、IDNA 変換バージョン (punycode) も 255 文字に制限されていることを意味していたのでしょうか (これは、IDNA 変換バージョンが 255 文字を尊重する必要があるため、国際/Unicode 文字を含むドメインの Unicode 表現の制限が実際にはより短いことを意味します)。限界)?
facebook-social-plugins - Punycode を使用した URL からの Box が好きですか?
http://www.facebook.com/pages/I-karriären/238394972905409?sk=wall この URL から Like Box を作成しようとしています。Facebook の開発者ページ:http://developers からコードを生成してみます。 facebook.com/docs/reference/plugins/like-box/ ですが、「指定されたページの ID を取得できませんでした。正しい href が渡されたことを確認してください。」というメッセージしか表示されません。また、punycode 形式の URL も試しました。http://www.facebook.com/pages/xn--I-karriren-w5a/238394972905409?sk=wall それでも同じメッセージが表示されます。何が間違っている可能性がありますか?個人のページではありません。
python - IDNA は往復しない
デコードできない IDNA でエンコードされた文字列がいくつかあります。Python では、u"xn--grohandel-shop-2fb".decode("idna")
「IDNA はラウンドトリップしません」というエラーが表示されます。についても同じです"xn--sottmqqo5-lgbe9b7no0hmz9u"
。
私は困惑しており、エラーをグーグルで調べてもまったく役に立ちません。
browser - ブラウザは、ドメインのみまたは URL 全体を punycode でエンコードしますか?
私は IDN ホモグラフ攻撃について読んでいましたが、ブラウザーが punycode のみのドメインでエンコードするか、URL の残りの部分 (パスとクエリ) が含まれているかについて正確に述べられていることがわかりませんでした。だから私の質問は、人気のあるブラウザー (FF、IE、Chrome、Safari、Opera) の 1 つが、残りの URL (正確には IRI) を punycode でエンコードすることですか?
url - IDN ドメインに「xn--」が表示されないようにする方法はありますか?
www.äöü.comなどのドメインを使用している場合、ユーザーのブラウザでwww.xn--4ca0bs.comとして表示されないようにする方法はありますか?
www.xn--4ca0bs.comなどのドメインは、平均的なインターネット ユーザーに多くの混乱を引き起こしていると思います。
php - ipv6 /punycode/外部ドメイン名も検証するための正規表現パターンの改善
私は現在、この正規表現パターンを使用して、ドメイン名をデータベースに追加する前に検証しています。
このパターンでは、サブドメイン、ipv4文字列などが許可されます。これはディレクトリ用であるため、通常は有効な文字列は許可されません。たとえばhttp://localhost
、とにかく、追加する必要があるのは、ipv6IP文字列と次のような国際ドメイン名のサポートです。たとえば、müller.com
私は現在使用しています:
また、ipv6アドレスと外部文字を除いて、検証したいほとんどすべてを検証します。
本当に私の一日になるので、誰かが2つの追加を思い付くことができるだろうかと思います。私はPHPに非常に慣れていないので、物事を私に投げつけないでください。代わりに、実際の例を見せて、追加したものを説明できれば、はるかに便利です。
たぶん、チェックする前に外国のものを有効なpunycode URLに変換し、代わりにpunycodeを許可する必要があります。私は提案を受け付けています。
どうもありがとうございました-あなたの助けは大歓迎です
編集:私は同様の解決策を探していないので、この質問が重複しているとは思えません。さらに、参照されている既存の解決策はうまくいきません。FILTER_VALIDATE_URLは、許可したくない文字列を許可し、他のソリューションでも正規表現パターンが役に立たなくなるため、機能しません。
私が探しているのは私が持っているものですが、さらにipv6IP文字列とpunycode名/国際名をサポートしています。
c# - c#を使用して、ちっぽけなコードからユニコードに変換しますか?
重複の可能性:
C# の Punycode コンバーター
C# を使用して、ちっぽけなコードを Unicodeに変換しようとしています。
「punycode.js」と呼ばれるこれとSOに関するこの質問を含むいくつかのjsに出くわしました。
しかし、私の要件は、C# を使用して同じことを行うことです。その理由は
私はWEB APIを作成しており、C#を使用してこの変換操作を行い、APIを介してデータを返す必要があります..だからJSはありません
これについてあなたの考えを共有してください。