“canonicalization”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

8593 参照

java - ESAPI は不正な URL を正規化します

ユーザーからの URL を受け入れるアプリケーションがあります。このデータには検証が必要であり、この目的のために ESAPI を使用しています。ただし、アンパサンドを含む URL には苦労しています。

この問題は、検証前に ESAPI がデータを正規化するときに発生します。たとえば、URL の &pid=123 は πd=123 になります。π はホワイトリストに登録されていないため、検証は失敗します。

私はそれをエンコードしようとしましたが、ESAPI はそれよりも賢く、正規化を行って二重エンコードと混合エンコードを回避します。私はここで少し困惑しており、どうすればよいかわかりません。

2014-04-24T11:35:10.643

0 投票する

2 に答える

3671 参照

php - PHPで存在しないファイルの正規化されたパス(リアルパス)を取得するには?

script.php

いろいろ試してみましょう

くそっ！realpathファイルが存在しないため、false が返されます。

私が見たいの../nonexistent.txtは

PHPで相対パスの正規化されたパスを取得するにはどうすればよいですか?

注:シンボリックリンクパスの解決に関する質問をいくつか見ました。これらの質問への回答は、私の質問には当てはまりません。

php path canonicalization realpath

2014-05-11T04:41:38.367

0 投票する

1 に答える

1452 参照

amazon-web-services - AWS Canonical Request ヘッダーリストのより具体的なルールは?

ここにあるAWS のドキュメントには、多少紛らわしい、不完全な、または矛盾する情報が含まれているようです。それは次のように述べています

CanonicalHeaders は、リクエストヘッダーとその値のリストです。

これは、すべてのリクエストヘッダーを正規のリクエストに入れることを示唆しています。ただし、後で、彼らは述べています

CanonicalHeaders リストには、次のものが含まれている必要があります。

HTTP ホストヘッダー

Content-Type ヘッダーが要求に存在する場合は、CanonicalHeaders リストに追加する必要があります。

リクエストに含める予定の x-amz-* ヘッダーも追加する必要があります。たとえば、一時的なセキュリティ認証情報を使用している場合は、リクエストに x-amz-security-token を含めます。このヘッダーを CanonicalHeaders のリストに追加する必要があります。

OK、Content-Type および x-amz ヘッダーに関するビットは、実際にはすべてのヘッダーを使用しないことを示唆しています。したがって、おそらく、ヘッダー、ヘッダー、および任意のヘッダーのみを取得する必要があります。しかし、以下ではリクエストの例を示しているため、さらに混乱します。HostContent-Typex-amz-*

そして、それから作成された正規リクエストの例を次に示します。

Content-Typeしかし、これは以前の両方の解釈と矛盾しています: もし,Hostとx-amz-*ヘッダーしかないとしたら、rangeヘッダーはリストで何をしているのでしょうか? そして、すべてのヘッダーを取得することになっているのに、なぜヘッダーがリストにないのでしょうか?Date

少なくとも最小限のヘッダーが含まれている限り、正規のリクエストに入れるヘッダーのリストは任意ですか? 正確には、正規のリクエストヘッダーを作成するための決定的なルールセットは何ですか?

amazon-web-services canonicalization

2014-07-11T17:27:50.827

0 投票する

2 に答える

478 参照

java - BigDecimal の正規表現

BigDecimal任意の値を含むJava を正規の形式に縮小して、メソッドBigDecimalを使用して同じ数を表す 2 つの値が等しくなるようにする最も簡単な方法は何equals()ですか?

次のようなコードを使用して、任意の文字列から数値を解析しています。

( string1, string2) は任意であるため、たとえば ( "1", "1.0000") または ( "-32.5", "1981")...のようになります。

私が探しているのは、上記のアサーションが正規化するメソッドの最も単純な (最短/クリーンなコード) 実装です。

成功します...：

java math equals bigdecimal canonicalization

2014-10-13T20:51:44.217

0 投票する

6 に答える

2455 参照

graph - グラフの集合からの同型の棄却

同型を削除したい 15M (Million) DAG (有向非巡回グラフ - 実際には有向ハイパーキューブ) のコレクションがあります。これの一般的なアルゴリズムは何ですか? 各グラフはかなり小さく、N が 3 から 6 (今のところ) である次元 N のハイバーキューブであり、N=6 の場合にそれぞれ 64 ノードのグラフになります。

networkx と python を使用して、このように実装しました。これは、300k (千) のような小さなセットで問題なく機能します (数日で実行されます)。

それを行うより良い方法の 1 つは、各グラフを正規の順序に変換し、コレクションを並べ替えてから、重複を削除することです。これは、バイナリ is_isomophic() テストで 15M グラフのそれぞれをチェックすることをバイパスします。上記の実装は O(N!N) (同形時間を考慮していない) のようなものであると思いますが、すべてを標準的な順序に変換してソートする必要があります。変換のための O(N) + 検索のための O(log(N)N) + 重複の除去のための O(N)。O(N!N) >> O(log(N)N)

Canonical グラフのラベル付けに関するこの論文を見つけましたが、疑似コードではなく数式で非常に簡潔に説明されています。

tldr:バイナリ同形チェックでチェックするグラフがありえないほど大量にあります。これが行われる一般的な方法は、正規の順序付けによるものだと思います。パッケージ化されたアルゴリズム、または公開されている簡単に実装できるアルゴリズム (つまり、疑似コードを含む) はありますか?

graph canonicalization isomorphism

2014-11-12T17:50:08.363

0 投票する

1 に答える

524 参照

llvm - LLVM indvars パス

私は-indvarsLLVMでパスを使用しています。可能であれば、ループカウンターを0から開始させるということです。単純なループに使用しましたが、ループカウントを0から開始しません。なぜそうなのですか?

ループは

llvm llvm-clang llvm-ir canonicalization

2014-11-16T23:29:13.227

0 投票する

2 に答える

618 参照

google-api - Google セーフブラウジング API URL エンコーディング (正規化)

私のアプリケーションでは、ユーザーが入力した URL を Google に送信してマルウェアをチェックしています。

「マルウェアが見つかりました」という反応をテストするために、URL http://malware.testing.google.test/testing/malwareを使用しました

驚いたことに、この URL はマルウェアとしてマークされていませんでした

いじってみると、末尾にスラッシュを入力すると、マルウェアとして検出されることがわかりました。

ドキュメントには、URLを正規化する必要があると書かれています。

この要件の実装を知っている人はいますか? （できればC＃で）

google-api url-encoding canonicalization malware-detection

2014-11-21T14:42:24.787

0 投票する

1 に答える

423 参照

random - GUID に正規の形式が必要なのはなぜですか?

ある勤勉な日、通常の .NET の方法で生成したGUIDの 3 番目のブロックの先頭にGuid.NewGuid()同じ番号があることに気付きました。4

1秒間に1回、10個ほど画面に表示されていました。5 番目の GUID の直後にあるこのパターンに注目しました。最後に、最後のものには同じ 4 つのビットがあり、私は幸運な人だと判断しました。私は家に帰って、私のような特別な人のために全世界が開かれていると感じました. 翌週、私は新しい仕事を見つけ、部屋を掃除し、両親に電話をかけました。

しかし、今日また同じパターンに直面しました。千回。そして、私はもう選ばれし者を感じません。

私はそれをグーグルで検索しましたが、今ではUUIDversionと、4つの予約ビットと2つの予約ビットを持つ標準フォーマットについて知っていvariantます。

実験するスニペットを次に示します。

しかし、まだ理解できないことが 1 つあります (生きていく方法以外は)。なぜこれらの予約ビットが必要なのですか? それがどのように害を及ぼす可能性があるかはわかります-内部実装の詳細を公開し、衝突が増え（まだ心配する必要はありませんが、いつか...）、自殺が増えます-しかし、何の利益も見られません. 何か見つけるのを手伝ってくれませんか?

GUID 生成アルゴリズムの内部

random guid uuid bits canonicalization

2015-01-10T17:00:39.597

問題タブ [canonicalization]

Reference