1

次の wget コマンドがあります。

wget --http-user='user' --http-password='password' --trust-server-names --quiet -r -p -k -E -e robots=off -P /Users/Sebastian/Desktop/test/ http://somedomain.com

これは、次のことを除いて、私がやりたいことすべてを行います。これから私の正規のリンクを書き換えます:

<link rel="canonical" href="http://somedomain.com/somedir/somedir/somedir/folder/" />

これに:

<link rel="canonical" href="index.html" />

正規リンクを書き換えプロセスから除外する方法はありますか?

4

1 に答える 1

0

その特定の URL だけで、URL が cannonical としてタグ付けされているかどうかを検出できますか? 解決策の 1 つは、これらのページをダウンロードしないことです。

別の解決策 - すべてをダウンロードするだけです。ここで説明されているように、これらのCannonicalマーク付きファイルを削除して書き換えるよりも。

于 2013-03-26T18:07:04.820 に答える