114

クライアント用に代替サイトを展開していますが、クライアントはすべての古いページが 404 で終わることを望んでいません。古い URL 構造を維持することは、見苦しいため不可能でした。

そのため、要求されている古いページを探して、新しいページへの永続的なリダイレクトを行う 404 ハンドラーを作成しています。問題は、すべての古いページ URL のリストが必要なことです。

これを手動で行うこともできますが、ホームを指定しただけの相対 URL (例: http:/.../page/path ではなく /page/path) のリストを提供するアプリがあれば興味があります。ページ。クモのようですが、より深いページを見つけること以外はコンテンツを気にしません。

4

8 に答える 8

85

自分の質問に答えるつもりはありませんでしたが、サイトマップ ジェネレーターを実行することを考えただけです。最初に見つけたhttp://www.xml-sitemaps.comには、優れたテキスト出力があります。私のニーズにぴったりです。

于 2009-05-13T12:26:03.097 に答える
56

行うwget -r -l0 www.oldsite.com

次にfind www.oldsite.com、すべての URL を明らかにするだけだと思います。

または、404 リクエストごとにそのカスタムの not-found ページを提供するだけです! つまり、誰かが間違ったリンクを使用した場合、ページが見つからないことを伝え、サイトのコンテンツに関するいくつかのヒントを示すページが表示されます。

于 2009-05-13T12:28:39.690 に答える
24

これはサイトマップ ジェネレーターのリストです (サイトから URL のリストを取得できることは明らかです): http://code.google.com/p/sitemap-generators/wiki/SitemapGenerators

Web サイトマップ ジェネレーター

以下は、XML サイトマップ形式のファイルを生成または管理するツールへのリンクです。XML サイトマップ形式は、sitemaps.org で定義され、Ask、Google、Microsoft Live Search、Yahoo! などの検索エンジンでサポートされているオープン スタンダードです。通常、サイトマップ ファイルには、Web サイト上の URL のコレクションと、これらの URL のメタデータが含まれています。次のツールは通常、「Web タイプ」の XML サイトマップおよび URL リスト ファイルを生成します (一部のツールは他の形式をサポートする場合もあります)。

注: Google は、このサイトに掲載されているサードパーティ ソフトウェアの機能やセキュリティをテストまたは検証していません。ソフトウェアに関するご質問は、ソフトウェアの作成者にお問い合わせください。これらのツールをお楽しみください。

サーバー側プログラム

  • Enarion phpSitemapsNG (PHP)
  • Google サイトマップ ジェネレーター (Linux/Windows、32/64 ビット、オープンソース)
  • Outil en PHP (フランス語、PHP)
  • Perl サイトマップ ジェネレーター (Perl)
  • Python サイトマップ ジェネレーター (Python)
  • シンプルなサイトマップ (PHP)
  • SiteMap XML 動的サイトマップ ジェネレーター (PHP) $
  • OS/2 用のサイトマップ ジェネレーター (REXX スクリプト)
  • XML サイトマップ ジェネレーター (PHP) $

CMS およびその他のプラグイン:

  • ASP.NET - サイトマップ.Net
  • DotClear (スペイン語)
  • ドットクリア (2)
  • Drupal
  • e コマース テンプレート (PHP) $
  • e コマース テンプレート (PHP または ASP) $
  • ライフタイプ
  • MediaWiki サイトマップ ジェネレーター
  • mnoGoSearch
  • OSコマース
  • phpウェブサイト
  • プレーン
  • ラピッドウィーバー
  • テキストパターン
  • v速報
  • ウィッカ Wiki (PHP)
  • ワードプレス

ダウンロード可能なツール

  • GSiteCrawler (Windows)
  • GWebCrawler & Sitemap Creator (Windows)
  • G-Mapper (Windows)
  • Inspyder サイトマップ クリエーター (Windows) $
  • IntelliMapper (Windows) $
  • Microsys A1 サイトマップ ジェネレーター (Windows) $
  • Rage Google Sitemap Automator $ (OS-X)
  • Screaming Frog SEO Spider と Sitemap generator (Windows/Mac) $
  • サイトマップ Pro (Windows) $
  • サイトマップライター (Windows) $
  • DevIntelligence によるサイトマップ ジェネレーター (Windows)
  • Sorrowmans サイトマップ ツール (Windows)
  • TheSiteMapper (Windows) $
  • Vigos G サイトマップ (Windows)
  • ビジュアル SEO スタジオ (Windows)
  • WebDesignPros サイトマップ ジェネレーター (Java Webstart アプリケーション)
  • Weblight (Windows/Mac) $
  • WonderWebWare サイトマップ ジェネレーター (Windows)

オンラインジェネレーター/サービス

  • AuditMyPc.com サイトマップ ジェネレーター
  • AutoMapIt
  • 自動サイトマップ $
  • Enarion phpSitemapsNG
  • 無料のサイトマップ ジェネレーター
  • Neuroticweb.com サイトマップ ジェネレーター
  • ROR サイトマップ ジェネレーター
  • ScriptSocket サイトマップ ジェネレーター
  • SeoUtility Sitemap Generator (イタリア語)
  • サイトマップドキュメント
  • サイトマップパル
  • サイトマップ送信
  • Smart-IT-Consulting Google Sitemaps XML Validator
  • XML サイトマップ ジェネレーター
  • XML サイトマップ ジェネレーター

統合されたサイトマップ ジェネレーターを備えた CMS

  • コンクリート5

Google ニュース サイトマップ ジェネレーター 次のプラグインを使用すると、ニュース メディアは Google ニュース サイトマップ ファイルを更新できます。これは、ヘルプ センターで説明されている sitemaps.org プロトコルの変形です。サイトマップ ファイルの通常のプロパティに加えて、Google ニュース サイトマップを使用すると、発行者は発行するコンテンツの種類を記述したり、個々の記事のアクセス レベルを指定したりできます。Google ニュースの詳細については、ヘルプ センターとヘルプ フォーラムをご覧ください。

  • WordPress Googleニュースプラグイン

コード スニペット / ライブラリ

  • ASP スクリプト
  • Emacs Lisp スクリプト
  • Java ライブラリ
  • Perl スクリプト
  • PHP クラス
  • PHP ジェネレーター スクリプト

正当な理由でツールを追加または削除する必要があると思われる場合は、ウェブマスター ヘルプ フォーラムにコメントを残してください。

于 2012-01-31T20:32:35.423 に答える
3

したがって、理想的な世界では、サイト内のすべてのページに仕様を設定することになります。また、すべてのページをヒットしてテストできるテスト インフラストラクチャも用意します。

あなたはおそらく理想的な世界ではありません。なぜこれをしないのですか...?

  1. 既知の古い URL と新しい URL の間のマッピングを作成します。古い URL が表示されたらリダイレクトします。「このページは移動しました。新しい URL は XXX です。まもなくリダイレ​​クトされます」というメッセージを表示することを検討してみてください。

  2. マッピングがない場合は、「申し訳ありませんが、このページは移動しました。ホームページへのリンクです」というメッセージを提示し、必要に応じてリダイレクトします。

  3. すべてのリダイレクトをログに記録します - 特にマッピングのないもの。時間をかけて、重要なページのマッピングを追加します。

于 2009-05-13T12:28:00.567 に答える
3

スパイダーへのスイッチがあり、その出力を変更するため、Linuxボックスからのwgetも良いオプションかもしれません。

編集: wget は Windows でも利用できます: http://gnuwin32.sourceforge.net/packages/wget.htm

于 2009-05-13T12:28:23.187 に答える
1

ディスクからすべての html を読み取り、"a" 要素のすべての "href" 属性を出力するスパイダーを作成します (パーサーで実行できます)。どのリンクが特定のページに属しているかを覚えておいてください (これは MultiMap データ構造の一般的なタスクです)。この後、404 ハンドラーの入力として機能するマッピング ファイルを作成できます。

于 2009-05-13T12:27:13.157 に答える
1

私はオンラインのサイトマップ生成ツールをいくつでも調べます。個人的には、これ(Java ベース) を過去に使用したことがありますが、「サイトマップ ビルダー」を Google 検索すると、さまざまなオプションが見つかるはずです。

于 2009-05-13T12:29:22.187 に答える