[賢者への注意: 最後の編集にジャンプ]
次のような非常に単純な txt サイトマップ (sitemap.txt という名前) があります。
http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html
ウェブマスター ツールにロードすると、次のようになります。
サイトマップが HTML - サイトマップが HTML ページのように見えます。代わりに、サポートされているサイトマップ形式を使用してください
いくつかの代替手段 (www の有無など) を試しましたが、うまくいきませんでした。
誰でも手がかりはありますか?
どんな助けでも大歓迎です!
編集:
xml サイトマップを試してみたところ、同じエラーが発生したため、サーバーがすべてを HTML として提供しているように見えます (ceejayoz が正しく示唆しているように)。問題は...どうすればappspotサーバーをプレーンテキストとしてサーバーテキストに取得できますか?
編集:
わかりました-私はうんざりして、サイトマップを明示的にテキスト/プレーンとして提供するサーブレットを実装しました(現在、XMLとTXTの両方を試しています)。サーブレットを手動で呼び出してもすべて正常に動作しますが、それでも Sitemap is HTML を取得します。どこに頭をぶつければいいのかわからない!
編集: Firefox プラグインを使用して content-type を検証しようとしました - すべてが期待どおりに機能しているようです (人々が見られるように実際の URL を入れています):
http://wokheisandbox.appspot.com/sitemaps/sitemap.txt --> コンテンツ タイプ: text/plain http://wokheisandbox.appspot.com/sitemaps/sitemap.xml --> コンテンツ タイプ: application/xml
私のサーブレットで (text/plain を明示的に設定): http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT --> コンテンツ タイプ: text/plain http://wokheisandbox.appspot.com/wokhei/ serveSitemap?fileType=XML --> コンテンツ タイプ: テキスト/プレーン
ウェブマスター ツールから取得できるのは、まだ --> Sitemap is HTML のみです。
編集:
理由がわかったと思います --> Google ウェブマスター ツールに自分のサイトをhttp://mydomain.comとして登録しましたが、アプリはmydomain.com にマッピングされているhttp://myapp.appspot.comの appspot でホストされています. http://myapp.appspot.comを登録すると、すべて正常に動作します (サイトマップが検証済み)。
これは朗報ですが、mydomain.com をインデックスに登録したいので、理想的ではありません。克服する方法はありますか?