外部 Web ページ用に個別の URL を保存する必要がある
URL をデータベースに入れる必要があります。同じページを 2 回保存したくないので、URL から綿毛をすべて取り除く必要があります。
# if I have
url_1 = "http://scientificamerican.com/royal-baby/?utm_campaign=promo"
# and
url_2 = "http://scientificamerican.com/royal-baby/?utm_source=email"
# then they should map to:
url_canonical = "http://scientificamerican.com/royal-baby/"
...クエリパラメータを削除するだけでは簡単ではありません
内容に関係なく単一の正規 URL を取得するために、クエリ文字列を削除してみました。問題は、クエリ文字列を使用する CMS がまだ存在することです。
例えば
url_1 = "https://www.scientificamerican.com/article.cfm?id=obama-budget"
# strip the query string and it becomes
url_1 = "https://www.scientificamerican.com/article.cfm"
# which is obviously the same for all articles :(
ページの正規 URL を取得するための Rails ツールはありますか?
これは明らかに、多くの人々、特に検索エンジンが解決しなければならない問題です。ページのデータだけが残るように URL を減らすにはどうすればよいでしょうか。