2

外部 Web ページ用に個別の URL を保存する必要がある

URL をデータベースに入れる必要があります。同じページを 2 回保存したくないので、URL から綿毛をすべて取り除く必要があります。

# if I have
url_1 = "http://scientificamerican.com/royal-baby/?utm_campaign=promo"

# and
url_2 = "http://scientificamerican.com/royal-baby/?utm_source=email"

# then they should map to:
url_canonical = "http://scientificamerican.com/royal-baby/"

...クエリパラメータを削除するだけでは簡単ではありません

内容に関係なく単一の正規 URL を取得するために、クエリ文字列を削除してみました。問題は、クエリ文字列を使用する CMS がまだ存在することです。

例えば

url_1 = "https://www.scientificamerican.com/article.cfm?id=obama-budget"

# strip the query string and it becomes
url_1 = "https://www.scientificamerican.com/article.cfm"

# which is obviously the same for all articles :(

ページの正規 URL を取得するための Rails ツールはありますか?

これは明らかに、多くの人々、特に検索エンジンが解決しなければならない問題です。ページのデータだけが残るように URL を減らすにはどうすればよいでしょうか。

4

1 に答える 1