やりたいこと:シンプルな HTML DOM を使用してページからすべてのリンクをスケープし、完全なリンクを取得するように注意します (つまりhttp://
、アドレスの最後まで)。
私の問題:/wiki/Cell_wall
の代わりに のようなリンクが表示されますhttp://www.wikipedia.com/wiki/Cell_wall
。
その他の例: URL: をスクレイピングすると、 、 、 などのhttp://en.wikipedia.org/wiki/Leaf
リンクが取得されます。または、スクレイピングを行っている場合は、 のようなリンクを取得します。/wiki/Cataphyll
//en.wikipedia.org/
http://php.net/manual/en/function.strpos.php
function.strripos.php
実際の完全な URL を作成するために非常に多くの異なる手法を試しましたが、考えられるケースが非常に多く、すべてのベースをカバーする方法について完全に途方に暮れています。
しかし、以前にこの問題を抱えたことがある人はたくさんいると思います。
PSこの質問は、 local を処理するだけにほぼ縮小できると思いますhref
が、上記のように//en.wikipedia.org/
、完全なURLではなく、まだローカルではありません。