I am writing a website crawler in php and I already have code that can extract all links from a site. A problem: sites use a combination of absolute and relative urls. Examples (http replaced with hxxp as I can't post hyperlinks):
hxxp :/ / site.com /
site.com
site.com / index.php
hxxp :/ / site.com / Merhaba / index.php
/ Merhaba / index.php
hxxp :/ / site2.com/index.php
site2.com/index.php
(Onlar göreli / mutlak varsa) bağlantıları üzerinde hiçbir kontrole sahip, ama ben onları takip etmek gerekiyor. Ben mutlak URL'ler içine tüm bu bağlantıları dönüştürmek gerekir. Ben bu php nasıl yapabilirim?