Hämta thepiratebay med cURL

June 22nd, 2014 | Posted by admin in How-to | Tips | Webbutveckling - (2 Comments)

Att hämta thepiratebay(.se) med cURL borde vara ganska lätt. Thepiratebay skickar tillbaka responsen till en request i gzip-format. Därför behöver man avkoda svaret för att se html-koden istället för gzip-kodningen. Detta gör man i requestheadern där man sätter Accept-Encoding till gzip. Alltså:

header_array[] = “Accept-Encoding: gzip”;
curl_setopt(CURLOPT_HTTPHEADER, $header_array);

Om detta inte funkar så kan man också testa att sätta CURLOPT_ENCODING till gzip. Alltså:

curl_setopt($ch, CURLOPT_ENCODING, “gzip”);

Nu kommer man få response-bodyn i vanlig html.