Python biedt verschillende manieren om bestanden van internet te downloaden. Dit kan via HTTP worden gedaan met behulp van het urllib-pakket of de verzoekenbibliotheek. Deze tutorial zal bespreken hoe deze bibliotheken te gebruiken om bestanden te downloaden van URL's met behulp van Python.
De verzoekenbibliotheek is een van de meest populaire bibliotheken in Python. Met verzoeken kunt u verzenden HTTP / 1.1-aanvragen zonder dat u handmatig tekenreeksen aan uw URL's hoeft toe te voegen of uw POST-gegevens kunt coderen.
Met de verzoekenbibliotheek kunt u veel functies uitvoeren, waaronder:
De eerste die je hoeft te doen is om de bibliotheek te installeren en het is zo simpel als:
pip install requests
Om te testen of de installatie succesvol is geweest, kun je een heel eenvoudige test uitvoeren in je python-interpreter door simpelweg te typen:
importeer verzoeken
Als de installatie succesvol is verlopen, zijn er geen fouten.
HTTP-verzoeken omvatten:
Verzoeken indienen is heel eenvoudig, zoals hieronder wordt geïllustreerd.
importverzoeken req = requests.get ("http://www.google.com")
Het bovenstaande commando krijgt de Google-webpagina en slaat de informatie op in dereq
variabel. We kunnen dan ook andere kenmerken krijgen.
Om bijvoorbeeld te weten of het ophalen van de Google-webpagina succesvol was, zullen we de statuscode opvragen.
importverzoeken req = requests.get ("http://www.google.com") req.status_code 200 # 200 betekent een succesvol verzoek
Wat als we het coderingstype van de Google-webpagina willen weten??
req.encoding ISO-8859-1
Misschien wilt u ook de inhoud van het antwoord weten.
req.text
Dit is slechts een ingekorte inhoud van het antwoord.
'