Доступ к Интернету Python с использованием Urllib.Request и urlopen()
Что такое urllib?
urllib — это модуль Python, который можно использовать для открытия URL-адресов. Он определяет функции и классы, помогающие в действиях с URL.
С помощью Python вы также можете получать доступ и извлекать данные из Интернета, такие как XML, HTML, JSON и т. д. Вы также можете использовать Python для работы с этими данными напрямую. В этом уроке мы увидим, как мы можем получать данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99, и мы собираемся получить доступ к этому URL-адресу видео с помощью Python, а также распечатать HTML-файл этого URL-адреса.
В этом уроке мы узнаем
- Как открыть URL с помощью Urllib
- Как читать HTML-файл для вашего URL-адреса в Python
Как открыть URL с помощью Urllib
Прежде чем мы запустим код для подключения к интернет-данным, нам нужно импортировать оператор для модуля библиотеки URL-адресов или «urllib».
- Импортировать urllib
- Определите свою основную функцию
- Объявите переменную webUrl
- Затем вызовите функцию urlopen в библиотеке URL-адресов.
- URL-адрес, который мы открываем, – учебник guru99 на YouTube.
- Далее мы напечатаем код результата
- Код результата извлекается путем вызова функции getcode для созданной нами переменной webUrl
- Мы собираемся преобразовать это в строку, чтобы ее можно было соединить с нашей строкой "код результата"
- Это будет обычный HTTP-код "200", указывающий на то, что HTTP-запрос успешно обработан.
Как получить URL-адрес формы HTML-файла в Python
Вы также можете прочитать файл HTML с помощью «функции чтения» в Python, и когда вы запустите код, файл HTML появится в консоли.
- Вызовите функцию чтения для переменной webURL
- Переменная чтения позволяет читать содержимое файлов данных
- Чтение всего содержимого URL в переменную с именем data
- Запустите код. Он распечатает данные в формате HTML.
Вот полный код
Пример Python 2
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Пример Python 3
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)
Python
- Использование SaaS и облака требует осторожного обращения с данными
- Ключевые слова и идентификаторы Python
- Оператор Python, отступы и комментарии
- Переменные Python, константы и литералы
- Типы данных Python
- Преобразование типов Python и приведение типов
- Ввод, вывод и импорт Python
- Глобальные, локальные и нелокальные переменные Python
- Управление каталогами и файлами Python
- Ошибки Python и встроенные исключения