Авторизация на сайте с помощью GuzzleHttp
Автоматическая авторизация на сайте может потребоваться в разных случаях. Например, вам необходимо собрать информацию о товарах с сайта, который доступен только авторизованным пользователям. В такой ситуации автоматизация поможет ускорить сбор необходимой информации.
Войти на сайт автоматически можно с помощью различных инструментов, одним из таких инструментов является библиотека GuzzleHttp. С помощью этой библиотеки можно осуществить авторизацию на сайте, загрузить файлы и много чего еще сделать.
Но прежде чем приступать к написанию скрипта, необходимо ознакомиться с тем как, работает сайт - какие запросы принимает и как авторизовывает посетителя. Используются лишь только cookies или еще какие-либо другие средства? Ответив на эти вопросы, можно двигаться дальше.
Сначала устанавливаем саму библиотеку GuzzleHttp:
composer require guzzlehttp/guzzle
Далее пишем скрипт следующего содержания, в котором описывается как войти на сайт, который для доступа, например, к специальным предложениям, использует авторизацию.
<?php
require 'vendor/autoload.php'; // автозагрузчик
use GuzzleHttp\Client; // подключаем библиотеку
// создаем нового клиента
$client = new Client([
'base_uri' => 'https://какой-то-сайт.ru/', // базовый uri, от него и будем двигаться дальше
'verify' => false, // если сайт использует SSL, откючаем для предотвращения ошибок
'allow_redirects' => false, // запрещаем редиректы
'headers' => [ // устанавливаем различные заголовки
'User-Agent' => 'Mozilla/5.0 (Linux 3.4; rv:64.0) Gecko/20100101 Firefox/15.0',
'Accept' => 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Content-Type' => 'application/x-www-form-urlencoded' // кодирование данных формы, в такой кодировке
браузер отсылает данные на сервер
]
]);
/**
* В метод request передается три параметра:
*
*
* 1. Методы GET, POST
* 2. URL на который отправляются данные формы
* 3. forms_params - значения логина и пароля
*/
$login = $client -> request('POST','/login.html',[
'form_params' => [
'login' => 'VasyaPupkin',
'password' => 'SuperPuperParol'
]
]);
print($login -> getStatusCode()); // статус код, если 200 или 302, то все норм, хотя не всегда)))
$cookie = $login -> getHeaderLine('Set-Cookie'); // обязательно вытаскиваем cookies из запроса, без них ничего не сработает
$discounts = $client -> request('GET','secret/discounts.html',[
'headers' => [
'Cookie' => $cookie
],
/*'debug' => true*/ // если захотите посмотреть что-же отправляет ваш скрипт, расскоментируйте
]);
//print $articles -> getStatusCode();
// html код страницы со скидками, например
$body = $articles -> getBody() -> getContents();
Скрипт выше хорошо комментирован, но я отмечу пару важных моментов. После авторизации на сайте, вы можете выполнять любые запросы, используя метод request, главное передать в него правильные заголовки через массив headers. Если что-то пойдет не так, то используйте параметр debug для отображения того, что отправляется в данный момент.
Таким образом, с помощью библиотеки GuzzleHttp можно выполнять как простые так и весьма сложные Http запросы.
-
- Михаил Русаков
Комментарии (1):
вместо $articles д.б. $discounts
Ответить
Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.