Авторизация на сайте с помощью GuzzleHttp
 
			Автоматическая авторизация на сайте может потребоваться в разных случаях. Например, вам необходимо собрать информацию о товарах с сайта, который доступен только авторизованным пользователям. В такой ситуации автоматизация поможет ускорить сбор необходимой информации.
Войти на сайт автоматически можно с помощью различных инструментов, одним из таких инструментов является библиотека GuzzleHttp. С помощью этой библиотеки можно осуществить авторизацию на сайте, загрузить файлы и много чего еще сделать.
Но прежде чем приступать к написанию скрипта, необходимо ознакомиться с тем как, работает сайт - какие запросы принимает и как авторизовывает посетителя. Используются лишь только cookies или еще какие-либо другие средства? Ответив на эти вопросы, можно двигаться дальше.
Сначала устанавливаем саму библиотеку GuzzleHttp:
composer require guzzlehttp/guzzle
Далее пишем скрипт следующего содержания, в котором описывается как войти на сайт, который для доступа, например, к специальным предложениям, использует авторизацию.
<?php
  require 'vendor/autoload.php'; // автозагрузчик
  
  use GuzzleHttp\Client; // подключаем библиотеку
  // создаем нового клиента
  $client = new Client([
    'base_uri' => 'https://какой-то-сайт.ru/', // базовый uri, от него и будем двигаться дальше
    'verify'  => false,                        // если сайт использует SSL, откючаем для предотвращения ошибок
        'allow_redirects' => false,            // запрещаем редиректы 
        'headers' => [                         // устанавливаем различные заголовки
            'User-Agent'   => 'Mozilla/5.0 (Linux 3.4; rv:64.0) Gecko/20100101 Firefox/15.0',
            'Accept'       => 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
            'Content-Type' => 'application/x-www-form-urlencoded' // кодирование данных формы, в такой кодировке
            браузер отсылает данные на сервер
        ]
  ]);
  
  /**
  * В метод request передается три параметра: 
  *
  *
  * 1. Методы GET, POST
  * 2. URL на который отправляются данные формы
  * 3. forms_params - значения логина и пароля
  */
  $login = $client -> request('POST','/login.html',[
    'form_params' => [
      'login'    => 'VasyaPupkin',
      'password' => 'SuperPuperParol'
    ]
  ]);
  print($login -> getStatusCode());                   // статус код, если 200 или 302, то все норм, хотя не всегда)))  
  $cookie   = $login  -> getHeaderLine('Set-Cookie'); // обязательно вытаскиваем cookies из запроса, без них ничего не сработает
  
  $discounts = $client -> request('GET','secret/discounts.html',[
    'headers' => [
        'Cookie' => $cookie
    ],
    /*'debug' => true*/ // если захотите посмотреть что-же отправляет ваш скрипт, расскоментируйте
  ]);
  //print $articles -> getStatusCode();
  // html код страницы со скидками, например
  $body = $articles -> getBody() -> getContents();
Скрипт выше хорошо комментирован, но я отмечу пару важных моментов. После авторизации на сайте, вы можете выполнять любые запросы, используя метод request, главное передать в него правильные заголовки через массив headers. Если что-то пойдет не так, то используйте параметр debug для отображения того, что отправляется в данный момент.
Таким образом, с помощью библиотеки GuzzleHttp можно выполнять как простые так и весьма сложные Http запросы.
- 
					Создано 23.04.2019 08:34:30  
- 
					 Михаил Русаков Михаил Русаков
 
			 
			 
		 
				 
			 
				 
				 
				 
				
Комментарии (1):
вместо $articles д.б. $discounts
Ответить
Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.