<MyRusakov.ru />

Финансовая грамотность от А до Я

Финансовая грамотность от А до Я

Данный курс в кратчайшие сроки обучит Вас финансовой грамотности. Эти знания позволят Вам получить, как минимум, серьёзную финансовую стабильность, а, как максимум, финансовую независимость.

В рамках курса даётся большое количество практических заданий, благодаря которым Вы не просто посмотрите курс, а действительно выполните ряд важнейших шагов, о которых в нём говорится.

Помимо самого курса Вас ждёт ещё бесплатный ценный Бонус: «Ранний выход на пенсию». В рамках этого Бонуса Вы узнаете, какой должен быть капитал конкретно в Вашем случае, варианты его получения, а также какие есть стратегии вывода капитала на пенсии и где их можно протестировать.

Подробнее
Подписка

Подпишитесь на мой канал на YouTube, где я регулярно публикую новые видео.

YouTube Подписаться

Подписавшись по E-mail, Вы будете получать уведомления о новых статьях.

Подписка Подписаться

Добавляйтесь ко мне в друзья ВКонтакте! Отзывы о сайте и обо мне оставляйте в моей группе.

Мой аккаунт Мой аккаунт Моя группа
Опрос

Какая тема Вас интересует больше?

Как получить список статей с Python и bs4

Как получить список статей с Python и bs4

В сегодняшней статье мы рассмотрим способ получения списка статей, из определенной категории нашего сайта. Вот что нас интересует:


Изображение

Данный список хранится в html теге ul. Мы будем посылать запрос на страницу с помощью Python библиотеки requests. Далее мы получим ответ, который и будет обработан библиотекой bs4.

Для начала установим все необходимое.

pip install bs4

Также в зависимости от версии Python, может понадобиться установка модуля requests. В поздних версиях данный пакет встроен в компилятор.



# импортируем модули
import sys
from bs4 import BeautifulSoup
# встроенный модуль
import requests



# код для пользовательского ввода с консоли

# вводимая страница https://myrusakov.ru/python-tutorial.html
url = input("Введите адрес страницу")

# отправка запроса на сайт и получение ответа
page = requests.get(url)

# вывод статуса ответа
print(page)
#  <Response[200]>
# статус 200 говорит об успешном ответе


# вывод на экран кода страницы в символьном виде
print(page.content)


# далее используем модуль BeautifulSoup, который является удобным инструментом для обработки web страниц,
# в который мы передаем содержимое страницы в символьном виде, а также  параметр html.parser отвечающий # за парсинг 
soup = BeautifulSoup(page.content, "html.parser")

# далее выводим сам код страницы в формате html
print(soup.prettify())


# С помощью метода find_all находим названия всех статей внутри тега ul
title = soup.find_all("ul")

# в цикле методом get_text получаем текст без html кода и выводим его в консоль
for text in title:
  print(text.get_text())
  # далее записываем результат в файл 
with open("tt.txt", 'w') as f:
  for text in title:
    print(text.get_text(), file = f)

Запуск скрипта



>>>python get_article.py

# наш список будет выведен в консоль и записан в соответствующий  файл

Таким образом, мы получили список размещенных статей по темам языка c помощью Python и bs4 .

Копирование материалов разрешается только с указанием автора (Михаил Русаков) и индексируемой прямой ссылкой на сайт (http://myrusakov.ru)!

Добавляйтесь ко мне в друзья ВКонтакте: http://vk.com/myrusakov.
Если Вы хотите дать оценку мне и моей работе, то напишите её в моей группе: http://vk.com/rusakovmy.

Если Вы не хотите пропустить новые материалы на сайте,
то Вы можете подписаться на обновления: Подписаться на обновления

Если у Вас остались какие-либо вопросы, либо у Вас есть желание высказаться по поводу этой статьи, то Вы можете оставить свой комментарий внизу страницы.

Порекомендуйте эту статью друзьям:

Если Вам понравился сайт, то разместите ссылку на него (у себя на сайте, на форуме, в контакте):

  1. Кнопка:

    Она выглядит вот так: Как создать свой сайт

  2. Текстовая ссылка:

    Она выглядит вот так: Как создать свой сайт

  3. BB-код ссылки для форумов (например, можете поставить её в подписи):

Комментарии (0):

Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.