<MyRusakov.ru />

Профессия Web-разработчик

Профессия Web-разработчик

Этот комплект за 8 месяцев превратит Вас в Web-разработчика с нуля. Учиться достаточно 1 час в день.

Начнёте Вы с HTML, CSS и вёрстки сайтов. Потом перейдёте к программированию и JavaScript. Затем изучите PHP, MySQL, SQL, Python. Изучите Web-фреймворки Laravel и Django. Создадите 5 своих сайтов для портфолио.

Комплект содержит:

- 540 видеоуроков

- 110 часов видео

- 1205 заданий для закрепления материала из уроков

- 5 финальных тестов

- 7 сертификатов

- 12 Бонусных курсов

Подробнее
Подписка

Подпишитесь на мой канал на YouTube, где я регулярно публикую новые видео.

YouTube Подписаться

Подписавшись по E-mail, Вы будете получать уведомления о новых статьях.

Подписка Подписаться

Добавляйтесь ко мне в друзья ВКонтакте! Отзывы о сайте и обо мне оставляйте в моей группе.

Мой аккаунт Мой аккаунт Моя группа
Опрос

Какая тема Вас интересует больше?

Удаляем ненужные теги в тексте при помощи Python

Удаляем ненужные теги в тексте при помощи Python

Привет, друзья! В сегодняшней статье мы рассмотрим как удалить все внутренние HTML-теги из строки и оставить только внешние, например, сохранить тег p, но убрать все вложенные теги, такие как b, и другие. Это может понадобиться, если вы хотите очистить текст от форматирования или подготовить его к публикации в системе, где HTML не поддерживается.

Зачем это нужно?

Представьте ситуацию: вы получили HTML-текст из CMS, блога или API, и внутри абзаца есть разное форматирование — жирный, курсив, ссылки и т. д. Но вам нужен просто чистый текст внутри. Вручную это делать долго, а автоматизация с помощью Python позволяет быстро обработать любое количество строк.

Как это сделать?

Для удаления всех внутренних тегов мы можем воспользоваться двумя подходами:

  1. Через регулярные выражения (re)
  2. Через библиотеку BeautifulSoup

1. Удаление тегов с помощью модуля re

Этот способ подходит, если вам нужен быстрый результат и нет сложной вложенности тегов.

import re

html = '

Привет, друзья! Сегодня я расскажу вам, как работать с форматом JSON в Python. Это очень полезный навык, особенно если вы работаете с API, собираете данные из интернета или обмениваетесь информацией между разными системами.

'

# Удаляем все HTML-теги
cleaned_text = re.sub(r']+>', '', html)

# Оборачиваем обратно в


result = f'

{cleaned_text}

'

print(result)

Результат:

Привет, друзья! Сегодня я расскажу вам, как работать с форматом JSON в Python. Это очень полезный навык, особенно если вы работаете с API, собираете данные из интернета или обмениваетесь информацией между разными системами.

2. Использование BeautifulSoup

Если ваш HTML более сложный или содержит вложенные структуры, то лучше использовать библиотеку BeautifulSoup. Она аккуратно извлечёт текст из HTML и позволит сохранить нужные теги.

from bs4 import BeautifulSoup

html = '

Привет, друзья! Сегодня я расскажу вам, как работать с форматом JSON в Python. Это очень полезный навык, особенно если вы работаете с API, собираете данные из интернета или обмениваетесь информацией между разными системами.

'

soup = BeautifulSoup(html, 'html.parser')
text_only = soup.get_text()

result = f'

{text_only}

'
print(result)

Какой способ выбрать?

  • re — легче и быстрее для простых случаев.
  • BeautifulSoup — надежнее для сложных HTML-структур.

Если вы хотите научиться применять Python для решения повседневных задач, рекомендую пройти курс "Написание лайфхаков на Python". Там вы узнаете, как автоматизировать рутину, работать с файлами, парсить данные и многое другое!

Копирование материалов разрешается только с указанием автора (Михаил Русаков) и индексируемой прямой ссылкой на сайт (http://myrusakov.ru)!

Добавляйтесь ко мне в друзья ВКонтакте: http://vk.com/myrusakov.
Если Вы хотите дать оценку мне и моей работе, то напишите её в моей группе: http://vk.com/rusakovmy.

Если Вы не хотите пропустить новые материалы на сайте,
то Вы можете подписаться на обновления: Подписаться на обновления

Если у Вас остались какие-либо вопросы, либо у Вас есть желание высказаться по поводу этой статьи, то Вы можете оставить свой комментарий внизу страницы.

Порекомендуйте эту статью друзьям:

Если Вам понравился сайт, то разместите ссылку на него (у себя на сайте, на форуме, в контакте):

  1. Кнопка:

    Она выглядит вот так: Как создать свой сайт

  2. Текстовая ссылка:

    Она выглядит вот так: Как создать свой сайт

  3. BB-код ссылки для форумов (например, можете поставить её в подписи):

Комментарии (0):

Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.