Задать вопрос

FewSeconds @FewSeconds

python

Python

Алгоритм вместо текста тега съедает внутренние теги?

Здравствуйте. Имеется следующий алгоритм:

from bs4 import BeautifulSoup
from word2word import Word2word
from tqdm import tqdm
import nltk

tr = Word2word("en", "ru")
soup = BeautifulSoup(html, "lxml")

for tag in tqdm(soup.find_all()):
    if tag.string:
        try:
            batch = nltk.word_tokenize(tag.string) # разделяем строку на слова

            # переводим каждое слово, составляя полноценное предложение, и вписываем в тег
            str_to_paste = ""
            for i in batch:
                str_to_paste += tr(i)[0] + " "
            tag.string = str_to_paste
        except:
            continue

with open("index.html", "w", encoding = "utf-8") as file:
    file.write(soup.prettify())

Проблема в том, что он съедает теги ссылок, в которых и должен быть текст.

Пример оригинальной html страницы(до перевода):
https://jsfiddle.net/7hnm2kwq/

Пример переведенной страницы html(после перевода):
https://jsfiddle.net/5ubnqw9L/

Вопрос задан более трёх лет назад
57 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Как вывести время в шаблоне Django в соответствии часовым поясом?
- 1 подписчик
- 5 часов назад
- 54 просмотра
2

ответа
Python

Простой
Как вставить переменную в re.sub?
- 1 подписчик
- 11 часов назад
- 74 просмотра
1

ответ
Python

+2 ещё

Средний
Почему не отображается inline keyboard при редактировании сообщения?
- 1 подписчик
- вчера
- 474 просмотра
1

ответ
Python

+2 ещё

Средний
Из-за ошибки текстовый файлик занимает всё свободное место на носителе, как это исправить?
- 1 подписчик
- 01 июл.
- 433 просмотра
2

ответа
Python

+1 ещё

Простой
Критерии поиска грамотного специалиста для кроссплатформенного проекта?
- 1 подписчик
- 01 июл.
- 193 просмотра
5

ответов
Python

+1 ещё

Простой
Как искать primary в реплике Монги?
- 1 подписчик
- 28 июн.
- 90 просмотров
0

ответов
Python

+1 ещё

Простой
Есть ли способ, получать прямые ссылки на видео VK для скачивания на Python?
- 1 подписчик
- 25 июн.
- 255 просмотров
1

ответ
Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- 23 июн.
- 280 просмотров
2

ответа
Python

Простой
Как исправить игнорирование кода при импорте в python?
- 1 подписчик
- 23 июн.
- 160 просмотров
1

ответ
Python

+2 ещё

Простой
Как проверить что файл подписан конкретной (открепленной) ЭЦП?
- 1 подписчик
- 23 июн.
- 178 просмотров
0

ответов
Показать ещё Загружается…

Python разработчик

ITK academy • Саратов

от 75 000 ₽

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python разработчик

DevTeam.Space

от 1 500 до 3 000 $