Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Мурад Нурмагомедов
@murad1986
MySQL, Startups, internet-marketing
Python
Парсинг
Как вытащить из php все кириллические символы?
Всем привет!
Имеется много php и html файлов с русскими текстом.
Необходимо вытащить все на русском в один упорядоченный файл.
Вопрос задан
более трёх лет назад
143 просмотра
Комментировать
Подписаться
1
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
2
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Рекурсивно пройтись по файлам, извлечь нужный контент через регулярку, предварительно удалив из него все теги.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Алексей Сергеев
@SergeevAI
Или использовать lxml, bs4, Scrappy, Grab.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+1 ещё
Простой
ИИ повторяет одно и то же несколько раз, как пофиксить?
2 подписчика
15 часов назад
163 просмотра
0
ответов
Python
+1 ещё
Простой
Что означает n0 k0 в алгоритме Kingdom Division hackerrank?
1 подписчик
18 часов назад
74 просмотра
1
ответ
Python
Простой
Как цикл for влияет на формирования списка?
1 подписчик
вчера
93 просмотра
1
ответ
Python
Простой
Как проверять кодом наличие конкретно той или иной библиотеки?
2 подписчика
вчера
259 просмотров
2
ответа
Парсинг
Средний
Эмуляция браузера в Docker в headless режиме для парсинга, какие есть варианты запустить полноценный браузер?
3 подписчика
12 мар.
607 просмотров
0
ответов
Python
+1 ещё
Средний
Как избавится от эффекта бандинга/постеризации градиента?
1 подписчик
12 мар.
120 просмотров
2
ответа
Python
+1 ещё
Простой
В чем ошибка при парсинге на python?
1 подписчик
11 мар.
203 просмотра
2
ответа
API
+1 ещё
Средний
Откуда брать информацию по лайв матчам Dota2 как у популярных сайтов?
3 подписчика
11 мар.
718 просмотров
0
ответов
Python
+2 ещё
Средний
Почему не все упоминания юзеров Telegram кликабельны?
1 подписчик
10 мар.
502 просмотра
2
ответа
Python
+2 ещё
Простой
Как анализировать востребованность технологии?
1 подписчик
10 мар.
127 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Старший Python разработчик/Senior Python developer
Платежное решение
•
Москва
До 300 000 ₽
Python developer
Greenway Global
•
Новосибирск
от 150 000 ₽
Руководитель группы разработки Python/Tech Lead Python
Платежное решение
•
Москва
До 500 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама