Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
urasnevel
@urasnevel
Автоматизация обработки текста
Чем парсить текстыс сайта?
Всем привет, нужен парсер, который парсит тексты с сайтов, желательно бесплатный
Вопрос задан
более трёх лет назад
152 просмотра
4
комментария
Подписаться
1
Оценить
4
комментария
Facebook
Вконтакте
Twitter
landergate
@landergate
Для чего? Какую задачу Вы хотите им выполнить?
Что именно он должен делать на выходе?
Написано
более трёх лет назад
urasnevel
@urasnevel
Автор вопроса
landergate
: Нужно напарсить текстов с сайтов, чтобы тупо парсил по ссылке сайт, допустим ввожу сайт и он парсит статьи с него и сохраняет их в txt формат.
Написано
более трёх лет назад
landergate
@landergate
urasnevel
: А как это дальше будет использоваться?
Что именно с них нужно парсить? Ведь по умолчанию в них попадёт HTML-код страниц, полностью. Весь.
Какую задачу Вы им хотите решить?
Написано
более трёх лет назад
urasnevel
@urasnevel
Автор вопроса
landergate
: мне нужно чисто текстовка, без html кода, для дорвеев будет использоваться)
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
Dimonchik
@dimonchik2013
non progredi est regredi
scrapy
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
HTML
+2 ещё
Простой
Как выполнить ëфикацию без сторонних библиотек?
2 подписчика
28 февр.
683 просмотра
2
ответа
Автоматизация обработки текста
Простой
Какой код вбить, чтобы он склонял определëнное слово да ещë и повсеместно на странице/сайте?
2 подписчика
19 февр.
74 просмотра
2
ответа
Нейронные сети
+1 ещё
Средний
Как определить ключевые слова из текста?
1 подписчик
09 янв.
71 просмотр
2
ответа
Поисковая оптимизация
+4 ещё
Средний
Как заполнить таблицу excel?
1 подписчик
15 июл. 2024
214 просмотров
4
ответа
Автоматизация обработки текста
Простой
Динамическая + стачическая сортировка одновременно возможна?
1 подписчик
23 июн. 2024
60 просмотров
0
ответов
Регулярные выражения
+2 ещё
Простой
Как обрезать часть строки в Excel (Пример прикрепляю)?
2 подписчика
29 мая 2024
153 просмотра
2
ответа
Python
+3 ещё
Средний
Какие существуют библиотеки Python для комплексной обработки текста, включая исправление ошибок и удаление лишних символов?
1 подписчик
более года назад
433 просмотра
1
ответ
Автоматизация обработки текста
+1 ещё
Сложный
Кто знает user-friendly инструмент для поиска по файлам с помощью языковых моделей (RAG)?
4 подписчика
более года назад
233 просмотра
2
ответа
Автоматизация обработки текста
Простой
Как автоматизировать заполнение бланка docx, меняя лишь часть текста?
1 подписчик
более года назад
46 просмотров
2
ответа
Автоматизация обработки текста
Простой
Как быстро менять ссылки Django?
1 подписчик
более года назад
37 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Intern It-recruiter
Wanted.
•
Санкт-Петербург
До 120 000 ₽
Стажер в отдел IT-рекрутинга
Wanted.
•
Санкт-Петербург
от 80 000 до 150 000 ₽
Intern It-recruiter
Wanted.
от 60 000 до 120 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама