Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
urasnevel
@urasnevel
Автоматизация обработки текста
Чем парсить текстыс сайта?
Всем привет, нужен парсер, который парсит тексты с сайтов, желательно бесплатный
Вопрос задан
более трёх лет назад
153 просмотра
4
комментария
Подписаться
1
Оценить
4
комментария
Facebook
Вконтакте
Twitter
landergate
@landergate
Для чего? Какую задачу Вы хотите им выполнить?
Что именно он должен делать на выходе?
Написано
более трёх лет назад
urasnevel
@urasnevel
Автор вопроса
landergate
: Нужно напарсить текстов с сайтов, чтобы тупо парсил по ссылке сайт, допустим ввожу сайт и он парсит статьи с него и сохраняет их в txt формат.
Написано
более трёх лет назад
landergate
@landergate
urasnevel
: А как это дальше будет использоваться?
Что именно с них нужно парсить? Ведь по умолчанию в них попадёт HTML-код страниц, полностью. Весь.
Какую задачу Вы им хотите решить?
Написано
более трёх лет назад
urasnevel
@urasnevel
Автор вопроса
landergate
: мне нужно чисто текстовка, без html кода, для дорвеев будет использоваться)
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
Dimonchik
@dimonchik2013
non progredi est regredi
scrapy
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Автоматизация обработки текста
Простой
Существует ли инструмент (система) автоматизации форматирования текста в docx по предопределенным правилам?
2 подписчика
05 авг.
172 просмотра
2
ответа
Нейронные сети
+1 ещё
Средний
Как автоматически создавать большие отчёты из множества docx файлов?
2 подписчика
18 апр.
453 просмотра
4
ответа
HTML
+2 ещё
Простой
Как выполнить ëфикацию без сторонних библиотек?
2 подписчика
28 февр.
700 просмотров
2
ответа
Автоматизация обработки текста
Простой
Какой код вбить, чтобы он склонял определëнное слово да ещë и повсеместно на странице/сайте?
2 подписчика
19 февр.
81 просмотр
2
ответа
Нейронные сети
+1 ещё
Средний
Как определить ключевые слова из текста?
1 подписчик
09 янв.
80 просмотров
2
ответа
Поисковая оптимизация
+4 ещё
Средний
Как заполнить таблицу excel?
1 подписчик
более года назад
236 просмотров
4
ответа
Автоматизация обработки текста
Простой
Динамическая + стачическая сортировка одновременно возможна?
1 подписчик
более года назад
63 просмотра
0
ответов
Регулярные выражения
+2 ещё
Простой
Как обрезать часть строки в Excel (Пример прикрепляю)?
2 подписчика
более года назад
220 просмотров
2
ответа
Python
+3 ещё
Средний
Какие существуют библиотеки Python для комплексной обработки текста, включая исправление ошибок и удаление лишних символов?
1 подписчик
более года назад
601 просмотр
1
ответ
Автоматизация обработки текста
+1 ещё
Сложный
Кто знает user-friendly инструмент для поиска по файлам с помощью языковых моделей (RAG)?
4 подписчика
более года назад
266 просмотров
2
ответа
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Fullstack developer (Next.js, Node.js, ИИ)
Пруфикс
от 130 000 ₽
Data Science
OneLink
от 150 000 до 170 000 ₽
ML-разработчик (Machine Learning)
DevTeam.Space
от 2 000 до 4 000 $
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама