Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Аля
@anysofronova
Python
Где скачать дамп википедии, разделенный на предложения?
Где скачать дамп википедии разделенный на предложения, а не просто куча слов ,не разделенных по смыслу?
Я нашла только такой
Вопрос задан
более трёх лет назад
215 просмотров
7
комментариев
Подписаться
1
Простой
7
комментариев
Facebook
Вконтакте
Twitter
sim3x
@sim3x
Какой вариант скачан
https://dumps.wikimedia.org/
?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
https://dumps.wikimedia.org/ruwiki/20181120/
тот что на 3,4ГБ
Написано
более трёх лет назад
sim3x
@sim3x
Аня
, посмотрите простым редактором, а не в браузере
Там xml
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
, я пыталась его открыть и через браузер и через блокнот, он не открывается просто пустая вкладка, а когда пыталась открыть на ноуте, он начал произвольные перезагрузки, пока не удалила этот файл
Написано
более трёх лет назад
sim3x
@sim3x
Аня
,
Сколько у вас RAM? ssd?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
Написано
более трёх лет назад
Roman K
@deliro
Аня
, если хватает памяти — распарси через lxml. Если не хватает — через lxml.sax (
https://lxml.de/sax.html)
либо
https://lxml.de/parsing.html#iterparse-and-iterwalk
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
KRAKEN | Список Рабочих и Актуальных Ссылок и Зеркал на 2025 Год | Безопасный Доступ и Рекомендации по Входу в КРАКЕН?
1 подписчик
52 минуты назад
17 просмотров
0
ответов
Python
Простой
Рабочие ссылки на Кракен 2025: Полный список актуальных зеркал и полезные советы | ссылка переходник?
1 подписчик
54 минуты назад
17 просмотров
0
ответов
Python
+1 ещё
Простой
Что не так с моими асинхронными запросами?
1 подписчик
6 часов назад
67 просмотров
0
ответов
Python
Простой
Как в питоне генерировать (создавать+заполнять значениями по умолчанию) вложенный словарь так, чтобы вложенные элементы не были копиями друг друга?
1 подписчик
10 часов назад
89 просмотров
1
ответ
Python
+1 ещё
Простой
Из-за чего возникает ошибка неверный дескриптор?
1 подписчик
вчера
86 просмотров
1
ответ
Python
Простой
Непонимание ошибки yolo8?
1 подписчик
вчера
45 просмотров
0
ответов
Python
+1 ещё
Простой
Как грамотно изначально сделать телеграмм бота на Python с помощью aiogram чтобы выдерживал как минимум 10к пользователи и можно было масштабировать?
1 подписчик
18 авг.
184 просмотра
2
ответа
Python
Простой
Как сделать lock для двух асинхронных программ?
1 подписчик
18 авг.
122 просмотра
1
ответ
Python
+1 ещё
Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
нет подписчиков
16 авг.
133 просмотра
2
ответа
Python
+1 ещё
Простой
Как сделать экранирование символов в Python для SQL запроса?
1 подписчик
16 авг.
132 просмотра
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Ведущий Python разработчик
Сбер
•
Москва
от 200 000 до 250 000 ₽
Python Developer
Nomadic Soft
от 2 800 до 3 200 $
Python-разработчик (Senior)
BCraft
от 3 500 до 4 500 $
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама