Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Аля
@anysofronova
Python
Где скачать дамп википедии, разделенный на предложения?
Где скачать дамп википедии разделенный на предложения, а не просто куча слов ,не разделенных по смыслу?
Я нашла только такой
Вопрос задан
более трёх лет назад
210 просмотров
7
комментариев
Подписаться
1
Простой
7
комментариев
Facebook
Вконтакте
Twitter
sim3x
@sim3x
Какой вариант скачан
https://dumps.wikimedia.org/
?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
https://dumps.wikimedia.org/ruwiki/20181120/
тот что на 3,4ГБ
Написано
более трёх лет назад
sim3x
@sim3x
Аня
, посмотрите простым редактором, а не в браузере
Там xml
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
, я пыталась его открыть и через браузер и через блокнот, он не открывается просто пустая вкладка, а когда пыталась открыть на ноуте, он начал произвольные перезагрузки, пока не удалила этот файл
Написано
более трёх лет назад
sim3x
@sim3x
Аня
,
Сколько у вас RAM? ssd?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
Написано
более трёх лет назад
Roman K
@deliro
Аня
, если хватает памяти — распарси через lxml. Если не хватает — через lxml.sax (
https://lxml.de/sax.html)
либо
https://lxml.de/parsing.html#iterparse-and-iterwalk
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Почему после удаления Python не пропали 2 папки и как их удалить?
1 подписчик
8 часов назад
119 просмотров
1
ответ
Python
Простой
Куда надо устанавливать Python и его библиотеки?
1 подписчик
9 часов назад
144 просмотра
3
ответа
Python
Простой
Как создать task в __init__ asyncio?
1 подписчик
вчера
399 просмотров
1
ответ
Python
Простой
Какой способ эффективнее при объединении двух словарей?
нет подписчиков
06 мая
230 просмотров
1
ответ
Python
Простой
Автоматизация входа на устройство через Jumphost с целью передачи команд?
1 подписчик
06 мая
97 просмотров
1
ответ
Python
+1 ещё
Простой
В ffmpeg неправильно считывается имя пользователя, он видит в нем цифру и начинает ее раскладывать, как пофиксить?
1 подписчик
06 мая
131 просмотр
1
ответ
Python
+2 ещё
Средний
Бот долго отвечает сообщением, где фото+текст. Как исправить?
1 подписчик
05 мая
196 просмотров
1
ответ
Python
Простой
Как добавить в дату, записанную в строке, нули перед месяцем и днём?
1 подписчик
05 мая
175 просмотров
4
ответа
Python
Простой
Как завершить работу консольного приложения?
1 подписчик
04 мая
190 просмотров
1
ответ
Python
+1 ещё
Средний
В Coqui TTS есть поддержка русского языка для озвучки текста?
1 подписчик
04 мая
83 просмотра
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python-разработчик
BCraft
от 2 000 до 3 500 $
Python разработчик Senior
Туроператор «Русь»
•
Москва
от 200 000 до 300 000 ₽
Python разработчик
DevTeam.Space
•
Москва
от 1 500 до 3 000 $
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама