Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Аля
@anysofronova
Python
Где скачать дамп википедии, разделенный на предложения?
Где скачать дамп википедии разделенный на предложения, а не просто куча слов ,не разделенных по смыслу?
Я нашла только такой
Вопрос задан
более трёх лет назад
214 просмотров
7
комментариев
Подписаться
1
Простой
7
комментариев
Facebook
Вконтакте
Twitter
sim3x
@sim3x
Какой вариант скачан
https://dumps.wikimedia.org/
?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
https://dumps.wikimedia.org/ruwiki/20181120/
тот что на 3,4ГБ
Написано
более трёх лет назад
sim3x
@sim3x
Аня
, посмотрите простым редактором, а не в браузере
Там xml
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
, я пыталась его открыть и через браузер и через блокнот, он не открывается просто пустая вкладка, а когда пыталась открыть на ноуте, он начал произвольные перезагрузки, пока не удалила этот файл
Написано
более трёх лет назад
sim3x
@sim3x
Аня
,
Сколько у вас RAM? ssd?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
Написано
более трёх лет назад
Roman K
@deliro
Аня
, если хватает памяти — распарси через lxml. Если не хватает — через lxml.sax (
https://lxml.de/sax.html)
либо
https://lxml.de/parsing.html#iterparse-and-iterwalk
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+1 ещё
Простой
Как распарсить смешанный тип json-данных?
1 подписчик
вчера
134 просмотра
3
ответа
Python
+1 ещё
Средний
Как «На лету» добавить клик id в готовый апк, который будет скачиваться с сайта?
1 подписчик
вчера
96 просмотров
2
ответа
Python
+1 ещё
Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
1 подписчик
24 июл.
134 просмотра
0
ответов
Python
Простой
Почему не получается создать профиль в программе Dolphin{anty}?
1 подписчик
24 июл.
75 просмотров
1
ответ
Python
Простой
Как совместить два .pdf файла?
1 подписчик
22 июл.
227 просмотров
0
ответов
Python
+1 ещё
Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
1 подписчик
22 июл.
118 просмотров
1
ответ
Python
Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
1 подписчик
22 июл.
106 просмотров
0
ответов
Python
+1 ещё
Простой
Почему форма не по центру экрана, как исправить?
1 подписчик
22 июл.
92 просмотра
0
ответов
Python
Простой
Как исправить Python error module 'win32crypt' has no attribute 'CryptProtectData' [closed]?
1 подписчик
21 июл.
79 просмотров
0
ответов
Python
+1 ещё
Простой
Как торговать фьючерсами через API MEXC?
2 подписчика
19 июл.
407 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python разработчик
Bell Integrator
•
Москва
Разработчик Python
Bell Integrator
•
Москва
Python developer
deeplay
•
Москва
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама