Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Аля
@anysofronova
Python
Где скачать дамп википедии, разделенный на предложения?
Где скачать дамп википедии разделенный на предложения, а не просто куча слов ,не разделенных по смыслу?
Я нашла только такой
Вопрос задан
более трёх лет назад
216 просмотров
7
комментариев
Подписаться
1
Простой
7
комментариев
Facebook
Вконтакте
Twitter
sim3x
@sim3x
Какой вариант скачан
https://dumps.wikimedia.org/
?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
https://dumps.wikimedia.org/ruwiki/20181120/
тот что на 3,4ГБ
Написано
более трёх лет назад
sim3x
@sim3x
Аня
, посмотрите простым редактором, а не в браузере
Там xml
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
, я пыталась его открыть и через браузер и через блокнот, он не открывается просто пустая вкладка, а когда пыталась открыть на ноуте, он начал произвольные перезагрузки, пока не удалила этот файл
Написано
более трёх лет назад
sim3x
@sim3x
Аня
,
Сколько у вас RAM? ssd?
Написано
более трёх лет назад
Аля
@anysofronova
Автор вопроса
sim3x
,
Написано
более трёх лет назад
Roman K
@deliro
Аня
, если хватает памяти — распарси через lxml. Если не хватает — через lxml.sax (
https://lxml.de/sax.html)
либо
https://lxml.de/parsing.html#iterparse-and-iterwalk
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Существуют ли сервисы: онлайн python editor для совместного использования?
1 подписчик
вчера
90 просмотров
2
ответа
Python
Простой
На каком языке пишут описание функций в Python?
1 подписчик
26 сент.
269 просмотров
3
ответа
Python
+2 ещё
Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
1 подписчик
23 сент.
236 просмотров
1
ответ
Python
Простой
Как парсить pdf-ки с вк с помощью Python?
1 подписчик
16 сент.
325 просмотров
1
ответ
Python
+1 ещё
Простой
Почему возникает синтаксическая ошибка: invalid decimal literal?
1 подписчик
15 сент.
171 просмотр
2
ответа
Python
+1 ещё
Простой
Почему модель обнаружения объектов YOLO работает медленно?
1 подписчик
14 сент.
192 просмотра
1
ответ
Python
Простой
Что можно улучшить или оптимизировать в коде, чтобы он не был таким длинным?
2 подписчика
10 сент.
438 просмотров
4
ответа
Python
+3 ещё
Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
1 подписчик
09 сент.
170 просмотров
0
ответов
Python
Простой
Как получить из URL имя страницы?
1 подписчик
08 сент.
199 просмотров
2
ответа
Python
+1 ещё
Простой
Почему у Python проблемы с форматированием?
1 подписчик
08 сент.
231 просмотр
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python developer
Digital Clouds
от 160 000 ₽
Python разработчик
Selecty
от 280 000 до 380 000 ₽
Python разработчик
ITK academy
•
Казань
от 75 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама