@kefaliya

Возможно ли получить базу данных имен людей для последующего парсинга?

Добрый день!

Требуется найти базу данных имен и отчеств людей России и СНГ (кириллица) и остального мира (латиница) для последующего парсинга и формирования на ее основе БД имен пользователей с последующей транслитерацией. Это нужно для реализации механизма автоматической транслитерации вводимых пользователями данных при регистрации.
Желательно, конечно, чтобы данные были из официальных источников (паспортные столы и т.д.)

Если нет готовых БД, то какие ресурсы лучше использовать для обработки и вытаскивания оттуда вышеуказанных данных? vk и facebook?

Уточните, пожалуйста, если кто-то сталкивался с подобными задачами.
  • Вопрос задан
  • 2392 просмотра
Пригласить эксперта
Ответы на вопрос 2
@azShoo
Лучше использовать уже реализованные механизмы транслитерации. Серьезно.
Ответ написан
@megastudio
Для вашей задачи прекрасно подходит написание отдельного парсера Facebook: тамтошний API не предоставляет возможностей свободного поиска по всей базе FB. Есть и готовые решения, которые уже написаны ручками другими товарищами. Нам доводилось использовать решения типа фб парсер, b2b-group.xyz, monoparser.com ... Скажу сразу, десктопные решения - это "кот в мешке", поскольку тут вам и проблемы со скоростью работы, возможная блокировка ip (нужно постоянно искать прокси). В общем, варианты использовать готовые решения есть, но крайне желательно брать по меньше на себя рутинной работы.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы