Задать вопрос
@OlenaKarelina

Как выбрать или создать инструмент для извлечения логина, пароля, емейла из текстов разной структуры?

Нужно выбрать или создать инструмент для извлечения из текстов разной структуры (таких как парсинг Telegram-каналов, парсинг Twitter-страниц, слитые на хакерские форумы базы данных и прочее) логинов, паролей, емейлов.
Ясно, что можно использовать регулярные выражения. Но для текстов из разных источников регулярные выражения будут разными и при появлении нового источника нужно будет для него писать регулярное выражение. Стоит задача создать или найти такой метод искусственного интеллекта, которые бы распознавал и извлекал названную информацию из текстов разной структуры.
Напишите, пожалуйста, каковы подходы к решению такой задачи? А возможно, она уже решена в каком-то приложении...
  • Вопрос задан
  • 67 просмотров
Подписаться 1 Средний 2 комментария
Ответ пользователя Developer К ответам на вопрос (3)
samodum
@samodum
Какой вопрос - такой и ответ
Для начала дайте ссылки на примеры таких телеграм каналов с такой информацией, чтобы понимать с какими данными надо работать
Ответ написан