Как выбрать или создать инструмент для извлечения логина, пароля, емейла из текстов разной структуры?
Нужно выбрать или создать инструмент для извлечения из текстов разной структуры (таких как парсинг Telegram-каналов, парсинг Twitter-страниц, слитые на хакерские форумы базы данных и прочее) логинов, паролей, емейлов.
Ясно, что можно использовать регулярные выражения. Но для текстов из разных источников регулярные выражения будут разными и при появлении нового источника нужно будет для него писать регулярное выражение. Стоит задача создать или найти такой метод искусственного интеллекта, которые бы распознавал и извлекал названную информацию из текстов разной структуры.
Напишите, пожалуйста, каковы подходы к решению такой задачи? А возможно, она уже решена в каком-то приложении...