Обработать как текст сначала.
1. Найти все номера телефонов в тексте с помощью регулярок.
2. В найденных номерах найти номера которые встречаются более 1 раза.
3. Заменить в тексте номера телефонов которые встречаются более одного раза - дополненными окончанием типа '_{n}' где n- число по порядку.
4. Загрузить полученный дамп как json, и обрабатывать его уже дальше...