можно через базу организовать, пусть фиксируеются страницы которые в работе, паралельный скрипт может делать проверку на наличие в работе и пропускать.
то есть я бы разделил задачу на два этапа сбор информации о страницах которые нужно парсить и собственно парсинг этих страниц, в момент работы можно менять статус страницы READY, WORK,COMPLETE
соответственно параллельные скрипты должны получать страницы для парсинга в READY состоянии
хотя даже и добавил бы третий этап это получение данных страниц расположенных локально:
1. получение пула страниц
2. скачка страниц в локальное хранилище
3. извлечение информации из локальных страниц