2 варианта:
1. написать парсер, например с использованием PHP Simple HTML DOM Parser
simplehtmldom.sourceforge.net
2. использовать десктопное ПО, например Content Downloader
sbfactory.ru/?p=600 эта прога просто настраивается, и может парсить сразу в БД или передавать результаты в Ваш php скрипт, который дальше будет решать что с ними делать.
Я бы для создания базы с нуля использовал 2-й способ, а для дальнейшего обновления 1-й.