Зачем обязательно дергать в xml?
Не проще написать парсер который выдерет нужную информацию с любого сайта через DOM?
А ее уже можно писать в xml/базу/куда_угодно.
PS описываю техническую реализацию, вопрос юридической чистоты полученных данных в данном случае не рассматривается.