А зачем такое делать на NoSQL? Тут реляционные базы вполне подходят.
Я бы вообще ограничился тремя таблицами:
1) сайт
2) товар вообще (по сути, там хранится только его id и наименование)
3) товар на конкретном сайте (тут хранится id товара, id сайта, цена, дата парсинга).