В данной мной изначально формулировке вопроса, признаю ответ достаточно верным.
В реальности же я отказался от хранения данных прайсов в базе совсем. Будут только таблицы под метаданные, и для них я, пожалуй, заюзаю postgresql - он отлично справится. Промежуточное хранение организовал в файлах json, затем сразу индексация в solr.
raiboon: дело в том, что с постгрес я познакомился, начав работать с OpenStreetMap базой. это >8млн полигонов по России. так как выборки по ключу действительно "мгновенные", я всерьез рассматриваю postgresql в качестве кандидата. но к osm у меня никогда не было требований к пакетной вставке тысяч строк за раз - она используется по большей части на чтение.
так вот про индексы - изначальное заполнение базы osm происходило довольно недолго, а вот последующее перестроение индексов заняло несколько часов.
в связи с чем меня беспокоит вопрос - не будет ли с индексами проблем при частых (несколько пакетов по 10к в секунду) обновлениях.
хотя, если разбивать по пользователям - я смогу удалять ключи без проблем, и при этом даже полностью чистить таблицу перед записью. но в этом случае возникает вопрос - насколько большим может быть количество таблиц в постгресе, чтобы не возникало проблем.
более сложными выборками заниматься будет исключительно solr, так что да, уверен.
насколько медленнее получится? (это вторая часть вопроса) в постгресе, если взять для примера базу OSM, импорт больших данных делается без ключей, но я же не смогу удалять ключи при каждом импорте.
websocket поддерживается только современными браузерами. если это устраивает, то можно сделать демон на php, но все равно на nodejs проще будет. даже учитывая лучшее знание php.
тем, что яндекс webmaster.yandex.ru/microtest.xmlтребует минимум 1 адрес, а я хочу указать в формате location(schema.org/Place), чтобы указать photo(A photograph of this place.) и, возможно, map.
address (http://schema.org/PostalAddress) описывает же только почтовый адрес.
в смысле, сейчас я использую первый адрес как address, а остальные как location. но это не совсем верно, так как по сути они равнозначны и нет главного адреса
По вконтакте — там для вставки (iframe) нужно получить некий хеш, которого нет в ссылках. Чтобы получить хеш, нужно чтобы видео было в твоих записях, тогда можно достать его через веб-интерфейс.
Если знаете способ проще — тогда конечно, можно сделать.