pqgg7nwkd4: phantom.js это тот же браузер, только в оперативке. Всё загрузится так, как есть на странице в обычном браузере. Если нужно что-то дополнительно - всегда можно заинъектить свои скрипты, стили и прочее и видоизменить страницу "налету".
jestev: В вашем случае я бы попробовал объяснить, что гугл не предоставляет инструментов для заведомой проверки медиа-контента на защиту авторскими правами и Вы не могли заранее знать, что нарушаете чьи-то права. Если такой инструмент где-то существует - пусть они явно на него укажут (если линк дадут - просьба поделиться со мной).
Затем, если они не идут на встречу при вашей попытке объяснить, что Вы более не будете нарушать (и верить Вам, что это было не умышленно) - Вам остаётся только платить за свои ошибки в прямом смысле слова. Т.е. создавать (и оплачивать) новый аккаунт разработчика и в нём уже стараться, по-возможности, не нарушать (что я тоже понимаю, что в большинстве своём, это как "гулять по минному полю" и думать, что всё прекрасно и ничего не произойдёт).
FlashHaos: Нужны параметры: скорость изменения данных на рабочей СХД (Мб/с) и скорость одного бэкап-потока (тоже, Мб/с). Тогда можно посчитать минимальный промежуток для дифференциального (пакетного) или дифференциально-пофайлового (сразу же по событию изменения одиночного файла, если есть такая возможность после вычислений).
Евгений Обыкновенный: не должны, т.к. обычно такое всегда есть (например, во всех соц.сетях и форумах). Рефреш - лучше не делать, т.к. это быстрее примут за дорвей.
FlashHaos: сначала полный (и раз в пол-года), затем периодические инкрементальные (по изменению или раз в N-часов) бэкапы не спасают?
Потоков - много, а скорость считывания с СХД - не упадёт при нескольких потоках? Иными словами: [кол-во потоков]*[скорость потока]*[размер в одном потоке]>[скорость одного потока]*[общий размер] ?
Разные цифры - это размеры каталогов?
NAS - на чем? (ПО, железо какое?)
kiberlain: не знаю... сравнение в лоб для поиска - слишком примитивно....
Я бы смотрел в сторону деревьев (для построения дерева тэгов), расстояния Хэмминга (для сравнения) и комплексного анализа (тэги+контент+синонимы+очепятки+фонемы).
Airat1995: ну как? делаете прокси, следите за парой пакетов во всём трафике (допустим Вы их распознавать научились, а остальные - Вам не нужны) и пишите их к себе в базу: начало игры, ники, кол-во очков и т.д. а сервер для поддержки игрового мира - используете официальный.
Помните была такая программа GameSpy для подключения к игровым серверам без запуска клиента игры, чтобы посмотреть есть ли с кем поиграть и т.д.