да нет, все правильно сказано.
Если у вас быстрый проц(3Гц) то чисто по законам физики в противоположных углах проца будут РАЗНЫЕ тики.
Такие эффекты сложно предсказать и использовать.
Проблему частично решило удлинение конвееров.
берем новый коммент, разбиваем на шинглы, считаем хеши, записываем в базу
берем след коммент,...., ищем совпадения по базе
берем след коммент,..., находим два упоминания по базе, находим ссылку в блек листе хешей\шинглов, уничтожаем сразу 100 спамных комментария.
Эффект
— добавил три одинаковых коммента — загорается лампочка, еще три — все 6 стираем.
— добавил что-то про виагру — сразу в мусор
— добавляешь хитро, по синонимайзеру и шаблонизатору — через неделю все найдено и убито, так как шинглы с перекрытием
Эти методы отлично работают когда идет именно что активная роботизированная атака.
работает — студентов привлекает на ура.
Если задача технически интересна — то и аспирантов.
Сам участвовал в 4х похожий проектах — обычной работы еще не было, а поразвиваться и «приложить руки» хотелось.
добавлю сюда про базу данных — если не охота копаться в коде чтобы оптимизировать запросы и обертывать их в кеши ручками — можно использовать mysql proxy, который, в том числе, ускоряет работу когда в один момент времени производиться много однотипных операций( в других правда немного замедляет :) )
если я не ошибаюсь у пациента воспаление дисков.
У Вас как-то очень много система проца кушает. И расскажите немного о памяти — Мунин видит все 16, и реально там в пике используются все 4
никакой разницы нету. У вас просто после включения турбореактора отлетит полнотекстовый поиск. Эту проблему на прошлой недели уже мусолили — можно например сделать отображение на тригерах данных в другую таблицу на myisam для поиска делать, если уж со сфинксом не получиться
К сожалению у всех начинается рабочая неделя, и домашний роутер становиться не доступен.
Но этот момент я помню наизусть — на обоих концах RX: dropped packes +200\second. В TX ошибок нет