• Как обезопасить сеть и сервер?

    nill
    @nill
    Тут два решения. Первое, — полный отказ от wi-fi. Второй намного сложнее, это чудная настройка wi-fi c модификацией самого wep(вброс левых пакетов), PEAP авторизацией и полностью шифрованный трафик(openVPN). Естественно подсоединится с телефона будет невозможно.
    ps и запомните абсолютно любой wi-fi ломается умелыми руками с хорошей картой, желательно на prism2 =)
    Ответ написан
    3 комментария
  • Как обезопасить сеть и сервер?

    NanoDragon
    @NanoDragon
    Непонимаю в чем проблема Wi-Fi сети, я на Wifi вообще пароль не ставлю, зачем? Зачем парится с ключами и еще чем то там.
    Есть OpenVpn его и юзаем. Пусть снифят OpenVpn трафик мне не жалко.
    Ответ написан
    Комментировать
  • Помогите выбрать фотоаппарат

    @bondbig
    За такие деньги я бы уже рассматривал только зеркалки, например Canon EOS 550D
    Ответ написан
    8 комментариев
  • Ответственность поисковых систем и просто сайтов за статистику запросов

    @odmin4eg
    Я думаю это эффект от «флешмоба» который начался в Рунете

    Ответ написан
    Комментировать
  • Ограничение PHP SphinxAPI на поиск совпадений

    Посмотреть хелп по сфинксу — много ума надо.
    А вот написать вопрос видимо хватает :D

    Увеличивать надо не константу и не в файле sphinxapi.php а в вашем конфиге сфинкса

    www.sphinxsearch.com/docs/current.html#api-func-setlimits — хелп по SetLimits, в нем написано про max_matches
    www.sphinxsearch.com/docs/current.html#conf-max-matches

    Просто в конфиге выставляете нужное количество max_matches.
    Ответ написан
    1 комментарий
  • Подход (алгоритмы и тд) чтобы сделать поиск по параметрам как на Яндекс-маркете?

    Aleksey
    @Aleksey
    Советую обратить внимание на Apache Solr. Ключевая функциональность требуемая для такого ресурса — фасетная навигация. Apache Solr поддерживает различные фильтры/фасеты по числовым диапазонам (цены), датам, категориям/тэгам (множественные значения) и тд. Все фильтры кэшируются в памяти в ввиде битсетов. В дополнение ко всему отличный полнотекстовый поиск, подсказки правописания, возможность поиска схожих документов-товаров по описанию основанное на tf*idf которое дает высоко релевантные результаты, распределенный поиск, шардирование, репликацию и многое другое. Apache Solr используется весьма известными сайтами поиска товаров типа zappos, cnet и пр.
    Ответ написан
    Комментировать
  • Подход (алгоритмы и тд) чтобы сделать поиск по параметрам как на Яндекс-маркете?

    Вообще ваша задача как я понял это т.н. фасеточный поиск. en.wikipedia.org/wiki/Faceted_search
    Когда передо мной стояла такая проблема я решал ее таким образом: есть таблица «товаров», в которой все товары.
    Есть справочник «характеристик».
    Есть таблица в которой идут тройки id товара — id характеристики из справочника — значение
    Вся эта база индексируется сфинском. Далее делается примерно как описано в статье: habrahabr.ru/blogs/sphinx/64318/

    Т.е. сначала например пользователь делает поисковый запрос «телефоны samsung». Одним запросом к базе данных мы выводим все телефоны, а используя группировку по id характеристики получаем все характеристики, которые возможны для этих товаров: т.е. например диагональ экрана, операционная система, ну и потом выбираем для каждой характеристики возможные значения, подходящие под запрос. Благодаря мульти-запросам такой поиск работает довольно быстро.

    Потом соответственно пользователю предлагается выбрать характеристики из списка возможных. Ну и в общем то весь алгоритм. За разумное время реализуется, работает довольно быстро, с добавлением товаров в таблицу проблем нет.
    Ответ написан
    4 комментария
  • Выбор быстрейшего php фреймворка?

    dohlik
    @dohlik
    Не гонитесь за голыми цифрами. Надо искать оптимальную точку пересечения графика «удобство» с графиком «скорость». Можно сделать класс для генерация меню, который будет максимально быстро отрабатывать, но сделать шаг влево-вправо в нем нереально. А можно наоборот.

    Сами тесты вообще «в вакууме». Обратиться к БД можно прямым запросом, можно через конструктор запросов, а можно и ORM подкрутить. Скорость падает, но растет удобство.

    Я бы посоветовал поковыряться в основных фреймворках (не только быстрых, типа Kohana или YII, но и в монстрах типа ZF), дабы почерпнуть основные идеи, которые Вам покажутся действительно важными. В принципе, так сейчас строятся все новые фреймворки — как результат работы над ошибками других конкурентов.
    Ответ написан
    Комментировать
  • Выбор быстрейшего php фреймворка?

    AmdY
    @AmdY
    PHP и прочие вебштучки
    твоя главная ошибка — ты ориентируешься на абсолютные значения, а нужно интересоваться относительными цифрами. подключи к своему проекту что-то вроде pear.php.net/package/Benchmark/download,
    узнай цифры:
    1. Общее время
    2. Время отработки одного контроллера(экшина) C (включает MV)
    3. Время на запросы к БД (M)
    4. Время на обработку шаблона (V)
    смотри, что у тебя тянет больше времени и оптимизируй, не обращая внимания на абсолютные значения. Лучше, конечно, использовать xdebug для профайлинга.
    Но в любом случае, может получиться так, что тяжёдый фреймворк. при включённом кэше вдруг залетает, а лёгкий прибавит не много.
    Ответ написан
    4 комментария
  • Выбор быстрейшего php фреймворка?

    Ориентируйтесь на 10-50мс.
    Ответ написан
    Комментировать
  • Выбор быстрейшего php фреймворка?

    Horse
    @Horse
    От фреймворка не зависит. При отключенном каше — нужно лезьть в БД… Каждый фреймворк по своемому реализовывает разные фичи, и в зависимости от конкретной реализации проекта фреймоврки будут себя по разному вести и выдавть разные скорости… Тут не практичиски, а теоретичиски сравнивать нужно. Например, если фреймворк Х использует garbage collector, а фрейворк Y не использует — Y быстрее X.

    В общем, некоректный вопрос, я так думаю.
    Ответ написан
    Комментировать
  • как лучше организовать контейнер для хранения IP адресов (1-3Mb)

    outself
    @outself
    Для быстрого поиска, как индекс, можно использовать Фильтр Блума ( en.wikipedia.org/wiki/Bloom_filter )

    И Chrome использует фильтры Блума для предварительной оценки того, является ли веб-сайт вредоносным. На практике, — Компактное хранение миллиона адресов в ~ 18-ти мегабайтах.
    Ответ написан
    1 комментарий
  • как лучше организовать контейнер для хранения IP адресов (1-3Mb)

    @Dervish66
    Вряд ли найдется контейнер, который обеспечивал бы эффективный доступ к данным сразу по двум индексам. Зато вместо std::map можно использовать что угодно, например, сбалансированные деревья, тем более что код будет писаться на С. Главная идея моего предложения — разнести индексы и сами данные. Тогда издержки на поиск слотов, вставки слотов и апдейтов индексов можно постараться свести к минимуму.

    Вытеснение тоже реализуется довольно просто: по индексу времени доступа находим слот с самым минимальным значением времени доступа (самый давнишний) и заменяем в нем все поля. При этом, конечно, придется обновить оба индекса.

    Обновление индекса можно сделать через удаление индексной записи и добавление новой.
    Ответ написан
    5 комментариев
  • как лучше организовать контейнер для хранения IP адресов (1-3Mb)

    @Dervish66
    К одним и тем же данным Вам нужно обращаться двумя способами. Один способ — по IP, второй — по времени доступа. При этом необходимо чтобы поиск изменения в данных (смена IP в слоте данных и смена времени доступа) выполнялись быстро и эффективно.

    Я бы решал эту задачу отделив сами данные (массив слотов) от индексов, через которые нужно обращаться. Если брать реализацию на С++ то примерно вот так:

    // Описатель слота данных
    struct CDataItem {
        __int64 accessTime; // Любое представление времени
        DWORD ip;
        BYTE  userData [64];
    };
    
    // Индекс по IP
    std::map<DWORD, CDataItem *> ipIndex;
    
    // Индекс по времени доступа
    std::map<__int64, CDataItem *> accessIndex;
    
    // Память для хранения массива слотов
    CDataItem * dataArray = new CDataItem[32000];
    

    При этом, конечно, после каждого изменения (обновления) слота придется обновлять индексы.
    Ответ написан
    1 комментарий
  • Что эффективнее, в настройке сервера?

    alexxxst
    @alexxxst
    Что есть большая посещаемость? У битрикса есть отличное кеширование чего только можно и где только можно. На крайняк есть даже кеширование в статику.
    Ответ написан
    1 комментарий
  • Определение части речи слова?

    @lugansk
    Смотреть на суффиксы/окончания — не надёжно, сравните:
    скал (род. п.) — генерал — знал

    Эти слова относятся, к глаголам или к существительным?

    Думаю, варианта два: или подключить словарь со словоформами (напр. грамматический словарь Зализняка) и искать по нему (но омонимы и омофоны будут проблемой: стекло (сущ.) — стекло (гл., пр.в.) и т.д.), или же попытаться реализовать простейший синтаксический анализатор, но тут проблемой будет свободный порядок слов в русском.

    В любом случае, если нужна точность, просто это реализовать не получится.
    Ответ написан
    4 комментария
  • Оцените метод противостояния DDoS

    @bondbig
    а как планируете удалять из А-записей выключенные/недоступные станции?
    А вообще, ничего нового, так и работают многие системы-сервисы защиты от ДДоС, только не на десктопах, а по нескольким датацентрам в разных странах размазаны точки входа (размазывают либо средствами BGP, либо DNS, либо и тем и другим вместе), далее очищенный трафик передается защищаемому серверу либо внутри GRE-туннеля, либо проксируется. В итоге ботнет не знает айпи сервера, а только айпи антиддосеров.
    Ответ написан
    2 комментария
  • Хабр стоит $1млн или $10млн?

    Levsha
    @Levsha
    Эх, Рассея, родина слонов… AOL купил Techcrunch за $25 млн, у них только подписчиков RSS полтора миллиона, а читателей под все десять, наверное.

    Отсюда и плясать нужно, Хабр стоит порядка миллиона долларов, множитель 15-20 EBIDTA используют для быстрорастущих инновационных компаний, создающих новые рынки.

    Доход хабра наверняка переоценил топикстартер в несколько раз.
    Ответ написан
    1 комментарий
  • Где бы найти преподавателя по PHP?

    @kmike
    В программировании все меняется очень быстро, и если нет навыка самостоятельно разбираться в технологиях, в специальности делать просто нечего, т.к. знания будут устаревать влет. А получить такой навык можно одним способом — самостоятельно в этих технологиях разбираться. Не бегая на форум по каждому вопросу, кстати.

    Поэтому учиться лучше самому. Причем, что самое важное, учиться учиться.
    Ответ написан
    9 комментариев