@Astrologer Вам просто нужно правильно построить процесс. Обязательный созвон по скайпу каждый рабочий день в 10:00. Разрабочик говорит вам, что он сделал за предыдущий день, что собирается сделать за сегодня. Рассказывает о проблемах которые возникли. Вы расставляете приоритеты, контролируете качество исполнения. Частые релизы, 3–5 релизов в неделю. Зарплата дважды в месяц, во вторую неделю 30% от все суммы, в конце месяца остальные. Проблема вот в чем, если вы платите ему такую сумму, то у него может возникнуть желание подработать на стороне. Поэтому важен ежедневный контроль выполенения заданий. Даже если ваш инженер занимается другими делами, вы хоть будете чувстовать прогресс.
С удаленкой все ОК, прото вы не сможете за такие деньги нанять адекватного сотрудника. Отсюда и проблемы. Лучше подкопите денег и наймите сотрудника с опытом удаленной работы, 2500–3000, это и будет его цена.
Все действия пользователя элементарно эмитируются. Включая onMouseOver. «Индивидуальным» его можно назвать с большой натяжкой, по сути нужно просто поменять одну строчку кода с селектором и обработчиком. Так что если кто-то захочет заскрейпить мейлы конкретно у вас, то настроить скрейпер, это минута дела.
Есть очень хитрые варианты, когда невозможно указать конкретный селектор, например, это характерно для вэб-приложений на GWT. Тогда надо указать порядковый номер элемента. В любом случае, xpath решает все.
Второй метод, это попытатся отследить изменения координатов курсора. Раньше работал нормально, теперь пришли планшеты и на это нельзя закладываться.
В общем, делайте как гугл, видно часть мейла, пользователь нажимает, видит капчу, вводит и скрипт по ajax загружает весь.
Я пользуюсь другой комбинацией: или nginx + unicorn, или nginx + puma. С passenger'ом я, к сожалению, не сталкивался. Могу предложить вариант спрятать все в vendor/bundle . Сделайте для этого так: bundle install --path vendor/bundle.
А не боитесь что медленно будет? Я просто сам отказался от хранения в GridFS из-за того, что напрямую отдать нельзя, приходится через что-то стримить. Нагрузка существенно возрастает, или вы еще кэшируете на nginx'е?
Еще учтите, что для расчета стандартного отклонения вам надо использовать формулу для неполного набора данных (sample standard deviation, не знаю, как будет на русском). То же самое и для медианы, но тут я не уверен.
Это нужно смотреть по характеру данных. Среднее арифметическое не дает представления о распределении данных. Если у вас [11, 11, 13, 4, 2, 12], то среднее будет 8.833. Гораздо более удобная метрика, по моему, медиана, 11. А тут как раз приходит стандартное отклонение, позволяющее отбрасывать сомнительные данные.
Ничего, там все для этого есть и все очень логично. Поэтому легко проверить, есть или нет. Вообще позволить себе открытое API могут только уверенные в своей бизнес модели проекты. Уж точно не те, кто копирует древнейшие стартапы. Если API когда-то и появится, то это будет огрызок, с которым ничего и не сделать.
Вполне себе стоит. С техникой эппл, включая ноуты и рабочие станции, только самый положительный опыт, в отличии от Асусов, Сони и т.д. Но если бюджет поджимает, то конечно не стоит затягивать пояса.