• Есть ли аналог Drupal CMS/CMF на Python или JS?

    kshnkvn
    @kshnkvn
    yay ✌️ t.me/kshnkvn
    Не знаю, что там у Drupal, но на Python есть Wagtail и Django CMS.
    Ответ написан
    Комментировать
  • Есть ли книга «High Performance Python» на русском?

    @nirvimel
    Приветствую своих будущих конкурентов (и, возможно, заказчиков). Судя по описанию, сабж (почти каждый пункт в их списке) полностью соответствует моей специализации в последние несколько лет ("Solve large problems while using less RAM" - а на этой теме я вообще "собаку съел").
    Но даже по краткому описанию я могу заметить, что книга 2014 уже несколько устарела на сегодняшний день. Например, они упоминают мало кому известный Grasp, но нет совершенно ни слова о такой крутейшей технологии, как Numba, если только она не скрывается под этой фразой: "Use tools to compile Python down to machine code".
    И уж как скоро речь идет о performance, то нельзя было проходить мимо темы создания C/C++ расширений. Тем, кто профессионально занимается темой производительности, в любом случае придется столкнуться с этим рано или поздно.

    А пока вы ждете перевода, я постараюсь ответить на ваши вопросы по теме.
    Ответ написан
  • Актуальна ли техника BigPipe сегодня?

    afi13
    @afi13
    Модуль BigPipe войдет в ядро Drupal 8.1. Думаю, что вполне актуальный подход на сегодняшний день.
    Ответ написан
    Комментировать
  • Как вы строите архитектуру приложения?

    MarcusAurelius
    @MarcusAurelius
    автор Impress Application Server для Node.js
    Тут мой ответ по связанной теме: Как составить план проектирования проекта?
    А кроме того, хочу отметить, что начинать проект с дизайна (если Вы имеете в виду дизайн пользовательского интерфейса) это в большинстве случаев очень плохая практика. Проект нужно начинать с концепции, а потом переходить к информационной модели, потом к структурам данных (как в базе, так и в памяти) и уже потом только понятно, что на экране будет делаться. Исключение могут составлять игры, электронные книги, анимационные, интерактивные и подобные произведения, которые являются в большей степени произведением визуального искусства, чем программным продуктом. Из средств проектирования посмотрите разные реализации UML и RUP (Rational Unified Process), например Rational Rose. Вот, посмотрели, и понравилось - берите, а стало страшно - значит это Вам не нужно. Это для проектов крупных и очень крупных. Что точно нужно, так это уметь рисовать ER-диаграммы на бумажке карандашом, архитектуру модулей программной системы и железную инфраструктуру для развертывания. На большинство вопросов, которые Вы задаете, ответы можно дать только относительно конкретного проекта. Иногда нужны автоматизированные средства проектирования, иногда они не нужны и все можно сделать в уме и сэкономить время. Это очень зависит от задачи и опыта. Но что определенно, так не следует разводить лишней бюрократии,
    Ответ написан
    1 комментарий
  • Алгоритм по которому можно узнать цену на товар на любой страничке(html)?

    @tzps
    Если речь буквально о _любой_ странице, то боюсь эта задача не имеет простого решения, дающего приемлемый уровень ошибок.

    Этот класс задач называется Named Entity Recognition, и денежное значение является одним из общепринятых классов сущностей.

    Если же речь идёт о каком-то более узком поле для поиска, например определенный шаблон распространённого интернет-магазина, тогда можно обойтись и парсингом с регекспами. Но обычно таки это NER, со всеми его "прелестями".
    Ответ написан
    4 комментария
  • Существуют ли заочные курсы или стажировка по анализу данных на русском языке?

    @lPolar
    data scientist
    ИМХО, тут есть несколько аспектов:
    1. Как написал brainick , математический бэкграунд и английский в data science практически обязателен.
    Причин этому несколько: отсутствие хорошей литературы на русском языке (как по теории, так и по программированию), обилие английских терминов (lift/top/cross-validation и прочие), значение которых в переводной литературе порой объяснятся весьма туманно.
    2. Если говорить о конкретной литературе, которую стоит почитать, я бы выделил несколько уровней:
    Уровень 0
    1. Бизнес-аналитика - Паклин, Орешков (самое базовое и обзорное введение)
    2. Статистика/Тервер ( по мне, хороши книги Айвазяна/Мхитаряна)
    3. SQL - в обязательном порядке. Мне в свое время помогла книга "SQL для простых смертных"
    4. Изучаем Python - М. Лутц (наиболее полная книга по языку, все что нужно для data science здесь точно есть)
    5. Программируем коллективный разум (к слову сказать, вот в этой книге отличный перевод)
    Уровень 1
    1. Математические основы машинного обучения и прогнозирования - Вьюгин (книга сложная, без подготовки по учебникам НМУ на тему анализа и линейной алгебры лучше не подходить)
    2. Python for Data Analysis (pandas во всей красе, тут нечего добавить)
    3. Примеры и статьи по построению моделей в sklearn - на хабре в последнее время часто мелькают статьи на эту тему, там все достаточно хорошо расписано.
    Уровень 2
    1. Hadoop и иже с ним ("Hadoop в действии", "Programming Pig")
    2. Apache Spark - достаточно почитать описание Python API.
    Тут есть еще один момент - не стоит слишком привязываться к одному языку и фреймворку.
    Одна из неприятных проблем python+pandas+sklearn заключается в том, что эта связка слабо масштабируется - при 2-3-4 гб данных становится сложно разместить их в оперативной памяти. Я знаю про chunk-reading+partial_fit, но точность таких моделей оставляет желать лучшего.
    С другой стороны, если обрабатывать эти данные в pyspark, то теряется все удобство pandas.DataFrame и так далее. Отрасль data science быстро развивается и обрастает новыми технологиями, так что нужно все время держать руку на пульсе.
    UPD: в spark 1.3 появились DataFrame.
    Ответ написан
    4 комментария
  • Веб сервер с php/mysql на Android устроистве

    lampa
    @lampa
    А как насчет на раздаче стоять? И спать мешать не будет.
    Ответ написан
    Комментировать
  • Веб сервер с php/mysql на Android устроистве

    @bondbig
    Запустить полноценный линукс в chroot и там уже апач и все прелести. Но о производительности можно даже и не заикаться.
    Ответ написан
    Комментировать
  • Как сделать так, чтоб если в датацентр попадет молния, мой сайт не лежал в дауне уже третий день?

    Nastradamus
    @Nastradamus
    Можно так:

    1) Ставим или арендуем еще 1 сервер в другом дата-центре.
    2) Делаем зеркало сайта с помощью rsync + репликация DB. Настраиваем мониторинг за корректностью репликаций, делаем механизм автоматического восстановления репликации при сбое.
    3) Заводим DNS-запись с маленьким TTL.
    (подробней здесь: habrahabr.ru/blogs/personal/87144/ )

    При сбое, переключаем в DNS на другой сервер за считанные минуты.

    Метод топорный, но работает у меня. :)
    Ответ написан
    4 комментария
  • Как сделать так, чтоб если в датацентр попадет молния, мой сайт не лежал в дауне уже третий день?

    iscsi
    @iscsi
    Вам понадобится доступ к DNS-записям своего домена/ов и 4 инстанса ec2.
    1) Сделать по одному инстансу в каждом регионе доступном в EC2;
    2) В каждом инстансе установить haproxy и копию сайта;
    3) Создать для каждого домена А запись с адресом инстанса;
    4) Настроить haproxy таким образом, чтобы каждый запрос отправлялся согласно выбранной стратегии на веб-сервер одного из 3-х оставшихся инстансов;
    5) Наслаждаться результатом и получать доход.
    Ответ написан
    3 комментария
  • Как сделать так, чтоб если в датацентр попадет молния, мой сайт не лежал в дауне уже третий день?

    rdolgov
    @rdolgov
    Держать кластер из серверов в 2х датацентрах, желательно в разных городах(например мск и питер).
    Если один датацентр «ложится», то все серваки мигрируют автоматически во 2ой. vmware vsphere — умеет на ура.
    Ответ написан
    1 комментарий
  • Как работает новый аудио плеер вконтакте?

    sajgak
    @sajgak
    про histrory.pushState почитайте. Это в плане того, что адрес полностью меняется. В остальном — все как в ответе viperet
    Ответ написан
    2 комментария