• Почему Яндекс не развивает свою облачную платформу?

    @khorpyakov Автор вопроса
    Яндекс ответил: kommersant.ru/doc/3030136
    Ответ написан
    Комментировать
  • Какой open source проект на node.js выбрать как эталон для архитектуры и стиля?

    MarcusAurelius
    @MarcusAurelius Куратор тега Node.js
    автор Impress Application Server для Node.js
    До этого поделайте лабы на nodeschool.io и у меня на https://github.com/HowProgrammingWorks
    Потом изучайте исходный код ноды для вникания в стиль: https://github.com/nodejs/node/tree/master/lib и уж потом проект.
    Ответ написан
    2 комментария
  • Файлы Python в один исполняемый?

    @Mingun
    Я в свое время отказался от py2exe, т.к. он создавал какую-то зависимость на DLL студии, и даже забирание указуемых DependencyWalker-ом файлов не помогало -- созданный экзешник не собирался запускаться, жалуясь на отсутствие этих DLL. Я использовал PyInstaller, он, к тому же, поддерживает 3-й питон и DependencyWalker не показывал каких-либо зависимостей.
    Ответ написан
    2 комментария
  • Каковы условия труда в современной игровой индустрии?

    @xabesawiv
    Каким боком С++ относится к игровой индустрии?

    На С++, Objective C и т.п. - пишут только базу, это могут позволить себе только богатые конторы, ну или специализирующиеся и упертые типа авторов Анреала.

    А подавляющее большинство - лабают на готовых движках.
    Там не нужно знать С++

    Переработки - дело добровольное. Никто с плетью не стоит. Деньгами заставляют работать....
    Ответ написан
    Комментировать
  • Почему LIMIT так сильно влияет на скорость?

    @AlikDex
    1) Проверьте селективность запроса (гугл в помощь).
    Вероятнее всего будет лучше сделать (т.к. компаний скорее всего меньше чем чеков):
    SELECT * FROM `warehouses_changes` WHERE (`company`=1) AND (`bill`=0)  ORDER BY `date` DESC LIMIT 20;


    2)Удалите текущий индекс, и для этого запроса сделайте:
    CREATE INDEX warehouses_changes_date_bill_company ON warehouses_changes (company, bill, date);

    И у вас запрос будет занимать меньше половины секунды. Возможно даже тысячные доли секунды.

    Подсказка: Индекс следует делать именно в том порядке, в котором делаете выборку данных. Т.е. первым параметром у вас стоят компании - следовательно в индексе должно стоять первым колонка company, потом чек и сортировка `date`.
    Ответ написан
    Комментировать
  • Как лучше хранить миллионы фоток в S3 (Selectel)?

    @spotifi
    Или аналогичная технология Cloud Storage в Clodo или Rackspace...

    Но вообще все эти технологии не любят когда их перегружают. Они устроены так, чтобы гарантировать другим пользователям доступ пока вы льете. Поэтому резервируют ресурсы под других и все вам не отдают.

    Никак вы это не обойдете.

    Даже если поднимете на выделенном сервере свое хранилище по их технологиям (Openstack Swift - это opensource, можно легко поднять, например, с помощью Ceph+Object Storage).

    Можете попробовать лить в несколько потоков. Это должно помочь с обходом резервирования на других пользователей.
    Можете лить несколько файлов в одном запросе. Для того же.

    Снимать копию нужно не внешними средствами, а через API этого cloud storage.

    Долгий list можно частично обхойти созданием подкаталогов:
    100/500/100500001.jpg
    100/500/100500002.jpg
    100/500/100500003.jpg
    ...
    100/501/100501001.jpg
    100/501/100501002.jpg
    100/501/100501003.jpg

    Это не сократит общее время. Но по крайне мере позволит разбить операции на отдельные атомарные (по каталожные) и выполнять их параллельно.

    Вот еще идея.
    Тут тоже предлагают использовать параллелность
    https://chris-lamb.co.uk/posts/uploading-large-num...
    Ответ написан
    Комментировать
  • Какие есть CDN с возможностью ресайза изображений?

    dimasmagadan
    @dimasmagadan
    не РФ
    cloudinary.com

    и ссылка с рефкой (дадут мне чуть трафика для бесплатного аккаунта)
    cloudinary.com/invites/lpov9zyyucivvxsnalc5/oxpagw...

    у них очень продвинутые возможности для работы с картинками
    Ответ написан
    1 комментарий
  • Какие есть CDN с возможностью ресайза изображений?

    zoonman
    @zoonman
    ⋆⋆⋆⋆⋆
    Напишите свой API, цена ему копеечная. Можно хотя бы этим воспользоваться:
    ruhighload.com/index.php/2009/04/22/%D0%BE%D1%82%D...

    Я бы разделил бакеты по размерам, тогда можно было бы легко управлять ресайзами и удалять неиспользуемые размеры.
    Ответ написан
    2 комментария
  • Django vs tastypie?

    @Keofaste
    Для api в django я пользуюсь REST framework
    Ответ написан
    Комментировать
  • Какую выбрать БД для больших объемов?

    @lega
    Складывайте в файлы по часам (например) - новый час - новый файл. Далее пакуйте.
    На timestamp можно отвести 2 байта (т.к. в пределах часа). Посмотрите может value можно уменьшить.
    Даже если на запись 16 байт, то современный HDD (150Mb/s) сможет сохранять ~9млн записей в сек (с вашими 30к справится)
    Останется только сделать тулзу которая будет по вашим условиям доставать данные.

    Файлы можно хранить на диске, можно в файловой БД, можно в GridFS которая будет шардить их по кластеру.
    Ответ написан
    3 комментария
  • Каким багажом знаний должен обладать go программист, чтобы суметь найти работу?

    Denormalization
    @Denormalization
    Пересмотрев кучу видео с конференций я заметил одну штуку...
    Кто бы не был докладчик (из яндекса, майла, баду и т.д) у всех примерно одинаковая история:
    - Нам нужно было написать (микро)сервис, мы выбрали GO. За выходные мы его освоили и запилили все что нам нужно, и это уже месяц\пол года\год работает в продакшине.

    Т.е по сути нужны не знания GO, а общие знания программирования.
    GO слишком молодой, и пока что нету какого-то "стека" который необходимо знать. Все пилят как умеют и что умеют.
    Ответ написан
    Комментировать
  • Почему в Elasticsearch неправильно ищутся некоторые слова?

    AlexXYZ
    @AlexXYZ
    O Keep Clear O
    Не совсем ответ, но есть форум, где осуждают проблемы с ES и морфологией в частности на русском (если существенно): https://discuss.elastic.co/c/in-your-native-tongue...

    И стоит посмотреть issue проекта этого плагина (больше закрытые, т.к. по открытым нет ответов):
    https://github.com/imotov/elasticsearch-analysis-m...
    cdc966297e6b49d98b84b76618bcfc7b.png

    Автор плагина Игорь Мотов, я ему задавал вопросы.
    У меня была близкая проблема при использовании wildcard, но оказалось, что это не проблема морфологии.
    Ответ написан
    Комментировать
  • Sphinx: Как изменить стандартный метод ранжирования?

    opium
    @opium
    Просто люблю качественно работать
    хранить названия для разных языков в разных полях и отдельно искать по ним и самому ранжировать.
    Ответ написан
    Комментировать
  • Какой подход (модель) выбрать для предсказания закупок лекарств?

    @balamut108
    Py
    Обратите внимание на алгоритмы машинного обучения: scikit-learn.org/stable/tutorial/machine_learning_...

    Для предсказания может быть использовано множество алгоритмов, банально можно начать с деревьев решений и случайного леса (scikit-learn.org/stable/modules/generated/sklearn.... Эти алгоритмы можно использовать без особой настройки и они не особо страдают от переобучения.
    Вот инструмент перебора вариантов (scikit-learn.org/stable/modules/generated/sklearn....

    Также есть программные средства: Weka и Orange.

    Библиотека для работы с данными Pandas.

    NumPy - как база научных вычислений.

    Ещё можно поставить Jupyter для наглядности.

    Будут вопросы пишите, контакты в профиле.

    Это Питоновский стек технологий, который при желании и должном таланте можно освоить самостоятельно.
    Ответ написан
    Комментировать
  • Легальный вывод с upwork - миф или реальность?

    @dmatora
    >И поэтому меня мучает вопрос - является ли схема с user agreement и инвойсами (хз что это) чисто белой или это полусерая схема, лишь бы хоть как-то обелить доходы перед налоговой?

    Налоговая как не интересовалась Вами пока Вы не платили налоги, так и не будет интересоваться, когда платить начнете. Особенно с 2016 по 2018 - пока действуют надзорные каникулы. Заинтересуется только когда будете закрывать ИП (если будете), и то, если последние три года вашей деятельности не будут состоять из нулевых деклараций.

    Даже когда заинтересуется, если сумма уплаченных налогов соответствует движению средств по счету, даже если у Вас вообще нету никаких документов объясняющий откуда деньги, максимум что Вам светит, это штраф 30 000, не чаще чем раз в квартал. Могут еще и нервы потрепать, но не по закону, а на правах любого недоброжелательного встречного, что в органах встречается все реже.

    Реальные проблемы у Вас будут (точнее могут быть) с валютным контролем банка с которым будете работать. У основной массы банков ориентированных на предпринимателей схема работы с Upwork отлажена. У модульбанка логотип Upwork - вообще на странице валютного контроля https://ext.modulbank.ru/?cityid=f27b4452-0f6f-e41...

    Банки требуют именно правильно оформленные публичную оферту и инвойсы. Некоторым банкам вместо инвойсов достаточно скриншотов, но при закрытии ИП скриншотами Вы не отделаетесь. Убедиться, что правильно оформленных инвойсов и публичной оферты Вам хватит для закрытия ИП - Вы можете заранее у своего налогового инспектора (не исключено, что именно Вам придется его просвещать и показывать соответствующие законы).

    К юристам обращаться бесполезно - даже лучшие из них в теме чаще всего плавают. Слишком редко им попадаются такие клиенты/вопросы и слишком много специфики в деятельности Upwork. Исключение - юристы специализирующиеся на внешнеэкономической электронной коммерции. Найдете такого, познакомьте меня с ним.

    Лучшие консультации Вам дадут сотрудники валютного контроля того же модульбанка или банка Точка. Чистота сделки в глазах контролирующих органов - одна из услуг которую они предоставляют.

    Если не готовы вручить свою судьбу валютному контролю банка, соберите в гугле ссылки на статьи по теме легализация oDesk|Upwork и перечитывайте по одной ссылке в день или неделю. То что раньше казалось спорным или китайской грамотой, через несколько недель или месяцев станет простым и очевидным.
    Ответ написан
    Комментировать
  • Реально ли создать стартап без бюджета в наше время?

    @Sjr
    Создать без бюджета можно/нельзя, только всё зависит от:
    1)Идея,к примеру онлайн конструктор-смузи и бионические протезы на основе искусственных материалов, которые лучше и мощнее чем природные "запчасти" это разные вещи
    2)Прототип: сайт вы сможете создать через пару месяцев, своими силами, а вот с протезами, как вы создадите прототип? Человечество ещё не дошло до таких технологий
    3)Распространение: Онлайн-стартапам легко, зашел на сайт и всё, а что делать тем, кто создаёт материальные вещи? Доставка, документы...
    4)Монетизация: На сайте можно выставить рекламу, ограничить доступ подпиской и т.п., а с материальными вещами лишь одно, ПРОДАЖА, хотя реклама на частях тела довольно интересна...
    5)Риски:Создал сайт, не взлетел (печальбеда), а что делать если вы создали огромный проект, как я помню в 80-90 годах создали сеть спутниковой телефонии, запустили в космос десятки спутников, но компания ........ все полимеры.
    6)Затраты для клиента помимо покупки и т.п., я услышал от одного человека, что какую бы проблему не решал стартап, клиенту всё равно нужно "помучатся" со стартапом, для сайта, зайти, выбрать и т.п., а что делать с протезами? Вряд ли каждый захочет ампутировать себе ноги
    7)Потребность которую решает проект: к примеру Instagram, я сначала подумал, как сервис по выкладыванию фоток стал таким популярным, но потом заметил, что с появлением таких проектов люди начали думать, что они кому-то нужны
    Ответ написан
    1 комментарий