• Мозгохранилище

    Только вот запускается он уже как слоупок.
    Ответ написан
    1 комментарий
  • Как подключится к MongoDB из Scala?

    xSkyFoXx
    @xSkyFoXx
    Ответ написан
    Комментировать
  • Производительность Scala vs Python

    ivnik
    @ivnik
    Мне кажется проблема производительности в xml парсере. Как выше уже спрашивали, используете DOM или SAX? Если критична производительность/большой объём xml-файлов, то стоит использовать SAX.

    А для ускорения scala программы, имеет смысл поиграться с параметрами jvm, например включить «AggressiveOpts»:

    Запускать так:

    $ JAVA_OPTS="-XX:+AggressiveOpts" scala parser.scala
    

    P.S. исходный код парсера на scala покажете?
    P.P.S. и ещё, для замера производительности желательно «прогреть» jvm, производительность при первом запуске сильно ниже чем спустя некоторое время, т.к. классы ещё не загружены класслоадером и горячие точки не скомпилированы в машинный код jit компилятором. Для более правильной оценки, сделайте «бесконечный» цикл, в котором запускайте парсер, и выводите в консоль время работы парсера, затем ждите некоторое время, пока это число не стабилизируется.
    P.P.P.S. Надеюсь время вы замеряете внутри программы (scala)?
    Ответ написан
    3 комментария
  • Задачи для обучения программированию?

    Ariman
    @Ariman
    Если свербит прикладное изучать, то лучше бы, на мой взгляд, перейти сразу к Java или C#.

    2D-игры наверняка воспримут с энтузиазмом, особенно после консоли — попробуйте коллективно писать несложную 2D игру типа каких-нибудь танков или двумерных стрелялок. Позволит отработать очень многие аспекты, включая и командную разработку.
    Ответ написан
    1 комментарий
  • Задачи для обучения программированию?

    TheHorse
    @TheHorse
    Пусть игрушки программируют. Притом все разные. Это повышает вероятность того, что у них не пропадет интерес к программированию. К тому-же и математику подтянут, когда захотят что-то поинтересней сделать.
    Ответ написан
    3 комментария
  • А есть ли сертификация для разработчиков, требующая писания кода, а не выбора вариантов ответа?

    pletinsky
    @pletinsky
    Чесно говоря сомневаюсь, что такая сертификация сейчас возможна.

    1) Дело в том. то, как люди пишут код очень сильно зависит от инструментария и условий написания.

    Дай разработчику .net например, привыкшему работать с resharper — visual studio без решарпера — и он замонается выискивать внешние библиотеки для подключения — и возможно напишет чтонибудь не то. Про практику написания кода на бумажке на интервью в некоторые компании я уж вообще молчу. Даже просто смотреть на распечатанный в черно белых тонах код на бумажке некомфортно.
    Смена девелоперской среды может все очень сильно все испортить — так как ко всем нужно привыкать какое то время.

    2) Плохой — хороший код гораздо более субьективное понятие, чем принято считать.

    Вообще умение писать логичный и тяжеловесный код менее важно на мой взгляд, чем умение следовать стандартам в кодировании. В конце концов приучить писать хороший код не так уж сложно, восновном его пишут по аналогии с уже написанным.
    И вообще — с кодом не на выставку красоты ходят. Хороший код — это код — стоимость поддержки которого другими разработчиками невысока. И разным разработчикам удобее поддерживать очень разный код.

    Вообще качество кода как правило не особо зависит от профессионализма раработчика начиная с уровня миддла и выше. Он прежде всего зависит от того, один ли он пишет приложение и есть ли код ревью. Ему вседа будет казаться, что написанный им код хорош. Но как только до него доберутся его коллеги — им будет трудно в нем разобраться и его менять — хотя может он и выглядит красиво внешне.

    Вопщем рекомендую вообще не уделять такое внимание качеству кода — а лучше тому как он пишет код, каков ход его мысли. 90% кода в нашем мире пишется по шаблону с уже написанным. Просто нужен налаженный процесс разработки.
    Ответ написан
    3 комментария
  • Как на Python распарсить большой XML файл (>500Мб) содержаший ошибки?

    @skomoroh
    можно сначала представить что xml — это обычный текстовый и файл и привести структуру тегов в порядок функциями работы со строками, а уже потом открывать его как xml

    например можно заменить все html теги на «нетеги»
    sed -e 's/<p/\& lt;p/g' -e 's/<\/p/\& lt;\/p/g' file.xml > new.xml
    

    список всех html тегов гуглится

    можно предварительно сравнить количество открывающих и закрывающих тегов
    grep -o '<[^>]*>' file.xml |  cut -f 1 -d ' ' | sort | uniq -c
    
    Ответ написан
    1 комментарий
  • Как на Python распарсить большой XML файл (>500Мб) содержаший ошибки?

    DmZ
    @DmZ
    lxml в варианте «распарсить любой ценой» тоже не проходит?

    parser = etree.XMLParser(recover=True, huge_tree=True)
    

    В этом режиме он будет пытаться обойти незакрытые теги и невалидный XML на сколько у него хватит ума.
    Ответ написан
    4 комментария
  • Общие вопросы по Flask?

    @gelas
    2. Еще в jinja2 для создания своих тегов есть extensions
    Ответ написан
    Комментировать
  • Общие вопросы по Flask?

    nimnull
    @nimnull
    1. a) Код sorl чуть более чем на половину — пример того, как не нужно писать на python. б) Когда у нас в команде стоял сходный вопрос, я не нашел решений под нашу задачу, в итоге мы взяли базовый функционал sorl, чуть переписали процессинг изображений и api и получили себе отдельный blueprint который ресайзит и кеширует картинки.
    2. Jinja так же расширяема, но код выйдет посложнее чем в django templates. Для всяких мелочей в jinja_env.globals можно добавляють собственные методы.
    3. У Jinja есть поддержка макросов. В общем-то большую часть таких штук делают через них.
    4. Батарейки на pypi или отдельно
    5. Спорный вопрос, что считать большим проектом? Как организовать архитектуру? И т.п. Готовы ли вы с нуля написать что-то привычное в мире django?
    Ответ написан
    1 комментарий
  • Общие вопросы по Flask?

    Не могу себя назвать знатаком django или flask, но:

    Вроде многая инфа есть в доке на оф сайте (которая читается очень быстро, буквально за день-два, если Вы что-то пропустили).

    1. Точно не знаю как работает sorl, но если картинки генерятся по запросу на лету, то возможно нужно смотреть на возможности шаблонизатора и его расширений
    2. Фласк по умолчанию использует шаблонизатор jinja2, который позволяет писать катомные теги, вообщем вопрос больше по jinja2
    3. По-моему это реализуется с помощью шаблонов (jinja2) и наследования, или include, или кастомных тегов
    4. Вроде на офф сайте есть что-то: flask.pocoo.org/extensions/
    5. Почему бы нет, какие есть опасения?
    Ответ написан
    2 комментария
  • Как хранить и искать в 10 миллиардах записей?

    darkdimius
    @darkdimius
    Для подобных задач иногда подходит такая идея: разделить базу на части(пакеты), и запросы к ним делать независимо, и потом объединять результаты
    Например — отдельно хранить данные за последние дни с воскресения по пакету на один день, раз в 7 дней объединяя всю базу в один пакет.

    Если нужен поиск по ключу — обращаться к пакетам в порядке возрастания «возраста» базы.
    Если нужны отсортированные данные — то после поиска нужно данные «слить» с перекрыванием более старых записей новыми.

    Более умная стратегия — объединять пакеты по степенному закону. Те пакеты бывают только на 2^i дней.
    Ответ написан
    Комментировать
  • Какие преимущества у Scala перед Java8?

    ivnik
    @ivnik
    Java 8 не будет являться функциональным ЯП, изменения происходят очень консервативно (наверно это в чём то неплохо). Одно из нововведений J8 это функциональный стиль работы с коллекциями (и некоторыми другими элементами стандартной библиотеки) и более удобный синтаксис записи лямба функций.
    Если хотите изучить функциональный язык, то scala стоит попробовать. Если хотите изучить промышленный язык программирования, то лучше учите java. Кстати, scala работает под виртуальной машиной java и код на scala может использовать любые библиотеки java (в том числе и стандартную библиотеку).
    Если решите изучать scala, то рекомендую лекции по scala на coursera, которые читает Мартин Одерски, автор scala: https://www.coursera.org/course/progfun
    Ответ написан
    1 комментарий
  • Какие преимущества у Scala перед Java8?

    k12th
    @k12th
    console.log(`You're pulling my leg, right?`);
    Для разминки мозгов Scala очень подходит, а останется ли она актуальной — покажет время, а вовсе не релизы Java.
    Scala — язык с сильной ФП-составляющей, в Java никогда этого не будет, и лямбды тут не помогут.
    Ответ написан
    Комментировать
  • Как с другого сайта брать свежие посты с блога на wordress?

    WildZero
    @WildZero
    Брать из rss ленты?
    Ответ написан
    Комментировать
  • Команды, занимающиеся разработкой на Django?

    @inkvizitor68sl
    Linux-сисадмин с 8 летним стажем.
    Ответ написан
    Комментировать
  • Хабраэффект: Как настроить VPS, чтоб тот выдержал?

    VBart
    @VBart
    Хабраэффект — миф. Что-то около пары лет назад я писал статью и ради интереса вставил в нее картинку, лежащую у меня на собственной VDS-ке, за 500руб в месяц с freebsd и nginx-ом. Статья вместе с картинкой во вступлении попала на главную и провисела там почти весь будний день, пока не ушла на вторую страницу.

    Пиковый request rate составлял примерно, если память не изменяет, чуть более десятка запросов в секунду. И это не переходы пользователей по ссылке, а просто люди, открывшие главную страницу хабра. Моя VDS-ка способна отдавать эту картинку со скоростью 500-1000 req/sec.

    ИМХО если это не какое-то реально ресурсоемкое приложение, то загнуться от такой назгрузки может только неповоротливое говно на каком-нибудь монструозном php-движке (что, впрочем, составляет наверное более 90% рунета). Так что не пишите неповоротливого монструозного говна на php и вам не придется ничего настраивать.
    Ответ написан
    6 комментариев
  • Где найти книги по созданию и/или развитию IT аутсорс бизнеса?

    @smartlight
    а зачем вам книга?
    что понимаете под аутсорс бизнесом?
    Ответ написан
    1 комментарий
  • Hello world на ATmega8A собран. Куда двигаться дальше?

    Atxmega
    @Atxmega
    LCD тут в коментариях за 2.79$
    Ответ написан
    Комментировать