Задать вопрос
  • Почему формат .7z стал популярным?

    IlyaEvseev
    @IlyaEvseev
    Opensource geek
    Попробуйте взять интервью непосредственно у sourceforge.net/u/ipavlov/profile
    Всем будет интересно.
    Ответ написан
    Комментировать
  • Что сделать с текстами 372-х тысяч песен?

    Killy
    @Killy
    В структуре таблицы «wc_lyricsnet_songs» не понял, где собственно сами тексты песен. Но видимо, они есть, иначе не интересно.

    Сначала можно разобраться, что же, собственно, в этих данных содержится, и какие метрики от этих данных можно вычислять:

    Исполнитель:
    Данные:
    — Название исполнителя
    Метрики:
    — Число зарегистрированных альбомов
    — Число зарегистрированных песен
    — Средние/максимальные/etc значения метрик альбомов и песен исполнителя

    Альбом:
    Данные:
    — Название альбома
    — Год выпуска альбома
    Метрики:
    — Число песен в альбоме
    — Длинна названия альбома
    — Количество слов в названии альбома
    — Год выпуска альбома
    — Средние/максимальные/etc значения метрик песен в альбоме

    Песня:
    Данные:
    — Название
    — Текст
    Метрики:
    — Длина названия песни
    — Количество слов в названии песни
    — Длинна текста
    — Число слов в тексте
    — Число уникальных слов в тексте
    — Среднее число повторений слов в тексте

    Потом подумать, что из всего этого можно извлечь:
    а)
    Для всей базы или для выборок по метрикам посчитать частотные словари по текстовым данным. Выявить популярные шаблоны в названиях {исполнителей/альбомов/песен} — сделать свой генератор названий.
    б)
    Искать экстремальные значения метрик (не забывая про нормирование).
    Например, самые многословные исполнители. Или авторы самых ёмких текстов.
    в)
    Нарисовать сетку «метрика х метрика». Посмотреть, получается ли что-нибудь интересное на пересечениях.
    Например, [Год выпуска альбома] x [Число уникальных слов в тексте]. За каждый год (выборка по метрике 1) берём среднее значение метрики 2, делим на общее число зарегистрированных песен за этот год (размер выборки). Строим график и проверяем, становятся ли тексты в среднем более примитивными.
    г)
    Частотные словари для выборок. Нарисовать сетку «метрика х данные». Посмотреть, получается ли что-нибудь интересное на пересечениях. Посчитать частотные словари по данным из выборок на основе метрики. Сравнить результаты и найти отклонения.
    Например, [Год выпуска альбома] х [Название песни]. Удастся ли так проследить за музыкальной модой?

    При использовании внешних данных (частотный словарь английского языка, lastfm и т.д.) можно ещё всяких метрик напридумывать. Не всегда тривиальных, правда. Но более перспективных. Например:
    — «Простота текста» — насколько он состоит из частых или, наоборот, редких слов. Это круче, чем число уникальных слов в тексте.
    — Отношение исполнителя к тому или иному муз. направлению(жанру). Имея статистические данные по ярким представителям жанра можно попробовать сделать свою распознавалку жанра для произвольных текстов, например.

    Идея, надеюсь, понятна. Можно продолжить мозговой штурм и эксперименты, чтобы придумать новые и комбинированные метрики, найти откуда извлечь дополнительные данные и т.д…
    Ответ написан
    Комментировать
  • Конвертировать svm-изображение (StarView Metafile) в png?

    virtustilus
    @virtustilus Автор вопроса
    Нашел решение.
    Оказывается есть статья на хабре про конвертацию скриптом python через установленный openoffice: http://habrahabr.ru/post/97637/
    Сразу до конца не дочитал в результате чего имел кучу вопросов, как все-таки запустить под OSX данный скрипт.
    В итоге приведу небольшое решение проблем, может кому поможет.
    Скачиваем отсюда файл DocumentConverter.py.

    В итоге получаются следующие ошибки в порядке их исправления:
    ImportError: No module named uno.
    /Applications/LibreOffice.app/Contents/MacOS/pyuno.so: mach-o, but wrong architecture
    ERROR! Binary URP bridge disposed during call

    Ошибка в связи с неверными путями, теперь создаем скрипт convert.sh для его запуска:
    #!/bin/bash
    
    
    export PATH=/Applications/LibreOffice.app/Contents/MacOS:$PATH
    
    export URE_BOOTSTRAP=vnd.sun.star.pathname:/Applications/LibreOffice.app/Contents/MacOS/fundamentalrc
    export UNO_PATH=/Applications/LibreOffice.app/Contents/MacOS
    export LD_LIBRARY_PATH=/Applications/LibreOffice.app/Contents/MacOS:/Applications/LibreOffice.app/Contents/ure-link/lib/
    export PYTHONPATH=/Applications/LibreOffice.app/Contents/MacOS:$PYTHONPATH
    PYTHON="/Applications/LibreOffice.app/Contents/MacOS/OOoPython.framework/Versions/Current/bin/python"
    
    OFFICE="/Applications/LibreOffice.app/Contents/MacOS/soffice"
    
    
    $OFFICE --norestore --nofirststartwizard --nologo --headless "--accept=socket,host=localhost,port=2002;urp;StarOffice.ServiceManager" &
    
    sleep 5s
    
    $PYTHON DocumentConverter.py $1 $2
    


    Теперь можно конвертировать, просто написав ./convert.sh file1.odt file2.html

    Картинки svm будут лежать рядом в формате gif.
    Но я пошел дальше и дочитал статью на хабре до конца, где говорилось про другую скрипт-обертку unoconv. Скачиваем исходники отсюда http://dag.wieers.com/home-made/unoconv/#download, в них python-скрипт unoconv.
    Теперь можно конвертировать даже просто картинки svm командой
    unoconv -f png mypath/*.svm
    
    Ответ написан
    Комментировать
  • Нужен ли пост об оценке вероятностей в SVM?

    Fesor
    @Fesor
    Full-stack developer (Symfony, Angular)
    Вот где ж вы были пару дней назад, пишите конечно!
    Ответ написан
    5 комментариев
  • Распаковка tar-архива "на лету"

    sledopit
    @sledopit
    wget -qO - server/tree.rar | tar -xf -
    А Ваша команда просто сохранит файл и даже распаковывать его не будет.
    Ответ написан
    4 комментария
  • Какие данные вам были необходимы как разработчику в последнне время?

    @Artyushov
    нужна была база фотографий людей для распознавания лиц
    Ответ написан
    Комментировать
  • Какие данные вам были необходимы как разработчику в последнне время?

    avalak
    @avalak
    Мне вот сейчас нужны примеры tracking number / номеров накладных разных почтовых служб в виде «пользовательских» данных (с ошибками, очепятками, лишними символами и прочими особенностями). Можно случайные, но формально верные.

    Часто бывают нужны тематические наборы/генераторы данных для тестов и концептов (как чистые, так и «пользовательские»).
    Завел библиотеку для создания «образцов» (email, строка, число, теги, телефон, etc) + для django есть хорошая библиотека django_any
    Ответ написан
    Комментировать
  • Выбор языка и БД для высоконагруженного веб-приложения?

    butteff
    @butteff
    Раз в тысячу лет заправляю свитер в носки
    Имхо, тут больше роль играет сам программист и аппаратные вещи, например, ширина канала.
    Если программист не оптимизирует запросы и пишет индусский код, то на любом языке будет фэйл.

    Важно думать при разработке о нагрузках и правильно писать код, имхо
    Ответ написан
    1 комментарий
  • Выбор языка и БД для высоконагруженного веб-приложения?

    atomlib
    @atomlib
    Это тема для холивара, а не вопрос с однозначным ответом.
    Ответ написан
    3 комментария
  • Как мотивировать школьников учиться?

    @lesha_penguin
    Можно уточнить АПВС: Вы школьный учитель, желающий мотивировать своих учеников? Или же вы родитель, и вы боитесь, чтобы ваши дети выростут балбесами?
    Просто, как вы понимаете от ответа на этот вопрос (Вы: учитель/родитель) зависит насколько индивидуальным будет подход. И насколько будет баланс между «вести детей в нужное русло» или наоборот «поощрять и развивать, следуя естественным склонностям».

    Если говорить насет именно физики, тут реально заинтересовать ребенка может парочка простых DIY-поделок, выполненных вместе с ребенком.
    При чем, самое главное, с достаточными комментариями что вы конкретно делаете.
    По сути ваш трюк заключается в том, чтобы связать теорию и интерес ее применения на практике:

    * Например, производя пайку, расчитать по формулам силу тока в контуре, чтобы например не спалить нежную микросхему, или показать как выбрать правильную полярность светодиода.

    * Делая что-то летающее, показать, как вы по формуле расчитываете «взлетит/не взлетит» массу аппарата и используемый двигатель. Если у «леталки» есть крылья, разрисовать, какие силы действуют на них, для чего «леталке» хвост, как сделать чтобы эта леталка не заваливалась в полете, а вела себя устойчиво.

    * Собирая что-нибудь ездиещее, можно показать как расчитать на какие препятствия аппарат сможет заехать, а на какие нет. А из характеристик материала расчитать, сколько груза можно на эту «ездилку» погрузить, чтобы она не сломалась.

    * Когда делаете что-то стреляющее, покажите как вы расчитываете насколько далеко улетит снаряд в зависимости от выбранной пружины.

    * Когда вы работаете с каким-нибудь материалом, можно и нужно комментировать, что и как и почему получается. Например, во время пайки, рассказать, почему припой надо нагревать до определенной температуры, что такое холодная пайка, зачем обезжиривать провода, и т.д.

    Очень важный фактор — снять у ребенка неуверенность в поиске нужной информации:
    Просто показываете ребенку, как вы, например, если не помните точной формулы или не знаете интересующих характеристик радиодетали пользуетесь справочником. Это очень важный, чтобы у ребенка не возникал тупняк, когда он сталкивается с тем, что не знает на память.
    Также, покажите ребенку как вы читаете готовые схемы, на что вы обращаете внимание, чтобы в них разобраться. Покажите, что вы делаете чтобы изменить характеристики используемой схемы.

    Ваша задача не заставить учить теоретическую основу физики, а показать как эта теория применяется применительно к тому что вызывает интерес! Кстати, побочный эффект: за интересом к физике, обычно автоматически подтягивается и «прокачка математических скилов».

    Да, если все делаете правильно, очень скоро заинтересованный ребенок быстро обретает самостоятельность, и для вас будет нормально, если придя с работы вы будете видеть на столе у ребенка разложенные радиодетали с паяльником. Пусть ребенок самостоятельно экспериментирует. Но всегда постарайтесь помочь ему, когда у него возникают вопросы.

    P.S.: То, о чем я пишу, я знаю на своем опыте. У меня папа с мамой как инженеры всегда, при любой возможности, давали мне «на поиграться» что нибудь интересное. А учитывая, что в доме была масса справочников и прочей технической литературы (которую они мне щедро подбрасывали, в виде всяких научно-популярных журналов и книг), можно сказать, что одни из лучших моментов моего детства прошли «с паяльником и отверткой». Потом правда, уже ближе к середине восьмидесятых, появились компьютеры и фокус моего внимания переместился в сторону IT, и я стал свой инженерный подход применять уже для написания программ, но это, правда уже совсем другая история.
    Ответ написан
    3 комментария
  • Как мотивировать школьников учиться?

    @Piradius
    Закончил в том году физ-мат (настоящий, а не от которого одно название).
    Больше всего запомнился физик наш. Веселый мужик — любил истории из жизни на уроках рассказывать, физика с ним на одном дыхании шла. У нас кстати учебника не было, учились только по его конспектам. И вот как он выходил из ситуации: он выбирал из класса пару учеников (которые сами по себе полнейшие нули, но поддающиеся дрессировке и которых мотивировать просто) и усиленно натаскивал их на олимпиады, конференции, прочее. За ними остальные сами собой подтягивались. Класс полностью сам собой регулировался (очень сильно уважение к нему играло роль), он даже домашнее по желанию всегда спрашивал (ни о каких отрицательных оценках никогда речь не шла). Но вот с гуманитарными классами он не дружил и был очень плохого мнения о них (в плане физики\математики там сплошные инвалиды).
    Главное — любите свой предмет и любите преподавать детям. Мотивация прежде всего должна от вас исходить.
    P.S. С 8мого класса на уроках решали задачи уровня С от ЕГЭшных до международных олимпиадных, куча его учеников занимает места на олимпиадах разного уровня (помню одного, занявшего третье место на международной) и во всяких конференциях. Так что есть еще шансы у Российского образования :-)
    Ответ написан
    2 комментария