Задать вопрос
  • ИИ заменит дизайнеров?

    @dmshar
    Смотря что понимать под словом "заменят" и "дизайнер".
    Вот ознакомтесь, из последнего:
    https://neurohive.io/ru/novosti/nejroset-pomogaet-...
    Ответ написан
    Комментировать
  • Как удалить дублирующиеся строки из датафрейма?

    @dmshar
    В Pandas все еще проще:
    df.drop_duplicates(["mycolumn"])
    Ответ написан
    Комментировать
  • Как с помощью нейросети, убирать облака с изображения?

    @dmshar
    А у вас есть тысяч десять ПАР картинок одной и той-же местности с облаками и без, что-бы на них обучить свою нейросеть?

    Если есть - далее все тривиально - нейросеть типа автоенкодер-декодер. На вход картинку с облаком, на выходе сравниваем с той-же местностью без облаков. Сеть обучается на вашей десятке тысяч пар.
    На обученную таким образом сетку подаем новые картинки и надеемся, что она сумеет с ними справиться.

    Если такого набора нет - тогда начинаем с того, что читаем книжки и разбираемся как вообще нейросети работают.

    P.S. Не надо 10 тыс фото "одной и той-же местности". Надо 10 тыс ПАР, каждая пара представляет свою местность, но в паре - одна фото с облаками, а другая - без. Все-таки советую для лучшего понимая начать с изучения принципов работы нейросети.
    Но если такой датасет пар есть - сеть автоенкодер-автодекодер должна вам помочь.

    P.P.S. Подумав - еще одно дополнение. Лучше, конечно, не пары фото, а для КАЖДОЙ местности - одно фото без облаков и несколько фото с разными облаками.
    И еще - фото одной и той-же местности, сделанной с большим временным интервалом (два-три месяца) использоваться не могут. Времена года, изменения застроек и пр, сильно зашумлят результат.
    Ответ написан
    3 комментария
  • Какую выбрать среду разработки Python?

    @dmshar
    Смотря чем вы планируете на Python заниматься. Если чем-то связанным с Machine Learning - то наиболее естественный путь это Spyder (https://www.spyder-ide.org/), а еще лучше - сразу Anaconda (https://anaconda.org/), где содержится и Spyder, и все, что вам потребуется в ближайшие три-четыре года занятий Data Sceince, включая ANN и Deep Learning/
    И тема в последней версии - вполне темная :-) Ну и русская версия тоже в наличии.
    Ответ написан
    Комментировать
  • Где можно найти актуальные бесплатные курсы по ИИ и машинному обучению?

    @dmshar
    Не надо вам пока изучать ИСКУССТВЕННЫЙ интеллект.
    Пока надо сосредоточиться на развитии ЕСТЕСТВЕННОГО интеллекта и освоить умение самостоятельно гууглить ответы на свои ЭЛЕМЕНТАРНЫЕ вопросы, тем более что ответов на него - уйма. Даже на этом самом форуме.
    Без такого умения изучение чего бы то ни было в области информационных технологий - пустая трата времени.
    Ответ написан
    Комментировать
  • Можете помочь решить задачи с блок-схемами?

    @dmshar
    Вы ошиблись. Тут сайт ПОМОЩИ для тех, кто что-то решает сам и у него что-то не получается. Или что-то непонятно. Всяко бывает.
    Сайт решения задач ВМЕСТО вас гуглится по слову "Фриланс".
    Ответ написан
    1 комментарий
  • Какой язык легче изучить для анализа данных?

    @dmshar
    Для человека незнакомого с программированием (и не горящим желанием его изучать) надо использовать не R или Python, а инструменты, где такого программирования практически нет, а основные - и довольно сложные - действия по анализу данных выполнить можно. Таких инструментов море - от банального EXCEL, который покроет процентов 80 всех ваших потребностей, до SPSS, от Rapid Miner до Н2О. Есть еще куча специализированных он-лайн сервисов - но там уже надо смотреть по вашей специализации - понятие "анализ финансовых данных" весьма широкое и включает множество субдоменов, для каждого их которых эти сервисы свои.
    Ответ написан
    Комментировать
  • Для сайта каталога ресторанов какую базу данных можно выбрать?

    @dmshar
    Вопрос как-то странно звучит. А почему надо выбирать "MongoDB или Cassandra" если задача, аналогичная вашей решалась 100500 тысяч раз и в основном на SQL, которые к тому же именно для подобных задач (поиск в хорошо структурированном массиве информаии) и придумывались?
    Приведите хоть один пример, когда средств, мощностей и других возможностей даже MySQL не хватит для вашей задачи?
    Ответ написан
  • Что изучать молодому программисту?

    @dmshar
    Короче говоря, какое вложение больше всего окупится для мозгов и навыков программирования?


    "Для мозгов" СЕЙЧАС для вас в первую очередь окупится нормальное завершение школы и поступление в нормальный ВУЗ.
    Во вторую - вложение в английский, что бы потом не краснеть, дописывая к каждому своему сообщению приметочку, что надо бы что-то по русски, а то как-то не так.

    "Для навыков программирования"- на данном этапе - совет "изучать все, что интересно" - самый разумный. А конкретики и неинтересного но нужного - вам хватит, когда будете учится в универе.

    А вообще-то я уже писал лично свое мнение.Хотите быть именно проф.разработчиком-программистом - начинаем с С++. Думаете быть специалистом в чем-то другом с навыками программирования - начинаем с Python.
    Ответ написан
    Комментировать
  • Permutation test для 3 samples и более?

    @dmshar
    Тест для выявления различий в трех группах - это так называемый ANOVA-тест, т.е. тест на проверку различий в дисперсиях.
    Соответственно, пермутационный тест в данном случае тоже должен смоделировать этот тест.
    Как это сделать - можете посмотреть вот тут https://math.stackexchange.com/questions/1189063/p...
    Я конечно понимаю, что врят-ли вы когда-либо программировали на R. Но последовательность действий там вполне понятна, а соответственно переложить этот скрипт на Python затруднений вызвать не должно.
    P.S. На всякий случай - ANOVA реализуется в Python с помощью функции f_oneway() пакета scipy.stats
    Ответ написан
    Комментировать
  • Нейросеть. Как формулы функций активации перевести в код на python?

    @dmshar
    Если "Питон знаю , я формулы не понимаю" - значит надо учить математику. За одно - зайти в темы типа "a нужна-ли математика для машинного обучения" и написать свое мнение.
    Ответ написан
    Комментировать
  • Подкинете идей для диплома (Сбор или/и анализ больших данных)?

    @dmshar
    Доучиться до магистра и не уметь придумать темы для СВОЕГО диплома, а ждать, когда незнакомые люди что-нибудь насоветуют, не зная даже, а по какой специальности-то диплом. Жесть!
    Впрочем, что касается Big Data - то все очевидно. Нет у вас ни больших данных, ни ресурсов для работы с ними. И никогда не будет. Если вы слово "Big Data" все-же слышали в своем универе, то вас либо плохо учили, либо вы плохо учились, если этого так и не поняли.
    Ну и наконец. У вас есть научный руководитель диплома. Почему не обратиться к нему?
    Ответ написан
    3 комментария
  • Какую библиотеку посоветуете для web графиков на Python?

    @dmshar
    Стандарт "де-факто" веб-визуализаций- это, конечно, D3.js (https://d3js.org/)
    https://towardsdatascience.com/combining-python-an...
    Кроме того, модуль Bokeh (https://docs.bokeh.org/en/latest/index.html) использует элемент canvas, созданный как контейнер для графики в HTML5, а модуль Plotly (https://plotly.com/ )позволяет экспортировать результаты matplotlib в интерактивные веб-графики.
    Остальное - экзотика.
    Выбирайте, что вам больше подходит.
    Ответ написан
    Комментировать
  • Почему работает некорректно?

    @dmshar
    Если надо "находить и удалять" одновременно, то делать это МОЖНО только с конца списка

    a='a abc ccc cvv v'
    b=a.split()
    c=[]
    for i in b[::-1]:
        if len(i)>=3 and len(i)<=5:
            c.append(i)
            b.remove(i)
    print ( c)
    print (b)

    Результат
    ['cvv', 'ccc', 'abc']
    ['a', 'v']


    Если очень хочется - потом можно сделать реверс

    c.reverse()
    print ( c)


    ['cvv', 'ccc', 'abc']
    Ответ написан
    Комментировать
  • Что выбрать Python Kivy или Kotlin?

    @dmshar
    А чего вы нас тут спрашиваете? Мы ведь не видели вашего приложения. Мы не знаем вашей квалификации. И мы не знаем, на сколько можно доверять совету вашего знакомого. По хорошему, если он дал вам совет, то скорее всего его обосновал - почему это решение не рационально (вообще? или для вашего конкретного случая?). Вот эти его обоснования уже могут быть предметом обсуждения - на сколько они профессиональны, компетентны и на сколько они соответствуют тенденциям в современном "приложениестронии".
    А пока абстрактное приложение, абстрактный разработчик, абстрактные условия, абстрактные умозаключения - обсуждать-то нечего.
    Ответ написан
    2 комментария
  • Обоснованность бутстрап метода.Почему можно экстраполировать на генеральную совокупность?

    @dmshar
    Что-то немного не сходится. Проведя ресемплинг мы получаем эмпирическую функцию распределения (например) среднего значения. Для этого распределения (а не для распределения исходной выборки) мы можем строить доверительный интервал, т.е. такие пределы, в которых (условно) в 95 случаях из ста попадет среднее нашей выборки.
    Т.е. реальное среднее реальной выборки или матожидание генеральной совокупности вполне может и не попасть в этот доверительный интервал, но вероятность этого меньше 5%. Причем такое заключение мы сделали исключительно на основе имеющихся данных. Если вдруг у нас появятся дополнительные данные из той-же генеральной совокупности, то вполне возможно, что наше заключение придется корректировать.
    Главное понять: статистика - это не об уверенности. Никогда! Статистика это на самом деле о вероятности ошибиться в своей уверенности.
    P.S. Все таки загляните в книгу, которую я вам порекомендовал в другом месте.
    Ответ написан
    8 комментариев
  • Доверительный интервал и генеральная совокупность.Какая связь?

    @dmshar
    1. Вопрос: будут ли эти выборочные средние распределены нормально относительно величины приблизительно равной среднему росту в ген.совокупности?
    Ответ: Да
    2.Вопрос:Работает ли центральная предельная теорема?
    Ответ: А кто и когда ее отменил?
    3. Вопрос: Поэтому мы смотрим диапазон куда входят 95% всех значений и берем его как исчерпывающий результат?
    Ответ: Мы сначала из внестатистических соображений выбираем уровень значимости. Он может быть и 0.95, и 0.9 и 0.0000001 - любой. А потом уж строим доверительный интервал, используя выбранный уровень значимости.
    Что такое "исчерпывающий результат" - я такого термина в статистике не встречал. Поясните.
    Ответ написан
    Комментировать
  • Может ли sd=2, если размер выборки 25?

    @dmshar
    Господи, опять дисперсия, опять размах. Вы после этой темы
    Как соотносится дисперсия с sd?
    хоть один учебник открыли?
    Кто, где, когда вам сказал, что "дисперсия приближается к размаху"???? А тем более, что "дисперсия должна быть близка к размеру выборки"???? Если у вас будет набор на 10000000 элементов, то дисперсия тоже будет "приближаться"???? Да хоть формулу дисперсии посмотрите для интереса. Там размер выборки в ЗНАМИНАТЕЛЕ!!! Подумайте, что это означает в конце концов.
    P.S. Впрочем, подумал- надо бы узнать, в каком классе вы учитесь. Может я слишком многого от вас хочу?
    Ответ написан