• В каком направлении развиваться(учитывая склонности)?

    @dmshar
    Вопрос "кем быть - летчиком или шахтером" ("бэкенд разработчиком" или "дата саентистом") обычно решается к концу школы. Помните, что для DS необходима суровая математическая подготовка. Для программиста важнее умение думать логически и усидчивость.
    Судя по вопросу - у вас еще есть пару лет времени на выбор.
    P.S. И да, профессии "бекэндер" не существует. Есть профессия "программист". И любой ВУЗ учит программировать, а не "программировать бекенд".
    Ответ написан
    Комментировать
  • Можно ли прогнозировать только по категориальным признакам в ML коих больше 100?

    @dmshar
    Любой метод - не панацея. Ответ на ваш вопрос - прогнозировать-то можно. Но вот есть-ли зависимость вашего целевого признака от ваших (пусть даже 100) независимых признаков - это совершенно другой вопрос.
    Неудача в прогнозировании может быть вызвана как неправильно выбранным методом, так и отсутствии корреляций между входными и выходными признаками.
    И, кстати, подбор наиболее адекватных признаков - это одна из самых важных задач в ML.
    Ответ написан
    Комментировать
  • Как находить быстро и много нужной информации?

    @dmshar
    Дедушка Ленин как то сказал:
    "Учиться, учиться и еще раз учиться".
    Я бы (скромно так) написал - "думать, учиться, учиться думать, снова думать, снова учиться, снова учиться думать ... и так всю жизнь". Это ответ на ваш вопрос.
    Да, поиск информации - это не решение школьной задачи по математике, где взял готовую формулу, подставил число и - герой! Тут надо думать. В первую очередь. Кто не понял этого еще в школе (что важно не запоминать, и даже не списать у соседа ради оценки, а решать ЛЮБЫЕ задачи самостоятельно) тот будет учиться в зрелом возрасте (что труднее и дороже, а часто - и на много больнее). Кто понял - будут просто нарабатывать опыт. Потому что в 90% случаев - как и впрочем, при решении любой задачи вне учебника - именно опыт и практика,плюс умение самому думать, в том числе обобщать свой опыт - ключ к успеху.
    А по готовому рецепту - только борщ варится, да и то, он у разных хозяек одинаковым не получается. Даже тут - важен ЛИЧНЫЙ опыт и ЛИЧНАЯ практика.
    P.S. Вот даже по вашему запросу о холодильниках слету находится штук 15.
    https://productcenter.ru/producers/catalog-kholodi... Понимаю, что не все они вам подойдут, но это уже не поиск, а дальнейшее маркетинговое исследование.
    Как вам удалось найти только 2-3???
    Ответ написан
    5 комментариев
  • ИИ заменит дизайнеров?

    @dmshar
    Смотря что понимать под словом "заменят" и "дизайнер".
    Вот ознакомтесь, из последнего:
    https://neurohive.io/ru/novosti/nejroset-pomogaet-...
    Ответ написан
    Комментировать
  • Как удалить дублирующиеся строки из датафрейма?

    @dmshar
    В Pandas все еще проще:
    df.drop_duplicates(["mycolumn"])
    Ответ написан
    Комментировать
  • Как с помощью нейросети, убирать облака с изображения?

    @dmshar
    А у вас есть тысяч десять ПАР картинок одной и той-же местности с облаками и без, что-бы на них обучить свою нейросеть?

    Если есть - далее все тривиально - нейросеть типа автоенкодер-декодер. На вход картинку с облаком, на выходе сравниваем с той-же местностью без облаков. Сеть обучается на вашей десятке тысяч пар.
    На обученную таким образом сетку подаем новые картинки и надеемся, что она сумеет с ними справиться.

    Если такого набора нет - тогда начинаем с того, что читаем книжки и разбираемся как вообще нейросети работают.

    P.S. Не надо 10 тыс фото "одной и той-же местности". Надо 10 тыс ПАР, каждая пара представляет свою местность, но в паре - одна фото с облаками, а другая - без. Все-таки советую для лучшего понимая начать с изучения принципов работы нейросети.
    Но если такой датасет пар есть - сеть автоенкодер-автодекодер должна вам помочь.

    P.P.S. Подумав - еще одно дополнение. Лучше, конечно, не пары фото, а для КАЖДОЙ местности - одно фото без облаков и несколько фото с разными облаками.
    И еще - фото одной и той-же местности, сделанной с большим временным интервалом (два-три месяца) использоваться не могут. Времена года, изменения застроек и пр, сильно зашумлят результат.
    Ответ написан
    3 комментария
  • Какую выбрать среду разработки Python?

    @dmshar
    Смотря чем вы планируете на Python заниматься. Если чем-то связанным с Machine Learning - то наиболее естественный путь это Spyder (https://www.spyder-ide.org/), а еще лучше - сразу Anaconda (https://anaconda.org/), где содержится и Spyder, и все, что вам потребуется в ближайшие три-четыре года занятий Data Sceince, включая ANN и Deep Learning/
    И тема в последней версии - вполне темная :-) Ну и русская версия тоже в наличии.
    Ответ написан
    Комментировать
  • Где можно найти актуальные бесплатные курсы по ИИ и машинному обучению?

    @dmshar
    Не надо вам пока изучать ИСКУССТВЕННЫЙ интеллект.
    Пока надо сосредоточиться на развитии ЕСТЕСТВЕННОГО интеллекта и освоить умение самостоятельно гууглить ответы на свои ЭЛЕМЕНТАРНЫЕ вопросы, тем более что ответов на него - уйма. Даже на этом самом форуме.
    Без такого умения изучение чего бы то ни было в области информационных технологий - пустая трата времени.
    Ответ написан
    Комментировать
  • Можете помочь решить задачи с блок-схемами?

    @dmshar
    Вы ошиблись. Тут сайт ПОМОЩИ для тех, кто что-то решает сам и у него что-то не получается. Или что-то непонятно. Всяко бывает.
    Сайт решения задач ВМЕСТО вас гуглится по слову "Фриланс".
    Ответ написан
    1 комментарий
  • Какой язык легче изучить для анализа данных?

    @dmshar
    Для человека незнакомого с программированием (и не горящим желанием его изучать) надо использовать не R или Python, а инструменты, где такого программирования практически нет, а основные - и довольно сложные - действия по анализу данных выполнить можно. Таких инструментов море - от банального EXCEL, который покроет процентов 80 всех ваших потребностей, до SPSS, от Rapid Miner до Н2О. Есть еще куча специализированных он-лайн сервисов - но там уже надо смотреть по вашей специализации - понятие "анализ финансовых данных" весьма широкое и включает множество субдоменов, для каждого их которых эти сервисы свои.
    Ответ написан
    Комментировать
  • Для сайта каталога ресторанов какую базу данных можно выбрать?

    @dmshar
    Вопрос как-то странно звучит. А почему надо выбирать "MongoDB или Cassandra" если задача, аналогичная вашей решалась 100500 тысяч раз и в основном на SQL, которые к тому же именно для подобных задач (поиск в хорошо структурированном массиве информаии) и придумывались?
    Приведите хоть один пример, когда средств, мощностей и других возможностей даже MySQL не хватит для вашей задачи?
    Ответ написан
  • Что изучать молодому программисту?

    @dmshar
    Короче говоря, какое вложение больше всего окупится для мозгов и навыков программирования?


    "Для мозгов" СЕЙЧАС для вас в первую очередь окупится нормальное завершение школы и поступление в нормальный ВУЗ.
    Во вторую - вложение в английский, что бы потом не краснеть, дописывая к каждому своему сообщению приметочку, что надо бы что-то по русски, а то как-то не так.

    "Для навыков программирования"- на данном этапе - совет "изучать все, что интересно" - самый разумный. А конкретики и неинтересного но нужного - вам хватит, когда будете учится в универе.

    А вообще-то я уже писал лично свое мнение.Хотите быть именно проф.разработчиком-программистом - начинаем с С++. Думаете быть специалистом в чем-то другом с навыками программирования - начинаем с Python.
    Ответ написан
    Комментировать
  • Permutation test для 3 samples и более?

    @dmshar
    Тест для выявления различий в трех группах - это так называемый ANOVA-тест, т.е. тест на проверку различий в дисперсиях.
    Соответственно, пермутационный тест в данном случае тоже должен смоделировать этот тест.
    Как это сделать - можете посмотреть вот тут https://math.stackexchange.com/questions/1189063/p...
    Я конечно понимаю, что врят-ли вы когда-либо программировали на R. Но последовательность действий там вполне понятна, а соответственно переложить этот скрипт на Python затруднений вызвать не должно.
    P.S. На всякий случай - ANOVA реализуется в Python с помощью функции f_oneway() пакета scipy.stats
    Ответ написан
    Комментировать
  • Нейросеть. Как формулы функций активации перевести в код на python?

    @dmshar
    Если "Питон знаю , я формулы не понимаю" - значит надо учить математику. За одно - зайти в темы типа "a нужна-ли математика для машинного обучения" и написать свое мнение.
    Ответ написан
    Комментировать
  • Подкинете идей для диплома (Сбор или/и анализ больших данных)?

    @dmshar
    Доучиться до магистра и не уметь придумать темы для СВОЕГО диплома, а ждать, когда незнакомые люди что-нибудь насоветуют, не зная даже, а по какой специальности-то диплом. Жесть!
    Впрочем, что касается Big Data - то все очевидно. Нет у вас ни больших данных, ни ресурсов для работы с ними. И никогда не будет. Если вы слово "Big Data" все-же слышали в своем универе, то вас либо плохо учили, либо вы плохо учились, если этого так и не поняли.
    Ну и наконец. У вас есть научный руководитель диплома. Почему не обратиться к нему?
    Ответ написан
    3 комментария
  • Какую библиотеку посоветуете для web графиков на Python?

    @dmshar
    Стандарт "де-факто" веб-визуализаций- это, конечно, D3.js (https://d3js.org/)
    https://towardsdatascience.com/combining-python-an...
    Кроме того, модуль Bokeh (https://docs.bokeh.org/en/latest/index.html) использует элемент canvas, созданный как контейнер для графики в HTML5, а модуль Plotly (https://plotly.com/ )позволяет экспортировать результаты matplotlib в интерактивные веб-графики.
    Остальное - экзотика.
    Выбирайте, что вам больше подходит.
    Ответ написан
    Комментировать
  • Почему работает некорректно?

    @dmshar
    Если надо "находить и удалять" одновременно, то делать это МОЖНО только с конца списка

    a='a abc ccc cvv v'
    b=a.split()
    c=[]
    for i in b[::-1]:
        if len(i)>=3 and len(i)<=5:
            c.append(i)
            b.remove(i)
    print ( c)
    print (b)

    Результат
    ['cvv', 'ccc', 'abc']
    ['a', 'v']


    Если очень хочется - потом можно сделать реверс

    c.reverse()
    print ( c)


    ['cvv', 'ccc', 'abc']
    Ответ написан
    Комментировать
  • Что выбрать Python Kivy или Kotlin?

    @dmshar
    А чего вы нас тут спрашиваете? Мы ведь не видели вашего приложения. Мы не знаем вашей квалификации. И мы не знаем, на сколько можно доверять совету вашего знакомого. По хорошему, если он дал вам совет, то скорее всего его обосновал - почему это решение не рационально (вообще? или для вашего конкретного случая?). Вот эти его обоснования уже могут быть предметом обсуждения - на сколько они профессиональны, компетентны и на сколько они соответствуют тенденциям в современном "приложениестронии".
    А пока абстрактное приложение, абстрактный разработчик, абстрактные условия, абстрактные умозаключения - обсуждать-то нечего.
    Ответ написан
    2 комментария