Ответы пользователя dmshar

ИИ заменит дизайнеров?

dmshar @dmshar

Смотря что понимать под словом "заменят" и "дизайнер".
Вот ознакомтесь, из последнего:
https://neurohive.io/ru/novosti/nejroset-pomogaet-...

Ответ написан более трёх лет назад

Комментировать

Как удалить дублирующиеся строки из датафрейма?

dmshar @dmshar

В Pandas все еще проще:
df.drop_duplicates(["mycolumn"])

Ответ написан более трёх лет назад

Комментировать

Как с помощью нейросети, убирать облака с изображения?

dmshar @dmshar

А у вас есть тысяч десять ПАР картинок одной и той-же местности с облаками и без, что-бы на них обучить свою нейросеть?

Если есть - далее все тривиально - нейросеть типа автоенкодер-декодер. На вход картинку с облаком, на выходе сравниваем с той-же местностью без облаков. Сеть обучается на вашей десятке тысяч пар.
На обученную таким образом сетку подаем новые картинки и надеемся, что она сумеет с ними справиться.

Если такого набора нет - тогда начинаем с того, что читаем книжки и разбираемся как вообще нейросети работают.

P.S. Не надо 10 тыс фото "одной и той-же местности". Надо 10 тыс ПАР, каждая пара представляет свою местность, но в паре - одна фото с облаками, а другая - без. Все-таки советую для лучшего понимая начать с изучения принципов работы нейросети.
Но если такой датасет пар есть - сеть автоенкодер-автодекодер должна вам помочь.

P.P.S. Подумав - еще одно дополнение. Лучше, конечно, не пары фото, а для КАЖДОЙ местности - одно фото без облаков и несколько фото с разными облаками.
И еще - фото одной и той-же местности, сделанной с большим временным интервалом (два-три месяца) использоваться не могут. Времена года, изменения застроек и пр, сильно зашумлят результат.

Ответ написан более трёх лет назад

3 комментария

Какую выбрать среду разработки Python?

dmshar @dmshar

Смотря чем вы планируете на Python заниматься. Если чем-то связанным с Machine Learning - то наиболее естественный путь это Spyder (https://www.spyder-ide.org/), а еще лучше - сразу Anaconda (https://anaconda.org/), где содержится и Spyder, и все, что вам потребуется в ближайшие три-четыре года занятий Data Sceince, включая ANN и Deep Learning/
И тема в последней версии - вполне темная :-) Ну и русская версия тоже в наличии.

Ответ написан более трёх лет назад

Комментировать

Где можно найти актуальные бесплатные курсы по ИИ и машинному обучению?

dmshar @dmshar

Не надо вам пока изучать ИСКУССТВЕННЫЙ интеллект.
Пока надо сосредоточиться на развитии ЕСТЕСТВЕННОГО интеллекта и освоить умение самостоятельно гууглить ответы на свои ЭЛЕМЕНТАРНЫЕ вопросы, тем более что ответов на него - уйма. Даже на этом самом форуме.
Без такого умения изучение чего бы то ни было в области информационных технологий - пустая трата времени.

Ответ написан более трёх лет назад

Комментировать

Можете помочь решить задачи с блок-схемами?

dmshar @dmshar

Вы ошиблись. Тут сайт ПОМОЩИ для тех, кто что-то решает сам и у него что-то не получается. Или что-то непонятно. Всяко бывает.
Сайт решения задач ВМЕСТО вас гуглится по слову "Фриланс".

Ответ написан более трёх лет назад

1 комментарий

Какой язык легче изучить для анализа данных?

dmshar @dmshar

Для человека незнакомого с программированием (и не горящим желанием его изучать) надо использовать не R или Python, а инструменты, где такого программирования практически нет, а основные - и довольно сложные - действия по анализу данных выполнить можно. Таких инструментов море - от банального EXCEL, который покроет процентов 80 всех ваших потребностей, до SPSS, от Rapid Miner до Н2О. Есть еще куча специализированных он-лайн сервисов - но там уже надо смотреть по вашей специализации - понятие "анализ финансовых данных" весьма широкое и включает множество субдоменов, для каждого их которых эти сервисы свои.

Ответ написан более трёх лет назад

Комментировать

Где взять спутниковые снимки полей?

dmshar @dmshar

https://sovzond.ru/press-center/articles/ers/5823/

Ответ написан более трёх лет назад

1 комментарий

Для сайта каталога ресторанов какую базу данных можно выбрать?

dmshar @dmshar

Вопрос как-то странно звучит. А почему надо выбирать "MongoDB или Cassandra" если задача, аналогичная вашей решалась 100500 тысяч раз и в основном на SQL, которые к тому же именно для подобных задач (поиск в хорошо структурированном массиве информаии) и придумывались?
Приведите хоть один пример, когда средств, мощностей и других возможностей даже MySQL не хватит для вашей задачи?

Ответ написан более трёх лет назад

14 комментариев

Что изучать молодому программисту?

dmshar @dmshar

Короче говоря, какое вложение больше всего окупится для мозгов и навыков программирования?

"Для мозгов" СЕЙЧАС для вас в первую очередь окупится нормальное завершение школы и поступление в нормальный ВУЗ.
Во вторую - вложение в английский, что бы потом не краснеть, дописывая к каждому своему сообщению приметочку, что надо бы что-то по русски, а то как-то не так.

"Для навыков программирования"- на данном этапе - совет "изучать все, что интересно" - самый разумный. А конкретики и неинтересного но нужного - вам хватит, когда будете учится в универе.

А вообще-то я уже писал лично свое мнение.Хотите быть именно проф.разработчиком-программистом - начинаем с С++. Думаете быть специалистом в чем-то другом с навыками программирования - начинаем с Python.

Ответ написан более трёх лет назад

Комментировать

Permutation test для 3 samples и более?

dmshar @dmshar

Тест для выявления различий в трех группах - это так называемый ANOVA-тест, т.е. тест на проверку различий в дисперсиях.
Соответственно, пермутационный тест в данном случае тоже должен смоделировать этот тест.
Как это сделать - можете посмотреть вот тут https://math.stackexchange.com/questions/1189063/p...
Я конечно понимаю, что врят-ли вы когда-либо программировали на R. Но последовательность действий там вполне понятна, а соответственно переложить этот скрипт на Python затруднений вызвать не должно.
P.S. На всякий случай - ANOVA реализуется в Python с помощью функции f_oneway() пакета scipy.stats

Ответ написан более трёх лет назад

Комментировать

Нейросеть. Как формулы функций активации перевести в код на python?

dmshar @dmshar

Если "Питон знаю , я формулы не понимаю" - значит надо учить математику. За одно - зайти в темы типа "a нужна-ли математика для машинного обучения" и написать свое мнение.

Ответ написан более трёх лет назад

Комментировать

Подкинете идей для диплома (Сбор или/и анализ больших данных)?

dmshar @dmshar

Доучиться до магистра и не уметь придумать темы для СВОЕГО диплома, а ждать, когда незнакомые люди что-нибудь насоветуют, не зная даже, а по какой специальности-то диплом. Жесть!
Впрочем, что касается Big Data - то все очевидно. Нет у вас ни больших данных, ни ресурсов для работы с ними. И никогда не будет. Если вы слово "Big Data" все-же слышали в своем универе, то вас либо плохо учили, либо вы плохо учились, если этого так и не поняли.
Ну и наконец. У вас есть научный руководитель диплома. Почему не обратиться к нему?

Ответ написан более трёх лет назад

3 комментария

Какую библиотеку посоветуете для web графиков на Python?

dmshar @dmshar

Стандарт "де-факто" веб-визуализаций- это, конечно, D3.js (https://d3js.org/)
https://towardsdatascience.com/combining-python-an...
Кроме того, модуль Bokeh (https://docs.bokeh.org/en/latest/index.html) использует элемент canvas, созданный как контейнер для графики в HTML5, а модуль Plotly (https://plotly.com/ )позволяет экспортировать результаты matplotlib в интерактивные веб-графики.
Остальное - экзотика.
Выбирайте, что вам больше подходит.

Ответ написан более трёх лет назад

Комментировать

Как классифицировать случайный текст по категориям?

dmshar @dmshar

https://habr.com/ru/post/504744/
https://towardsdatascience.com/text-classification...
https://ai-news.ru/2020/05/prakticheskaya_klassifi...
https://ataspinar.wordpress.com/2015/11/16/text-cl...
https://towardsdatascience.com/document-classifica...
https://towardsdatascience.com/text-classification...
https://towardsdatascience.com/nlp-classification-...
https://towardsdatascience.com/https-medium-com-pi...

Ответ написан более трёх лет назад

Комментировать

Почему работает некорректно?

dmshar @dmshar

Если надо "находить и удалять" одновременно, то делать это МОЖНО только с конца списка

a='a abc ccc cvv v'
b=a.split()
c=[]
for i in b[::-1]:
    if len(i)>=3 and len(i)<=5:
        c.append(i)
        b.remove(i)
print ( c)
print (b)

Результат

['cvv', 'ccc', 'abc']
['a', 'v']

Если очень хочется - потом можно сделать реверс

c.reverse()
print ( c)

['cvv', 'ccc', 'abc']

Ответ написан более трёх лет назад

Комментировать

Что выбрать Python Kivy или Kotlin?

dmshar @dmshar

А чего вы нас тут спрашиваете? Мы ведь не видели вашего приложения. Мы не знаем вашей квалификации. И мы не знаем, на сколько можно доверять совету вашего знакомого. По хорошему, если он дал вам совет, то скорее всего его обосновал - почему это решение не рационально (вообще? или для вашего конкретного случая?). Вот эти его обоснования уже могут быть предметом обсуждения - на сколько они профессиональны, компетентны и на сколько они соответствуют тенденциям в современном "приложениестронии".
А пока абстрактное приложение, абстрактный разработчик, абстрактные условия, абстрактные умозаключения - обсуждать-то нечего.

Ответ написан более трёх лет назад

2 комментария

Обоснованность бутстрап метода.Почему можно экстраполировать на генеральную совокупность?

dmshar @dmshar

Что-то немного не сходится. Проведя ресемплинг мы получаем эмпирическую функцию распределения (например) среднего значения. Для этого распределения (а не для распределения исходной выборки) мы можем строить доверительный интервал, т.е. такие пределы, в которых (условно) в 95 случаях из ста попадет среднее нашей выборки.
Т.е. реальное среднее реальной выборки или матожидание генеральной совокупности вполне может и не попасть в этот доверительный интервал, но вероятность этого меньше 5%. Причем такое заключение мы сделали исключительно на основе имеющихся данных. Если вдруг у нас появятся дополнительные данные из той-же генеральной совокупности, то вполне возможно, что наше заключение придется корректировать.
Главное понять: статистика - это не об уверенности. Никогда! Статистика это на самом деле о вероятности ошибиться в своей уверенности.
P.S. Все таки загляните в книгу, которую я вам порекомендовал в другом месте.

Ответ написан более трёх лет назад

8 комментариев

Доверительный интервал и генеральная совокупность.Какая связь?

dmshar @dmshar

1. Вопрос: будут ли эти выборочные средние распределены нормально относительно величины приблизительно равной среднему росту в ген.совокупности?
Ответ: Да
2.Вопрос:Работает ли центральная предельная теорема?
Ответ: А кто и когда ее отменил?
3. Вопрос: Поэтому мы смотрим диапазон куда входят 95% всех значений и берем его как исчерпывающий результат?
Ответ: Мы сначала из внестатистических соображений выбираем уровень значимости. Он может быть и 0.95, и 0.9 и 0.0000001 - любой. А потом уж строим доверительный интервал, используя выбранный уровень значимости.
Что такое "исчерпывающий результат" - я такого термина в статистике не встречал. Поясните.

Ответ написан более трёх лет назад

Комментировать

Может ли sd=2, если размер выборки 25?

dmshar @dmshar

Господи, опять дисперсия, опять размах. Вы после этой темы
Как соотносится дисперсия с sd?
хоть один учебник открыли?
Кто, где, когда вам сказал, что "дисперсия приближается к размаху"???? А тем более, что "дисперсия должна быть близка к размеру выборки"???? Если у вас будет набор на 10000000 элементов, то дисперсия тоже будет "приближаться"???? Да хоть формулу дисперсии посмотрите для интереса. Там размер выборки в ЗНАМИНАТЕЛЕ!!! Подумайте, что это означает в конце концов.
P.S. Впрочем, подумал- надо бы узнать, в каком классе вы учитесь. Может я слишком многого от вас хочу?

Ответ написан более трёх лет назад

20 комментариев

Войдите на сайт