• Почему pandas не пропускает строку?

    @dmshar
    Если в первой строке у вас названия колонок, то это надо указывать явно. Для этого используйте параметр header. Неплохо бы еще и index_col указать.
    А для работы с пропущенными данными есть несколько параметров - keep_default_na, na_filter, na_values - соответствующей комбинацией которых можно добиться чего угодно.
    Ответ написан
    Комментировать
  • Как сделать распознавание маски на лице на Ubuntu?

    @dmshar
    Вообще-то такие алгоритмы - это know-how:
    https://www.gq.ru/society/masks-surveillance-systems
    https://felenasoft.com/xeoma/ru/articles/mask-detector/
    https://habr.com/ru/company/globalsign/blog/489928/
    https://securityrussia.com/blog/raspoznavanie-v-ma...
    https://www.forbes.ru/newsroom/biznes/395425-v-kit...
    https://rb.ru/story/identity-crisis/
    Можете обратится по ссылочкам к разработчикам. Они вам с удовольствием скинут. За денюжку разумеется и немалую.
    Только когда будете с ними говорить - "распознавание на Ubuntu 20.04" выкиньте из оборота. Уж больно по дилетантски звучит. И явно выдает уровень (не)понимания проблемы. Впрочем, как и просьба поделиться исходниками за "спасибо".
    Ответ написан
    Комментировать
  • Как сделать корректную проверку на то, что символ не принадлежит строке?

    @dmshar
    Сама проверка тут ни при чем - она написана правильно.

    Но вот это:

    if text_lowercase[i] not in alphabet:
                continue


    - классический бесконечный цикл.
    Вы взяли первый элемент строки, проверили, он в "alphabet" не присутствует, вы переходите к следующей итерации НЕ ИЗМЕНИВ значения i. По сути - опять проверяете тот-же символ. И так до бесконечности.

    Просто перенесите i += 1 перед if .

    Правда, у вас еще и предел цикла в while задан с ошибкой, и вообще - программа странноватая. Но это уже другой вопрос.
    Ответ написан
    3 комментария
  • Как можно создать графическое окно, помимо tkinter в python?

    @dmshar
    "Как можно создать графическое окно, помимо способа tkinter" - то, что "tkinter" - это не "способ" - оставим в стороне. А окошки можно создавать и Qt, и Kyvi, и PySide, и WxPython, и PyGUI и целый ряд более редких и экзотических библиотек графичческого интерфейса. Выбирайте те, которые лично вам больше нравятся и кажутся более понятными..
    "создать кнопку в виде маленькой картинки. такое возможно" - да, возможно.
    Ответ написан
    Комментировать
  • Есть ли готовое решение для отображения информации о датасете в удобном для чтения виде?

    @dmshar
    Не совсем понятно, что вы хотите.
    " для отображения информации" что-бы "вообще код не писать" - экспортируйте свой датасет в csv-файл и работайте хоть EXCEL, хоть Tableau (для визуализации), хоть в SPSS.
    Если у вас данные - это временные ряды, то можете попробовать Grafana.
    Описательные статистики выводятся в pandas (ага :-) ) одной командой data.describe().
    Только вот я бы не сказал, что построить ту-же гистограмму проще в EXCEL или в Grafana чем в Python. Даже в Tableau что-бы получить то, что вам надо - надо хорошо разобраться в инструменте.
    Ответ написан
    3 комментария
  • Можно ли отсудить деньги за обучение в колледже, если в нём плохая обр программа?

    @dmshar
    Не вижу связи между вашим выбором именно этого колледжа и будущим российского образования.
    Не нравиться колледж - не платите ему денег, он сам загнется. Вот и будет необходимое "исправление". Кстати, если колледж "педагогический", то никто вам не обещал, что из вас сделают программиста-профессионала. Вам обещали, что вы сможете преподавать информатику детишкам младшего школьного возраста.
    Ответ написан
    3 комментария
  • Как сделать так, чтобы можно было расшифровать пароль?

    @dmshar
    А в чем проблема написать самостоятельно элементарную функцию шифрования-дешифрования и ею работать перед или после поиска в БД?
    Ответ написан
    Комментировать
  • Как отобразить за сколько запустился код Python?

    @dmshar
    Код может либо "запуститься" В какое-то время, либо "выполниться" ЗА какое-то время. По крайней мере - это если пользоваться общепринятыми нормами русского языка. Что такое "за сколько запустился" - абсолютно бессвязная фраза. Что такое "код стартанулся ибо там есть база данных" - тоже как-то очень загадочно звучит. Как и фраза "запускается база данных". Куда? На Луну? Может быть все-таки запускается ПОИСК в базе данных?
    Если у вас есть код, в котором есть обращение к базе данных, то вы перед командой обращения получаете одно значения текущего времени, после того, как поиск в базе отработает - второе, и вычтя первое из второе получаете время, которое ушло на работу с базой. Что еще вы собираетесь мерять?
    И кстати, это не зависит от того, у вас 7 строчек кода или 7 тысяч.
    Ответ написан
    Комментировать
  • Как запустить программу?

    @dmshar
    А чем отличается запуск этой программы от запуска любой другой? - Ничем. Значит ответ на ваш вопрос - "Так-же как и любую другую". Если вы и этого на знаете - то вам не на форум, а книжки читать.
    Ответ написан
    1 комментарий
  • Взял готовый код бота из интернета пытаюсь запустить выходит ошибка что делать?

    @dmshar
    Слава богу, что вы "готовый код бота вязали", а не папину машину из гаража. ВЫ представляете себе, что-бы было, если бы вы сели в машину и попытались поехать не умея ни водить и не зная правил движения. Почему никому не приходит в голову, что "готовый код бота", это не веник, которым можно махать как придется. И не детская игрушка, которая создана для особей с еще ограниченным интеллектом. И что использованию сложных вещей надо учиться.
    Вот и займитесь учебой - программирование, Python и пр. А уж потом "берите готовый код".
    Ответ написан
    Комментировать
  • Какой способ чтения и записи в файл, а также сам тип файлов, наилучший в плане быстродействия при использовании Python для обработки больших данных?

    @dmshar
    Есть такое понятие "бинарный файл". Грубо говоря - в некоторый момент времени делается "снимок" оперативной памяти, и все что там (точнее говоря, в тех объектах, которые вы решили записать в файл) есть переписывается во внешнюю память. Потом точно так можно вернуть назад. Разумеется, это работает, если вы точно понимаете, из какой структуры вы выгружаете данные в файл и абсолютно уверены, что назад вы их будете принимать в абсолютно такую-же структуру. Никаких преобразований, разбивок по строкам/записям, проверок типов - ничего. Искать что-то в этих данных вы будете не тогда, когда они находятся на внешнем носителе, а тогда, когда они уже в ОП. И еще - разумеется, это будет стандартный файл с точки зрения Windows (или другой ОС), вы его будете видеть в проводнике, но если попробуете открыть - например - текстовым редактором, то увидите нечитаемое множество каких-то значков. Все это - расплата за скорость обработки, которая достигается при чтении-записи этих файлов.
    По сути, именно так работают, например, все стандартные приложения, которыми пользуемся, EXCEL, Word и пр.
    Ответ написан
    Комментировать
  • Python сортировка списка?

    @dmshar
    Количество перестановок зависит от метода сортировки, который вы будете использовать. А их есть много. Если допускается переставлять только соседей - то это метод пузырька. А он бывает еще оптимизированный или нет. Все это влияет на количество перестановок. А могут быть перестановки произвольных элементов - там другие алгоритмы работают.
    Примеров реализаций на Python (и на других языках, кстати тоже )- в сети предостаточно.
    Ответ написан
    1 комментарий
  • Есть ли альтернативы JupyterLab?

    @dmshar
    Чем не нравиться Jupyter - могу понять.
    Не понимаю, почему на "зашли" PyCharm и VSCode .
    Но IDE для Python навалом.
    Лично я уже давно использую Spyder и меня вполне устраивает.
    А есть еще Thonny, а есть еще Wing, а есть еще Cloud9 IDE, PyDev, Atom.
    Пробуйте, если не лень.
    Ответ написан
    1 комментарий
  • Как среди строк найти те, что содержат указанную подстроку?

    @dmshar
    Так а в чем ошибка? У меня никакой ошибки не выдает. Ну кроме того, что идентификаторы с1 и с2 в одном месте написаны на кириллической раскладке клавиатуры, а в другом - на латинской.
    Ответ написан
    4 комментария
  • Как список преобразовать в DataFrame?

    @dmshar
    Cоздание датафрейм из списков:
    import pandas as pd
    list_a = [[1,2,3,4,5],
              [6,7,8,9,10]]
    columns = ['a','b','c','d','e']
    df_a = pd.DataFrame(list_a, columns=columns)
    print (df_a)


    Результат


    . a b c d e
    0 1 2 3 4 5
    1 6 7 8 9 10
    Ответ написан
    Комментировать
  • Как разделить "веса" на кластеры КОРРЕКТНО?

    @dmshar
    В алгоритмах кластеризации использующих центроиды (да и вообще - построенные на метрических мерах) как правило требуется задание количества кластеров, на которые вы желаете разбить свой набор данных в качестве входного параметра. Измените приведенный выше вами пример на такой - 1,2,4,11,12,18,19,20. И вот уже непонятно, тут три или четыре кластера? Просто в одномерном случае мы можем построить рисуночек и ответить на вопрос визуально. В многомерном так не получается, и определение "корректного" количества кластеров выливается в отдельную и весьма не простую задачу. И точног, абсолютно обоснованного решения, кстати, может и не иметь. Можете поискать "метод колена при кластеризации". Только зачем себе жизнь усложнять?

    Если же исходить из того, что данные к вам поступают, например, потоком и их надо бить на некоторые кластеры, то я бы вообще - в одномерном случае!!! - задал правило и не мучился бы. Например, в один кластер попадают точки, отстающие от ближайшей точки кластера не далее чем на 1. Или на 2, или на 3 или вообще на 100 - но это как раз и будет тем семантически зависимым параметром вашего алгоритма. При этом надо признать, что количество кластеров может изменяться. Причем и увеличиваться и уменьшаться. Например, в потоке 8,5,4,1,6,7 - у вас последовательно будет 1,2,2,3,3,2 кластера. Но это более менее согласуется с нашим интуитивным представлением. И главное, опровергнуть корректность именно такого количества кластеров - при заданном правиле - не удастся.
    Ответ написан
  • Как решить задачу оптимального распределения задач по времени среди определенного количества исполнителей?

    @dmshar
    В общем виде задача называется "Оптимальное распределение ресурсов".
    Изучается обычно в рамках курсах "Методы математической оптимизации", "Исследование операций", "Линейное и динамическое программирование" и т.д.

    Учебников масса - начиная с классики:
    Вентцель Е. С. Исследование операций: задачи, принципы, методология.
    Ответ написан
    2 комментария
  • Как правильно настроить нейросеть для выделения харктерных точек?

    @dmshar
    В каком виде лучше подавать изображения на CNN (черно-белое, в градациях серого, уменьшенное, в исходном размере?)

    В том виде, в каком вы потом, на этапе использования вашей сети будете подавать ей изображения для нахождения нужных точек.

    и что дать CNN в качестве обучающих выходных данных: изображения с отмеченными точками или массив с координатами каждой точки (их около 70)
    Вариант 2 - "массив с координатами точек". Разумеется, если ваша цель - "находить ключевые точки на лицах".
    Ответ написан
  • Могу ли я устроиться в компанию, с неофициальным опытом программирования на python?

    @dmshar
    Судя по вопросу, вам сейчас лет 15. А судя по другому вашему вопросу, где звучит "когда я ВЫУЧУ python", процесс еще не закончен. Откуда "большой опыт" на python взялся?
    Ответ написан
    3 комментария