• А можно ли сделать так, чтобы ML-движок сам выделял признаки из набора однотипных данных? Например, слова в тексте. Как?

    @dmshar
    А можно ли как-то переложить эту задачу на машину? --> Можно.
    существуют ли алгоритмы-технологии, ---> Существуют.
    Это вообще в принципе уже реализовано? -->Реализовано.
    Как это называется? Что курить, читать, гуглить, смотреть? --> Начните с "векторизации текста", далее - по ссылкам.
    Ответ написан
    1 комментарий
  • Как устроено хранение данных в pandas series?

    @dmshar
    Если вам просто для интереса - ну можно, конечно, поискать ответ на просторах интернет. Интереснее это делать самому, а не пожнав плоды чужого поиска.
    А если у вас интерес профессиональный - то напоминаю, что Pandas - проект открытый. Более того, как написано на сайте - "pandas is mostly developed by volunteers. All kind of contributions are welcome, such as contributions to the code". Соответственно, всегда можно присоединится к этом проекту https://pandas.pydata.org/docs/development/index.html и поучаствовать в нем, а по дороге найти и ответ на ваш вопрос.
    Ответ написан
    Комментировать
  • Как стать инженером дата центров?

    @dmshar
    Коллеги выше все правильно сказали, только вот не обратив внимание на фразу "мне 14 лет,". Поэтому для общего развития можно и вакансии посмотреть и книжки какие-нибудь почитать - не помешает. Но главный ответ - выбрать хороший университет и отучившись там - после этого (а еще лучше - параллельно с учебой) идти искать "свой" датацентр.
    Предвидя следующий вопрос - в универе обращать внимание на специальности типа Computer engineering (если про инженер ДЦ) или более широко - факультеты компьютерных систем, информационных технологий или прикладной информатики (если про системного администратора). Хотя имея за плечами любое их этих направлений "перескочить" будет не очень сложно.
    Говорят, в некоторых колледжах и прочих ПТУ учат аналогичным профессиям - но с моей точки зрения, эта профанация. А уж про курсы всякие, которые обещают золотые горы после месяца-трех-полугода обучения (спонсирования твоими родителями безбедного существования лекторов на таких курсах) - я и говорить не хочу, тут на форуме эта тема уже изжевана сотню раз.
    Ответ написан
    Комментировать
  • На чем лучше делать ML-движок/модель - на Python или C++? Где библиотек больше и т.п.?

    @dmshar
    Если вы не понимаете преимущества и недостатки этих языков именно в задачах ML, а кроме того, вы в одну кучу намешали "ML-движок" и "ML-модель" , то это просто означает что у вас (и вашей команды) знания в области ML реально нулевые. В таком случае писать самостоятельно "ML-движок" я бы вообще поостергся. Как вам уже посоветовали - нанимайте людей, которые имеют соответствующую экспертизу, они и на ваши вопросы вам ответят. Опыт в программировании и опыт в ML - это близкие, но совершенно различные скилзы.
    P.S. Про вопрос - а ЗАЧЕМ самостоятельно писать "ML-движок" - я вообще умолчу.
    Ответ написан
    1 комментарий
  • Как сделать анализатор сети?

    @dmshar
    Есть такой пакет-расширение pyshark. Используется при программировании на Python, естественно.
    По сути - обертка над tshark. С его помощью файл pcap парситься достаточно просто.
    Страничка проекта: https://pypi.org/project/pyshark/
    Ответ написан
    Комментировать
  • Как в цикле сменить колонку вывода?

    @dmshar
    Примерно так:
    import pandas as pd
    tbl=pd.read_excel("Книга2.xlsx",index_col=0,header=0,dtype={'A': str})
    cr=True
    list_inn = ["1","3","4"]
    for listt in list_inn:
        if cr==True:
            print(tbl.loc[int(listt)].B)
            if tbl.loc[int(listt)].B=='char':
                cr=False  
        else:
            print(tbl.loc[int(listt)].C)


    Результат:

    some text
    char
    S
    Ответ написан
    3 комментария
  • Какими системами управления, мониторинга кинооборудования пользуются кинотеатры?

    @dmshar
    Непонятно, кто вы такой (по должности), если сами решили "взять все в свои руки" в каком-то абстрактном кинотеатре, который есть в вашем городе. И непонятно кто те "они", которые "они отказываются говорить, каким именно ПО они пользуются". Поэтому предложения следующие:
    1. Пытать этих самых "они", с применением современных средств физического воздействия.
    2. Прочитать, что написано на сайте, адрес которого вы привели: "Впервые наша система мониторинга заработала в 2015 году. С тех пор она притерпела огромное количество изменений, приобрела множество нового функционал......
    Мы вложили в систему огромный опыт работы с кинооборудованием, ..... А также все знания сертифицированных инженеров цифрового кинопоказа.
    ." Подумать, где и как вы можете приобрести не просто аналогичные знания и умения, но и передать их тем разработчикам ПО, которые будут реализовать некоторый аналог для вас. Ситуация упрощается тем, что удаленный сетевой мониторинг вам делать вроде бы не надо - кинотеатр уже у вас в руках, на оборудование можно посмотреть и потрогать его руками - т.е. вполне сгодиться локальное решение.
    3. Внимательно прочитать информацию, которая приведена на сайте (и возможно в документации, которая сопровождала используемое решение), использовать ее в качестве подсказки при написании ТЗ на свою систему.
    4. Нанять разработчиков, заплатить им денег.
    5. Не забыть приковать их цепями к вашему проекционному оборудованию, а то и эти от вас сбегут - потом придется все начинать с начала.
    Ответ написан
    Комментировать
  • Выбор оптимального метода распределения банкоматов по территории города?

    @dmshar
    А что тут советовать. Метод выбрали. Метод МОЖЕТ сработать (гарантии предварительно дать никто не может), значит надо просто пробовать. Получиться - отлично. Нет - будете разбираться почему и искать пути решения возникших по ходу вопросов. Если вопрос а том, как использовать выбранный метод - то глупо об этом спрашивать на форуме. Просто открываете соответствующие книги, читаете и применяете. Там все написано - подробно, с примерами и даже кое где с реализациями.
    По второй задаче - а не расшифруете, что вы имели ввиду под "определить оптимальное количество на n территории"? То-ли каково тут должно быть число n - но тогда надо определять, что такое "оптимальность" в данном случае. То-ли вы имели ввиду как распределить банкоматы на n-ной территории". То-ли ві хотели определить, а сколько банкоматов вам вообще нужно. Дайте точную формулировку. Тогда и говорить о чем-то будет можно.
    Ответ написан
  • Как вычислить веса линейного классификатора?

    @dmshar
    Не надо изобретать велосипед. Ваша задача - это классика. Называется
    Метод_опорных_векторов (https://ru.wikipedia.org/wiki/Метод_опорных_векторов).
    Имеется куча литературы, да и в интернет тема раскрыта неплохо.
    (Просто несколько ссылок для "раскрутки"
    https://www.projectpro.io/data-science-in-r-progra...
    https://www.analyticsvidhya.com/blog/2021/03/begin...
    https://habr.com/ru/company/ods/blog/484148/

    Правда она математически сложнее регрессии. Но если вам надо - читайте, изучайте, применяйте.
    Ответ написан
    Комментировать
  • Найти макс количество отрезков b на отрезке a?

    @dmshar
    Если после аж 20 минут самостоятельного глубокого раздумья у человека возникает непреодолимое желание побежать искать ответ на форум - то скорее всего программирование это не то занятие, которое ему подходит.
    Тем более, если речь идет о задаче, сложность которой уже описали выше.
    Делайте выводы - или меняйте свои привычки, или меняйте сферу деятельности.
    Ответ написан
  • Как прервать и перезапустить программу?

    @dmshar
    if bet != 0 and bet !=1 and bet != 2:

    или так
    if bet not in (0,1,2):
    Ответ написан
    Комментировать
  • Что действительно пишут на Python как правило в бизнесе?

    @dmshar
    С завидным постоянством, примерно раз в месяц, на кого-то падает озарение и он задает этот вопрос. Даже не удосужившись порыться самостоятельно в поисках ответа.
    Вот, ровно месяц и два дня назад:
    https://qna.habr.com/q/1182966
    Там же есть ссылки на статьи, где вы найдет вполне конкретные ответы на ваши вопросы.
    Ответ написан
  • Путь в NLP/CV через DataScience?

    @dmshar
    Можно много чего говорить в ответ на ваш вопрос - размышлять, приводить примеры, и пр.

    А можно просто спросить - а нужно-ли врачу-хирургу учить химию? Это же явный
    оверхед для него?
    А нужно-ли экологу учить географию?
    А нужно-ли инженеру-строителю учить физику/математику?

    Тем более, что на уровне базового обучения никто не скажет, чем же вы будете точно заниматься (даже если останетесь в профессии) лет через 10-20.

    Вот и делайте выводы.
    Ответ написан
    Комментировать
  • Как в NumPy из k векторов получить (k+1)-мерный массив комбинаций?

    @dmshar
    Можно еще вот так:
    import itertools
    x = [1, 2, 3]
    y = [10, 20, 30]
    z = [100, 200, 300]
    
    ar=np.array(list(itertools.product(x,y,z))).reshape(len(x),len(y),len(z),-1)


    Результат:
    array([[[[  1,  10, 100],
             [  1,  10, 200],
             [  1,  10, 300]],
    
            [[  1,  20, 100],
             [  1,  20, 200],
             [  1,  20, 300]],
    
            [[  1,  30, 100],
             [  1,  30, 200],
             [  1,  30, 300]]],
    
    
           [[[  2,  10, 100],
             [  2,  10, 200],
             [  2,  10, 300]],
    
            [[  2,  20, 100],
             [  2,  20, 200],
             [  2,  20, 300]],
    
            [[  2,  30, 100],
             [  2,  30, 200],
             [  2,  30, 300]]],
    
    
           [[[  3,  10, 100],
             [  3,  10, 200],
             [  3,  10, 300]],
    
            [[  3,  20, 100],
             [  3,  20, 200],
             [  3,  20, 300]],
    
            [[  3,  30, 100],
             [  3,  30, 200],
             [  3,  30, 300]]]])
    
    ar.shape
    (3, 3, 3, 3)
    Ответ написан
  • Как решить задачу языком программирования?

    @dmshar
    Боюсь, что языком программирования эту задачу не решить. Решить ее можно мозгами. А вот записать решение - с помощью языка программирования.
    А поскольку вам все равно, каким "языком программирования" пользоваться, то вот вам решение.
    flag=False
    dt=datetime.date(2022,1,1)
    while dt<datetime.date(2023,1,1):
        if flag==True:
            color='Черная'
        else:
            color='Белая'      
        print(dt,color)
        flag= not flag
        dt+=datetime.timedelta(days=1)


    И фрагменты вывода:
    ...
    2022-02-25 Черная
    2022-02-26 Белая
    2022-02-27 Черная
    2022-02-28 Белая
    2022-03-01 Черная
    2022-03-02 Белая
    2022-03-03 Черная
    ...
    2022-03-29 Черная
    2022-03-30 Белая
    2022-03-31 Черная
    2022-04-01 Белая
    2022-04-02 Черная
    ....

    Как вы и просили, "о нюансах календаря" не забыли.
    Ответ написан
    4 комментария
  • Как заставить функцию заново выполняться при повторном вызове?

    @dmshar
    Ну, если у вас действительно в коде написано вот так:

    file_name, pattern = Gen()
    print(file_name, pattern)
    Gen()
    print(file_name, pattern)

    то покажите мне, где именно в этом коде переменные file_name, pattern изменяются между первым и вторым вызовом print().
    Ответ написан
    3 комментария
  • Какой дизайн исследования и статистические критерии можно использовать?

    @dmshar
    Извините, но вопрос поставлен как-то очень "криво". Не цель (какое исследование?) подбирают под данные, а данные ищут под решение конкретной задачи. Поэтому написали, что надо проверить гипотезу о соотнесении покупки товара с принадлежностью покупателя к конкретной группе - вот это исследование и проводите. Это, кстати, классическая задача, приводимая в качестве примера применения машинного обучения к маркетинговым задачам. Задача сводиться на самом деле к т.н. "анализу номинальных признаков", таблицам сопряженности Пирсона, в маркетинге это часто называют "A/Б анализом" Информации куча.
    Ответ написан
    2 комментария
  • Интерпретация результатов classification_report обученной модели KNeighborsClassifier библиотеки sklearn?

    @dmshar
    Не пойму, в чем проблема интерпретации отчета? Ну вот объяснение, более-менее вменяемое.
    https://muthu.co/understanding-the-classification-...
    надеюсь, что такое precision, recall, f1-score,support и как их трактовать - вам известно. На всякий случай:
    https://www.jcchouinard.com/classification-report-...
    bazhenov.me/blog/2012/07/21/classification-perform...
    Если порыться, можно найти и медицинско-диагностическую трактовку этих метрик
    Ответ написан
    2 комментария
  • Как применить машинное обучение для медицинских данных (пример данных под катом)?

    @dmshar
    Сегодня по количеству работ по применению методов машинного обучения медицина наверное занимает второе место после финсектора. А вы спрашиваете, что можно сделать. Да что угодно - про IBM Watson надеюсь слышали? Так это только самый известный пример.
    Ну вот из последнего. Нечто даже прямо с habr'a.
    https://habr.com/ru/company/first/blog/682516/
    https://webiomed.ru/blog/obzor-rossiiskikh-sistem-...
    https://habr.com/ru/post/673312/
    https://towardsdatascience.com/machine-learning-in...
    https://towardsdatascience.com/ai-for-healthcare-a...
    https://developer.ibm.com/product-doclinks/
    https://www.cnews.ru/articles/2019-11-20_nmits_onk...
    https://data-flair.training/blogs/big-data-in-heal...
    ну и так далее. Читайте, смотрите, думайте. Одно знаю абсолютно точно (по опыту). Для того, что-бы разрабатывать такие системы нужна очень плотная кооперация и взаимопонимание между условным врачом и условным датасаентистом. А поскольку такие задачи с "налета" не решаются - у "врача" должна присутствовать очень мощная заинтересованность, а у обычных "энтузиастов" из-за сложности задач запал заканчивается как правило довольно быстро. И остается ИТ-специалист с полуготовым решением на руках, которое и не приткнёшь никуда, и не лицензируешь и уж тем более не доведешь до ума без помощи "врача". Поэтом у врача должен быть какой-то внешний стимул, причем очень сильный.
    Причем и "врач" и "датасаентист" в данном случае - это не один человек, а некоторые группы соответствующих специалистов. Иначе получите поделку, которая никому кроме самого автора и нафиг не будет нужной. Учтите это, когда будете искать "сотрудников".
    Ответ написан
  • Возможно ли учить два языка программирования одновременно?

    @dmshar
    В вашем конкретном случае - не стоит. Почему? Потому что вы спрашиваете. Такое впечатление - что торгуетесь "Вот выучу два языка, а какую конфетку я за это получу?"
    А тот кому это действительно интересно - тот не спрашивает окружающих, а берет и учит. Потому что делает это не ради "конфетки", а что-бы реально набраться ума-разума.
    Ответ написан
    1 комментарий