Задать вопрос
  • Как присвоить мусорным описаниям книг дефолтную рубрику в датасете?

    sur-pavel, Ну это другой вопрос уже. То есть все labels у нас есть. Что значит вычислить? У тебя представление что есть некие формулы которые понимают текст? Твой текст будет закодирован в векторную форму many-to-many hot encodeing твой labels тоже будет закодирован в векторную форму one-to-many hot encoding. Далее он будет "учить" параметры модели которые минимизируют accuracy это будет метрика у loss функции. Остальное это вопрос препроцессинга, как входных так и выходных данных, что бы сделать обучение более простым и эффективным.
  • Где учить нейросети python?

    Jut_Rut, Подтягивай, если честно я не представляю, как без языка выйти хотя бы на средний уровень. Что бы не переведенные туториалы запускать, а самому брать и делать.
  • Какой ИИ есть для отслеживания бизнес-процессов?

    Maria232303, Да, в некотором смысле. Нужно произвести анализ ваших данных и построить модель. Например вот есть вот эти метрики можно проверить не образуют ли группы/кластеры. Затем этим этим кластерам можно дать названия, ну например 1. отлично 2. Хорошо, 3. Средне, 4. Плохо. Затем можно построить классификатор, который будет классифицировать входные данные ваши метрики с одной из групп. Затем в рамках данной модели можно провести анализ важности признаков (ваш метрик), ну и например главный наш вход это отчетности. Затем мы можем "сформулировать" отношения между отчетностью и нашим состоянием "хорошо" к примеру и вывести зависимость, что если в нашей отчестности что то изменится то мы будем классифицировать наше состояние как плохо.

    В зависимости от количества данных, это может задача для одного или целой команды специалистов. Это я так очень-очень упрощенно, что бы хоть какая то идея была у вас. Ну и это не единственный возможный подход, их много.
  • Где учить нейросети python?

    Наверное лучшая рекомендация.

    Depp Learning with python by François Chollet куда более что называется beginners friendly, но вышеупомянутая книга, это как цель в какой то момент, чувствовать себя комфортно с каждой главой книги.
  • Обучение модели машинного обучения прерывается без ошибки. Что может быть причиной и как это решить?

    1bENZ0, Ну видишь, уже хоть предупреждения. Попробуй все что пишут из ответов вот здесь. https://stackoverflow.com/questions/59864408/tenso....

    Насчет loss это номинальные цифры. Там направление и форма важна, нет такого много или мало. На тренировчном сете твой loss стремится к нулю на валидационном с какого то момента начинает расти U-формы.
  • Является ли цена за проект неадекватно завышенной?

    Thoros,
    Ну так поэтому я и накатал этот пост, чтобы узнать рыночную цену за свой труд.
    Ты так и не понял, ну да ладно. Для тебя рынок это товар/услуга и ценник. Рынок это состояние, с изменяющимися прайсами. Ты же видел финансовые рынки где прайс меняется. Такси, булочная, фриланс, и т.д. кроме скорости изменения прайса (нахождение справедливой цены по отношению к текущему состоянию рынка), ни чем не отличается.

    Относительно оценки рынка. Нет такого я хороший специалист мне заплатят хорошо или я плохой специалист у меня совсем нет шансов. Хороший товар/услуга имеет репутацию, требует рекламы, продвижения и т.д Что бы рынок его оценивал. Вот у нас в IT есть нулевая гипотеза: джун ничего/почти ничего не умеет. Почему так? Да что бы недоплачивать человеку, и никто не будет выяснять справедливую цену, оценивать его навыки и т.д. Таковы правила рынка. Как рынок тебя воспринимает такова и цена.

    Про санта-барбару. Ты можешь делать все что считаешь нужным. Этикет это не про то ты мне я тебе. Это абсолютно личная история.
  • Баг или кривые руки при написании простого парсера через BeautifulSoup?

    Запрос к серверу происходит успешно, просто poisk = bs.findAll("div", class_="grid-wrapper") вот здесь парсер ничего не находит по этому poisk - пустой список.
  • Как исправить данные ошибки Python?

    О О, Все достаточно, я тебе сразу говорю открывай туториал по тому как работать CountVectorizer и делай правильно.

    Я не буду тебя учить писать код, который никогда не должен быть написан, лишь бы запустиля.

    1. У нас объект словарь у которого значения фреймы + иерархичесикие + значения в этих фреймах python объекты. Они не поддерживают векторизацию.В среднем pandas в 100 раз быстрее чем python. На простых оперциях, по мере роста эта коэффициент будет расти не линейно. Так вот у нас нету никакого pandas потому что, как только тип данных колонок (object) то есть один из типов python, то мы не быстрее python, а можем быть только медленнее. Все у нас ничего нету. Посмотри на значения своих колонок мы на них ничего не сделаем.

    2. Нет None быть не должно.

    3. Декомпозируй задачу, и постепенно выполняй ее правильно. Весь код не годится.
  • Как исправить данные ошибки Python?

    О О, ты можешь использовать обернуть, в try except и код запустится. И даже он там заполняет этот фрейм. Но я тебе еще раз говорю, таким образом заполнять иереархичские фреймы, это безнадега. То есть
    try:
        summary[category]['Count', indx_stop[stop]] = top_list(vect, train_data, 20)
    except IndexError:
        pass
    И так же ниже в коде, где ты подобную оперцию делаешь. Но все это очень плохой код, мы делаем то что делать не должны. Лишь бы запустилось, все надо переписывать. Фундаментально попытка не правильная.
  • Как исправить данные ошибки Python?

    О О, Не 10 минут не требуется, я уже понял в чем ошибка, сейчас посмотрим поправима ли она.
  • Как исправить данные ошибки Python?

    О О, Это не теоретически, это значение твоего объекта, именно твоего, а не как бы твоего, распечайтай после summary[category] = pd.DataFrame(columns=mux), сначала ключи словаря, они там все, а затем значение любого ключа. Сейчас, минут 10 подумаю и найду ошибку, хотя весь код переписывать надо, справишься с этой придет другая.
  • Как исправить данные ошибки Python?

    О О,
    6502c2c5d2f6c248559248.png Вот так выглядит каждое значение твоего словаря (фрейм), которые ты пытаешься заполнить, это что бы ты понимал что происходит. Это к слову о декомпозиции.
  • Как исправить данные ошибки Python?

    О О, Конечно, я тебе еще в ответе на это указал. Более того каждый фрейм не простой а имеет иерархичекий индекс. У него не просто колонки, а затем ты итеририруешься по ним и пытаешься заполнить. Перечитай мой ответ. Я тебе не зря указал посмотреть примеры использования CountVectorizer.

    summary[category] = pd.DataFrame(columns=mux) Вот это что такое? Это каждое значение твоего словаря фрейм еще и с иерархичесиким индексами.
  • Как исправить данные ошибки Python?

    О О, перед вот этой строчкой summary[category]['Count', indx_stop[stop]] = top_list(vect, train_data, 20)
    сделай, print(summary.keys())
  • Как исправить данные ошибки Python?

    О О, Здесь происходит запись в словарь summary значений по ([][]) двойному ключу, причем. Но значениями в словаре у тебя являются pandas dataframe. И пытаешься ты записывать в каждый фрейм который в свою очередь является значениям в твоем словаре.
  • Как исправить данные ошибки Python?

    О О, Ну это понятно, и из сообщения об ошибке.
    summary[category] - вот это ключ словаря.
    ['Count', indx_stop[stop]] - вот это затем когда ты получил выбрал определнный фрейм, попытка выбора подсета фрейма.
    далее выбранному подсету ты присваиваешь значения.
    Ну сделай print(cats) до всех циклов. Я не знаю это я так понимаю только часть программы, попробуй cats = category.copy()
  • Как достать с pdf файла (с ссылки на pdf)?

    Fanerka, Можешь дописать, но принципиально направление решение задачи не правильное. Я не думаю, что кто то будет с ним тут возится. И я бы не рассчитывал, на автоматизацию парсинга pdf файла, они совершенно не для этого.
  • Почему не дополняются значения в return?

    Nulltiton, Да нормально все. Этот оператор появился в python 3.8 и особо популярностью не пользуется. Редко где его используют. Его можно использовать в return просто как выяснился нюанс нельзя с атрибутами. То есть return (a:= a+1) при условии что а в области видимости, потому что всегда выполняется сначала то что справа от знака присваивания. А тут вскрылся нюанс, так что даже наоборот хорошо.