Совмещать можно несколькими способами - по "горизонтали", по "вертикали", подробнее pandas dataframe merge, concat. Есть еще join но скорей всего тут merge, concat или просто append - добавление строк в конец.
Я пытаюсь добавить таким образом
df = pd.DataFrame (np.concatenate (pred_prob, pred, y_test), axis = 1)
возникает ошибка
TypeError: only integer scalar arrays can be converted to a scalar index
Возможно проблема в размерности матриц.
я не знаю как их преобразовать, чтобы совместить
Полина Подкуйко,
первый это двумерный массив 20 строк по 5 элементов, второй и третий одномерный по 20 элементов, нужно 2 и 3 прилепить к первому в двух качестве столбцов ?
и так же со вторым списком реальных значений, только с другим названием колонки, например, y2_test Если просто from_records, то будет датафрейм из одной строки по 20 столбцов, а нужно 1 столбец на 20 строк.
Итого df1 - 5 колонок, 20 строк, df2 и df2 по 1 колонке, 20 строк.
что делает ? Pandas создаёт датафрейм какой-то функцией, которая входит в класс DataFrame и вызывается после нее pd.DataFrame.from_xxx , т.е. from_excel, from_records.
PavelMos, спасибо, получилось. Теперь я хочу добавить набор x_train из 20 строк и 9 столбцов (pandas.core.frame.DataFrame) к этим же данным. Дублируются индексы
Подробнее ? По идее, если добавляются колонки с таким же число строк, наоборот, нужно, чтобы индексы были одинаковыми. Тут есть, правда, на инглише, примеры что будет происходить с индексами, которые отсутствуют в одной или нескольких соединяемых таблицах: https://pandas.pydata.org/pandas-docs/stable/user_...
Можно наверное попробовать ignore_index=True добавить. Но проблем с вновь созданными двумерными массивами быть не должно, вроде