Как рандомно перемешать данные столбцов в csv файле?

Question

Виктор @victafonenko

Как рандомно перемешать данные столбцов в csv файле?

Задача: рандомно перемешивать строки в каждом столбце CSV таблицы. Какие есть способы, подскажите пожалуйста.

Подробнее: К примеру есть большой массив со спарсенными данными. Скажем так - в первом столбике имена, во втором фамилии, в третьем улица проживания, в четвертом номер дома, в пятом телефон. И мне нужно каждый раз перемешивать содержимое столбцов чтобы получать уникальные сгенерированные "личности".

Столбцы большие, по 10 тысяч строк в каждом. Выборка берется из первых 5 тысяч строк. Ну это уже детали.

Вопрос задан более трёх лет назад
2398 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

3 комментария

Виктор @victafonenko Автор вопроса

Спасибо за ваш ответ. У меня большой массив с данными. Скажем так - в первом столбике имена, во втором фамилии, в третьем улица проживания, в четвертом номер дома, в пятом телефон. И мне нужно каждый раз перемешивать содержимое всех столбцов чтобы получать уникальные сгенерированные "личности".

Написано более трёх лет назад
Виктор @victafonenko Автор вопроса

вы мне советуете использовать эксель и =rand() . А к примеру у меня сразу 30 таких столбцов с данными? Я эксель уже отмел в виду неудобства. Странно конечно что ни в опен офисе ни в экселе нет по умолчанию возможности рандомной сортировки. Костыли со случайными числами это просто жесть какая то.

Написано более трёх лет назад
maaGames @maaGames

Mouseman: Понятно, т.е. вам нужно перемешивать не столбцы в строке, а строки в столбце. Я сперва с точностью до наоборот понял. Суть задачи ясна.
Если вы умеете программировать, то написать перемешиватель данных будет не сложно, csv элементарно парсится. Но это если умеете программировать...

Ещё появилась мысль, что можно не перемешивать "каждый раз", а формировать новый набор данных. Т.е. добавляя нового человека для каждого из столбцов будет браться случайная строка из исходного набора. Не знаю, можно ли такое закостылить в экселе, я в нём только базовые какие-то вещи делать умею. Если там можно написать выражение типа "=$C$RAND(1-10)", то это будет неплохим решением. Это я подразумеваю, что ячейке присваивается значение из ячейки С со случайным номером от 1 до 10. Не знаю, можно ли так написать.

Написано более трёх лет назад

5 комментариев

Виктор @victafonenko Автор вопроса

Спасибо за ответ. Насчет первого. textpad.com. Этот редактор разве открывает нормально csv таблицы? Как он может мне перемешать столбцы и их содержимое, не затрагивая сами столбцы между собой? Помоему там самая обычная сортировка, сортировка строк. Отсортировать строки я могу проще через Sublime Text, у него есть специальная опция Shuffle.
2. Эм.. Это вы язык какой привели?

Написано более трёх лет назад
Виктор @victafonenko Автор вопроса

Если я вас правильно понял, то что вы советуете, это просто перемешка строк. А у нас CSV таблица вообще-то. Если тупо перемешать строки в файле, нарушится структура таблицы.

Написано более трёх лет назад
Dimonchik @dimonchik2013

а "csv - таблица" это как? впервые слышу, если честно

в обычном csv файле все строки, кроме первой (заголовок) равноправны, нет разницы, в каком , в т.ч. случайном, порядке их выводить

можете привести пример именно таблицы?

Написано более трёх лет назад
Владимир Олохтонов @sgjurano

Mouseman: Это такой некрасивый питон)

Написано более трёх лет назад
Виктор @victafonenko Автор вопроса

dimonchik2013: обновил вопрос)

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

+1 ещё

Средний
Есть ли у вас Oracle Application Server 10g?
- 2 подписчика
- вчера
- 165 просмотров
1

ответ
Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 755 просмотров
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 555 просмотров
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 620 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1345 просмотров
10

ответов
Программирование

Простой
Как создать и использовать свою кодировку знаков?
- 1 подписчик
- 02 июн.
- 728 просмотров
4

ответа
Базы данных

Средний
В чем разница между логической и физической модели в БД?
- 1 подписчик
- 27 мая
- 302 просмотра
3

ответа
Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 877 просмотров
9

ответов
Программирование

Простой
Олимпиадное программирование — с чего начать?
- 1 подписчик
- 18 апр.
- 599 просмотров
2

ответа
Программирование

Простой
Как управлять/хранить изображения для UI?
- 1 подписчик
- 10 апр.
- 314 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2016-02-09 09:59:03

1. Откройте в Excel
2. Добавьте строку и заполните её случайными числами
3. Отсортируйте столбцы по значению этой строки со случайными числами.
4. Повторите для каждой строки таблицы (если каждая строка длжна быть отсортирована индивидуально)
5. Удалите строку со случайными числами
6. Профит.

А вообще, непонятен смысл действа. Если все данные перемешивать, то может просто случайными числами заполнить?

Answer 2 · 2016-02-09 01:25:22

если без программирования:

1) https://www.textpad.com/
2) f9 (Sort) и играешься во всех трех сортировках одновременно, можно несколько раз, меняя длины

если с программированием

#-*- coding:utf-8 -*-
import random

filename='c:/filename.csv'
f=open(filename)
lines = f.readlines()
f.close()
random.shuffle(lines)
f=open(filename,'w')
f.writelines(lines)
f.close()

Answer 3 · 2016-02-09 22:46:34

def shuffle(df, n=1, axis=0):     
     df = df.copy()
     for _ in range(n):
         df.apply(np.random.shuffle, axis=axis)
     return df

df = pandas.read_csv('your_file.csv')
shuffle(df)

Отсюда: stackoverflow.com/a/15772356

Как рандомно перемешать данные столбцов в csv файле?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт