Как в Oracle или Teradata разбить все строки таблицы на N равновеликие СЛУЧАЙНЫЕ выборки?

Question

Иван Мельников @immelnikoff

Изучаю БД

SQL
Oracle

Как в Oracle или Teradata разбить все строки таблицы на N равновеликие СЛУЧАЙНЫЕ выборки?

Под случайной выборкой понимаю равномерное распределение элементов данной выборки по генеральной совокупности.
В Teradata можно получить случайную выборку размера k так:

SELECT *
FROM t1
SAMPLE RANDOMIZED ALLOCATION k;

Можно, конечно, продолжая дальше, из оставшихся строк сделать такую же выборку и т.д.
И если k = кол-во строк в таблице / N, то получим N равновеликих случайных семпла.
Но что-то уж слишком геморно. Мне кажется, должно существовать одно-двух строчное встроенное решение. Интересует как это сделать в Teradata.
Подскажите, пожалуйста.

Вопрос задан более трёх лет назад
561 просмотр

Комментировать

Подписаться 3 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

9 недель

Далее
Академия Эдюсон

SQL-разработчик: тариф Базовый

2 месяца

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Oracle

Средний
Где скачать Oracle Application Server 10g?
- 3 подписчика
- 10 июл.
- 282 просмотра
1

ответ
1С-Битрикс

+1 ещё

Простой
Как получить доступ к SQL-базе Bitrix 14.5?
- 2 подписчика
- 18 мар.
- 311 просмотров
2

ответа
SQL

+2 ещё

Простой
Как ИИ использовать для написания sql запросов?
- 1 подписчик
- 02 мар.
- 985 просмотров
5

ответов
SQL

Простой
Как мне перестроить sql-запрос так, чтобы сообщение не удалялось, с изменением его содержания в начале?
- 1 подписчик
- 01 февр.
- 210 просмотров
1

ответ
SQL

Простой
Как получить последнюю запись для определённого поля?
- 1 подписчик
- 03 дек. 2025
- 348 просмотров
2

ответа
Виртуализация

+2 ещё

Средний
Запуск двух виртуальных машин. Как правильно?
- 1 подписчик
- 12 нояб. 2025
- 681 просмотр
3

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб. 2025
- 332 просмотра
1

ответ
SQL

Простой
Почему INSERT присваивает только один символ вместо полного значения?
- 2 подписчика
- 29 окт. 2025
- 246 просмотров
2

ответа
SQL

Простой
Правильно ли написан SQL-запрос для вывода клиентов с действующими (непогашенными) кредитами?
- 1 подписчик
- 19 окт. 2025
- 281 просмотр
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт. 2025
- 285 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2020-11-07 03:17:47

select t1. *, ntile(N) over (order by dbms_random.random) nbatch  from t1

А дальше выбираете нужные части nbatch.
ntile в Oracle используется для построения гистограмм, поэтому +/- должен работать быстро.

Answer 2 · 2020-10-30 19:39:42

Практически методом Монте-Карло помечаем числами из случайного интервала записи таблицы и берем интересуемую порцию по этой случайной метрике. Поскольку, рандом у нас по равномерному закону распределения работает, то и порцию данных вы получите примерно ожидаемой длины.

select *
from (
select t.*, dbms_random.value(0, 100) rnd
  from table t
) A
where A.rnd <= 30 -- выбираем примерно 30% случайных записей от ген. выборки

Как в Oracle или Teradata разбить все строки таблицы на N равновеликие СЛУЧАЙНЫЕ выборки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт