Добрый день!
Имеется таблица с полями k1,k2....k100 и надо рассчитать корреляцию (функция CORR) по всем возможным парам (в итоге 100*100/2-100).
Как можно рассчитать корреляции по всем парам, с учетом того, что количество значений полей может различаться?
Пример: всего в таблице 1000 строк, но в столбце k1 встречается 154 пропуска, таким образом все пары показателей, в которых встречается k1, будут размерностью 9846.
Была идея сделать через подзапрос промежуточную таблицу вида
name1 | name2| value1 | value2
k1 | k2 | 1 | 2
k1 | k2 | 1 | 5
k1 | k2 | 1 | 6
и тогда все должно получиться через group by , но вот не нашел, как из оригинальной таблицы сделать такую.
Обновление: нашел вариант
Ссылка.
Если есть другие предложения, будет полезно знать.