Задать вопрос
@koliane

Как выбрать размеры интервалов для неравно интервального вариационного ряда?

Делаю карту мира, где нужно раскрасить разными цветами страны в зависимости от их численности населения. Всего должно быть, например, 8 цветов. Как определить границы интервалов, т.е. значения численности от-до, для каждого цвета?
Вот более наглядный пример того, что имею ввиду и что хотелось бы в итоге получить, на сайте ourworldindata:
685aecc10254c168430023.png
На картинке видно, что
  • для населения более 1 млрд. людей есть всего 2е страны
  • для населения от 300 млн. и до 1 млрд. одна страна (США)
  • а для населения от 10 млн. до 30 млн. стран больше 30

Хотелось бы сделать также или похоже. Ясно, что тут как-то опирались на плотность распределения.
Есть ли уже известные устоявшиеся подходы для определения границ таких интервалов? Как это сделать более оптимально?
Решение/подход должно подходить не только для задачи с "численностью населения", но и для множества других разбивок, например, по ВВП или среднему возрасту и т.д.
Если можно, то хорошо бы увидеть примеры решения.

Если кому-то нужны данные для экспериментов, то их можно скачать на том же сайте, кликнув на кнопку Download-> Вкладка Data -> клик на Download displayed data
Формат данных (.csv) следующий:
Entity,Year,all years
Afghanistan,2023,41454709
Albania,2023,2811615
  • Вопрос задан
  • 29 просмотров
Подписаться 1 Средний 2 комментария
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы