Как распарсить вложенный JSON с помощью Spark.sql, Spark.Dataframe или azure data factory так, чтобы у меня была таблица в реляционном виде?

Question

Denis @denislysenko

data engineer

Как распарсить вложенный JSON с помощью Spark.sql, Spark.Dataframe или azure data factory так, чтобы у меня была таблица в реляционном виде?

У меня есть файл json и его вложенность просто зашкаливает

Как распарсить файл json при помощи Spark или azure data factory так, чтобы у меня в итоге была таблица без вложений. Есть ли какой то универсальный способ как это сделать?

Например json выглядит вот так:

{
 "id": "0001",
 "type": "donut",
 "name": "Cake",
 "ppu": 0.55,
 "batters":
  {
   "batter":
    [
     { "id": "1001", "type": "Regular" },
     { "id": "1002", "type": "Chocolate" },
     { "id": "1003", "type": "Blueberry" }
    ]
  },
 "topping":
  [
   { "id": "5001", "type": "None" },
   { "id": "5002", "type": "Glazed" },
   { "id": "5005", "type": "Sugar" },
   { "id": "5007", "type": "Powdered Sugar" },
   { "id": "5006", "type": "Chocolate with Sprinkles" },
   { "id": "5003", "type": "Chocolate" },
   { "id": "5004", "type": "Maple" }
  ]
}

схема этого json выгдялит так:

root
 |-- batters: struct (nullable = true)
 |    |-- batter: array (nullable = true)
 |    |    |-- element: struct (containsNull = true)
 |    |    |    |-- id: string (nullable = true)
 |    |    |    |-- type: string (nullable = true)
 |-- id: string (nullable = true)
 |-- name: string (nullable = true)
 |-- ppu: double (nullable = true)
 |-- topping: array (nullable = true)
 |    |-- element: struct (containsNull = true)
 |    |    |-- id: string (nullable = true)
 |    |    |-- type: string (nullable = true)
 |-- type: string (nullable = true)

я хочу получить таблицу в ячейках которой будут нормальные значения, то есть не составные

Вообщем мне просто нужно распарсить очень вложенный json любым способом чтобы получить нормальную таблицу

Вопрос задан более трёх лет назад
225 просмотров

3 комментария

Подписаться 2 Средний 3 комментария

mletov @mletov

А за счет чего вложенность?
Судя по структуре, вложенность вполне конечная

Написано более трёх лет назад
Denis @denislysenko Автор вопроса

mletov, Добрый день. Можем созвониться в скайпе буквально на 3 минуты? вот мой скайп: live:.cid.f650152fd70693da

Очень нужен хоть какой-то совет чтобы хотя бы понимать в каком направлении думать
Схема которая прикреплена в вопросе это просто пример, это не мой Json

Написано более трёх лет назад
mletov @mletov

denislysenko, вы лучше для начала в теги добавьте что за база?
MsSql?

Первые 2 варианта, которые приходят на ум:
Создать таблицы с нужными полями вручную, а дальше
1) Распарсить JSON при на том языке, который знаете, C#, к примеру, пройтись рекурсивно и поставлять данные
2) Воспользоваться конструкциями SQL по работе с JSON
https://docs.microsoft.com/en-us/sql/relational-da...
https://stackoverflow.com/questions/53529183/how-t...
https://medium.com/microsoftazure/get-correctly-fo...

Тут уже надо реальный файл видеть и решать, что эффективнее.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

5 недель

Далее
Яндекс Практикум

SQL для разработки

4 месяца

Далее
Академия Eduson

SQL-разработчик: тариф Базовый

3 месяца

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

Простой
Как получить последнюю запись для определённого поля?
- 1 подписчик
- 03 дек.
- 233 просмотра
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 232 просмотра
1

ответ
SQL

Простой
Почему INSERT присваивает только один символ вместо полного значения?
- 2 подписчика
- 29 окт.
- 198 просмотров
2

ответа
SQL

Простой
Правильно ли написан SQL-запрос для вывода клиентов с действующими (непогашенными) кредитами?
- 1 подписчик
- 19 окт.
- 240 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 256 просмотров
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 330 просмотров
1

ответ
SQL

+3 ещё

Средний
IIS/Lansweeper сильно тормозит из-за аномального числа логонов, внутренний DDoS?
- 1 подписчик
- 15 сент.
- 107 просмотров
0

ответов
SQL

+1 ещё

Простой
Как объединить 2 таблицы обращаясь к одному и тому же полю 2 раза?
- 1 подписчик
- 08 сент.
- 214 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 223 просмотра
1

ответ
SQL

+1 ещё

Средний
Как правильно написать запрос в SQL с NOT IN, NOT EXISTS или как-то иначе?
- 1 подписчик
- 28 авг.
- 196 просмотров
1

ответ
Показать ещё Загружается…

Database Administrator / DBA

Playerok

от 300 000 ₽

Разработчик баз данных

Greenway Global • Новосибирск

До 250 000 ₽

DWH Analyst

Анвио Парк

от 200 000 до 300 000 ₽

А за счет чего вложенность?
Судя по структуре, вложенность вполне конечная
mletov, Добрый день. Можем созвониться в скайпе буквально на 3 минуты? вот мой скайп: live:.cid.f650152fd70693da

Очень нужен хоть какой-то совет чтобы хотя бы понимать в каком направлении думать
Схема которая прикреплена в вопросе это просто пример, это не мой Json
denislysenko, вы лучше для начала в теги добавьте что за база?
MsSql?

Первые 2 варианта, которые приходят на ум:
Создать таблицы с нужными полями вручную, а дальше
1) Распарсить JSON при на том языке, который знаете, C#, к примеру, пройтись рекурсивно и поставлять данные
2) Воспользоваться конструкциями SQL по работе с JSON
https://docs.microsoft.com/en-us/sql/relational-da...
https://stackoverflow.com/questions/53529183/how-t...
https://medium.com/microsoftazure/get-correctly-fo...

Тут уже надо реальный файл видеть и решать, что эффективнее.

Как распарсить вложенный JSON с помощью Spark.sql, Spark.Dataframe или azure data factory так, чтобы у меня была таблица в реляционном виде?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт