@Pytniza

Как парсинг html страницы на js?

Я получаю НТМL страницу в которой есть несколько таблиц. Мне нужно получить JSON файл вида:
{
sheets:
[
{
name: "table1",
data: [
{
row: 0,
raw: [
{ col: 0,
text: "текст"
class: "s28"
},
{ col: 1,
text: "текст"
class: "s28"
},
{ col: 2,
text: "текст"
class: "s28"
},
....
]
},
{
row: 1,
raw: [
{ col: 0,
text: "текст"
class: "s28"
},
{ col: 1,
text: "текст"
class: "s28"
},
{ col: 2,
text: "текст"
class: "s28"
},
....
]
},
...
]
}
]
]
}

Я разбил код на массив состоящий из таблиц при помощи ругулярки. Может кто направит в нужном направлении?
  • Вопрос задан
  • 222 просмотра
Решения вопроса 1
@Aricus
Для работы с DOM в js лучше использовать jquery и не мучиться. Дальше выбираешь, например, все таблицы и перебираешь их, формируя массив. Ну а дальше делаешь из массива JSON. Примерно так:
$('table').each(function(iTable, thisTable) {
	...
	$(this).find('tr').each(function(iRow, thisRow) {
		...
	});
});
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
mosesfender
@mosesfender
Меланхолик, параноик, падал с коек
Какая к чёрту "регулярка"? В браузере уже всё разобрано, document со всем содержимым - уже распарсеная страница, бери с него всё что нужно.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы