Хотел бы сразу уточнить, чтобы не было лишних вопросов. Я в вебе новичок, очень мало умею что на практике. Поэтому прошу сразу не бросаться словами и писать мне, что я эникейщик (я и так это знаю).
Начнём с самого начала - с теории. Правильно ли я понимаю, что парсинг осуществляется по DOM-элементам. Т.е мы итерируем эти самые DOM-объекты и добавляем извлечённые данные (в нужном формате) непосредственно в объект?
Если это так, то вопрос в следующем. Как мне нужно итерировать эти самые DOM-элементы?
Парсить можно разными способами, в том числе поиском подстроки или регулярками, например. На больших масштабах их сложно поддерживать, поэтому в общем случае да, предпочитают разбирать по DOM-элементам.
В какой среде это все происходит? Чем вам обычный querySelector или xpath не угодили?