сергей кузьмин, в списке я сохраняю спарсенные веб-элементы (допустим сохраняю все спарсенные элементы span.active), все тэги span с классом active. У этих тегов есть атрибуты, у которых есть значения, их нужно достать. Так же у этих span.active есть значение тега ( 2.1 ) его тоже нужно достать и эти значения разнести по полям массива объектов класса. Начинаю я перебирать лист и доставать оттуда значения как выбрасывается исключение. То есть я не успеваю полностью обработать лист.
сергей кузьмин, так к сожалению не выйдет. Одни из значений которые я достаю с листа это десятичные числа и они могут изменяться. Пример: спарсил и положил в лист, начинаю доставать десятичные числа и выбрасило исключение, формирую новый лист, а там уже другие значения, надо начинать заново.
сергей кузьмин, как я сказал что все веб элементы в я сохранил в List. Начинаю например получать значения аттрибута для каждого элемента списка, не успеваю дойти до конца списка как выбрасывается исключение. Когда половину успеваю, когда чуть больше.
CellycoMobiles, большое спасибо за развернутый ответ. Буду вникать в этот вариант. Как вы решили проблему парсинга JS сайтов? Где html код генерируется скриптами. Я столкнулся с этой проблемой, jsoup бесполезен в этом случае.
CellycoMobiles, поясните по пункту 1. Пункт 2 - загрузку осуществляю методом connect.get(), а дальше разбираю страницу через select. Сегодня тестировал, медленно. Я понимаю, что без параллелизма не обойтись.
hzzzzl, около тысячи чисел и они на разных страницах. То есть надо сначало получить ссылки на эти страницы, потом каждую скачать и обработать. Я тестировал это через jsoup. Слышал, что можно это все реализовать просто перехватив запрос, но не до конца понимаю как это должно работать.