Scrapy и прочие варианты - здорово, но для самообразования и прокачки логики не годится.
К примеру, нужно распарсить строку и построить дерево категорий товаров и услуг (из прошедшего конкурса яндекса по android-разработке):
https://money.yandex.ru/api/categories-list
кусок: [{"title":"Телефон","subs":[{"id":157291,"title":"Мобильная связь"},
Тут информация структурирована, а не просто массив. И так же в условии сказано про дерево. Значит,
1. сначала нужно выбрать тип данных, подходящий для хранения информации в такой структуре? Для такой структуры как в условии, лучше взять dict, или писать свой?
2. В общем виде, алгоритм выглядит как циклы прохождения по строке и проверки каждого символа на все эти скобки, двоеточия, запятые, кавычки и остальное?
3. В питоне для таких проходов и сравнений используются регулярные выражения? Только начал языком интересоваться - успел узнать только про split у строкового типа.