Anton Kuzmichev, проверил сразу, как вы ответили. если "title = image", то с вашим решением получаю "imagejpg"
Предполагаю, что это какое то специфическое поведение django новых версий. Не получается придумать, как его обойти
С чем именно бороться в scrapy? Ничего сложного, структурирование проекта организованно как в Django. Для Парсинга одной странички, смысла тспользовать scrapy и создавать целый проект действительно нет. А вот если нужно что-то посерьезнее, например каталог какой-то из десятка тысяч страниц, организовать его в бд.. Тут уже без фреймворка руками будет тяжелее и дольше. Дольше в плане времени работы программы. Scrapy основана на twisted, если я не ошибаюсь, а это дает ощутимый дуст к скорости при большом количестве страниц.
tree.xpath('//div') и tree.xpath('//xhtml:div', namespaces={'xhtml': url}) все равноо возвращают пустой лист. А p.xpath('//title/text()')[0] к примеру работало и в моем варианте.
Спасибо большое. Это то что нужно. Начал копать, нашел на сайте книги официальный комментарий на эту тему и архив с примерами из книги, только с использованием API v2.
Ну импорты разумеется итак прописаны :) Сам сайт то работает, вполне корректно. Только в pycharm не работает нормлаьное автодополнение. В вопросе я написал просто абстрактное название 'app'. А так "from rango.models import Page, Category ".
При сохранении изображения неправильно указал путь сохранения, а именно пропустил точку перед "jpg"