Как получить превью статьи по ссылке с помощью js?

Что я хочу получить:
1. копирую ссылку на статью (например: habrahabr.ru/company/softline/blog/261053/)
2. получаю json array, содержащий название статьи, фото из этой статьи, начальный текст.

Мне нравится, как работает эта функция в Pocket - он добывает фото, название и начальный текст независимо от того, предусмотрено ли это самой страницей, с которой это все берется.
1. Как эту функцию правильно назвать?
2. Как ее реализовать, желательно на js, на клиентской стороне.
  • Вопрос задан
  • 574 просмотра
Пригласить эксперта
Ответы на вопрос 1
art1z
@art1z
Программист-многостаночник в EffectiveSoft
Задача, на самом деле, очень не тривиальная. Когда-то пришлось писать краулер HTML контента. По пунктам:
  1. Из JS получить контент произвольной страницы в общем случае не получится - CORS, самый рабочий вариант - делать серверный прокси и в нем же парсить HTML контент
  2. Скриншот страницы легко делается с помощью phantomjs (https://github.com/brenden/node-webshot)
  3. И готовьтесб сразу к тому, что парсинг HTML (очистка от навигации, рекламы и прочего мусора) здесь будет самой сложной задачей
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
10 мая 2024, в 03:40
1500 руб./за проект
10 мая 2024, в 03:02
5000 руб./за проект
10 мая 2024, в 02:29
300 руб./за проект