Всем привет!
Может кто-нибудь посоветовать библиотеки (желательно написанные на java) для выделения из html страницы основного текста и связанных с ним картинок?
Пример: передав на вход ссылку на страницу
habrahabr.ru/post/193226/ на выходе получить:
этоВсего час назад случайно попалась на глаза новость о том, что Яндекс ввел возможность оплаты своего мобильного счета прямо через страничку поисковой системы. При этом в поисковой строке нужно набрать примерно то, что видно на анонсном скрине. Помимо всего прочего, можно вводить поисковые запросы типа «Пополнить счет МТС», или аналогичные запросы на украинском языке (да, работает и в/на Украине).
Оплату при этом можно провести как со своего счета в «Яндекс. Деньги», при условии наличия такового, либо с кредитной карты (тут уж каждый решает сам, насколько это безопасно).
<картинка>
По словам разработчиков, такая тразакция полностью безопасна, поскольку оплата происходит «на странице, защищенной по международному стандарту PCI DSS». Если оплата проводится ЯД-ом, тогда нужно вводить либо платежный пароль, либо пароль из СМС. Если же оплата счета проводится кредиткой, само собой, нужно вводить и номер кредитки, и CVV, и код, присылаемый на телефон пользователю его банком.