Есть ли возможность при которой программа может видеть сайт так же как и Я?
Привет.
Я тут задумался на одним своим хобби проектом и прямо скажем не знаю от куда начать.
Задумка следующая: Я хочу что бы моя программа/компьютер смотрела на веб-страницу и видела её так же как и я.
Я не хочу что бы видела её как набор тэгов, а именно как виже её я, как страницу.
Я попробую описать что я хочу сделать, может это натолкнёт Вас на более походящий ответ.
В идеалле программа смотрит страницу как это делает человек и выделяет контент с помощью техник AI/машинного обучения и парсит контент использую OCR (optical character recognition).
Что я буду делать с этим далее не скажу, а то сочтёте безумцем.
Вообщем вот. Ну как, такое возможно? Любая ссылка или инфа будет полезна :)
Я хочу попробовать сделать следующее. Взять некую страницу. Представить её в некором виде готовом для того что алгоритмы компьютерного зрения выдели информативные блоки и затем пройти по этому тексту OCR алгоритмам и получить в итоге текст. Тоесть, по-сути это то же парсинг, только через компьтерное зрение, а не обход DOM`a
Случайно не вы писали сценарий для 19 серии нынешнего сезона сериала "Кости"? Там получили трёхмерную модель костей, распечатали их на 3D принтере, а затем сканировали 3D сканером, чтобы получить в компьютере трёхмерную модель... У вас задумка такого же плана. Зачем растеризовать бинарный текст, чтобы затем распознавать его? Я люблю делать ненужные вещи, но не настолько же!