spooky_2020
@spooky_2020
А меня Сережа зовут.

Что почитать по теории парсинга и обработке информации?

Порекомендуйте литературу, по общим принципам и теории парсинга.
Интересует именно теория, а не руководства по готовым библиотекам.
  • Вопрос задан
  • 451 просмотр
Решения вопроса 1
@AlexSku
не буду отвечать из-за модератора
1) Обычно сначала применяют лексер, затем парсер.
2) Вы должны создать грамматику в виде дерева.
3) Есть хорошие примеры в функциональном программировании (Haskell, F#).
Книги надо, скорее всего, гуглить, я видел такие:
а) 1972-73. The theory of parsing, translation, and compiling (2 тома), Aho, Ullman.
б) 1988. Parsing theory. Sippu, Soisalon-Soininen
в) 2008. Parsing techniques. Grune, Jacobs.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@mtNATS
книги по парсингу?) ну хз, если мы говорим про веб, то в
  • первую очередь это понимание того, что такое dom и как с ним работать,
  • конечно же css,
  • регулярные выражения,
  • циклы,
  • функции,
  • не лишним будет js и nodejs
  • там же готовые библиотеки
  • работа с api
  • базы данных
  • меня выручало знание php
  • там же ООП
  • работа с командной строкой
  • canvas, fingerprint, useragent, vpn, proxy, туннелирование и тд
  • и многое другое


короче я о том, что парсинг - это по сути как воровство контента, а отдавать свое никто не хочет и чем более ценная информация, тем сложнее ее получить, тут и появляется необходимость знать и понимать как что работает и уметь этим пользоваться, но на том история не заканчивается, т.к. информацию нужно не только получить, она должна быть типизирована и структурирована и работать это должно стабильно, зачастую быстро, не потребляя при этом лишних ресурсов т.к. многопоток вещь востребованная

я о том, что хрен такую книгу найдешь, начиная с малого, освой базу, бери на выполнение разные задачи и по мере того, как будут возникать трудности изучай вопрос и ищи решение
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы