От себя добавлю, когда уже научитесь всему, что написали выше, начнется самое интересное, для парсинга больших сайтов(вроде гугла) придется использовать прокси для обхода бана, подделывать user-agent, эмулировать человекоподобные запросы, проходить капчу... и даже тогда, какие-то запросы будут блокироваться. Все это по отдельности есть в интернете