Какой язык наиболее подходящий для парсинга страниц vk.com?
Появилась острая необходимость поработать со страничкой vk.com. В частности пробежаться по всем подписчикам сообщества, узнать кто он-лайн кто нет. Вывести всю информацию в файл.
Какой язык программирования больше подходит для данной задачи? Или же есть библиотеки подскажите пожалуйста.
Тогда уж Python + lxlm или Grab (grablib.org). Тут уже было обсуждение, где все более-менее сошлись на том, что lxml > Beautiful Soup, по крайней мере в скорости.
@Jarens
Это компенсируется всеядностью супа. Он потому так и назван, что способен принять любой суп из тегов на входе. А как мы знаем, верстка некоторой части веб сайтов не то что вызывает оторопь - от нее глаза кровоточат, а про соответствие стандартам там вообще не слышали.
Это дело каждого какой парсер использовать (я же написал про любой иной). Кому-то критична скорость. Кому-то гибкость и простота, а кто-то парсит кашу.
Мне lxml тоже по вкусу. BS чисто исторически, но он меня не подводил.