Всем привет. У меня проблема и ни знаю в чем проблема. Есть страница такая:
Это spotify плеер. В любом браузере отлично грузится, страница качается curl без проблем, обычный get запрос. Но в rails когда я ее пытаюсь отпарсить nokogiri то загружается только одна строка:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
Если же nokogiri парсить скачанный файл curl'ом с этого адреса то все отлично. В чем может быть дело?
UPD.
Проблема была в user-agent. Вот решение:
source = 'https://embed.spotify.com/?uri=spotify:user:128386105:playlist:39BkANk6cQDivVkymDRQTL'
user_agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.2 (KHTML, like Gecko) Chrome/15.0.854.0 Safari/535.2"
page = Nokogiri::HTML(open(source, 'User-Agent' => user_agent), nil, "UTF-8")