Здравствуйте.
Пробую парсить сайты с помощью HtmlAgilityPack.
Для этого написал следующий программный код:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Xml;
using System.IO;
using HtmlAgilityPack;
namespace ConsoleParsingHTMLwithHtmlAgilityPack_CSarp
{
class Program
{
static void Main(string[] args)
{
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(@"<html><body><div><table id=""foo""><tr><th>hello</th></tr><tr><td>world</td></tr></table></div><div><table class='mfd-table'><tr><th>hello222</th></tr><tr><td>world222</td></tr></table></div></body></html>");
//doc.LoadHtml("mfd.ru/centrobank/correspondentaccountbalances/");
var docNode = doc.DocumentNode;
var x = docNode.SelectNodes("//table[@class='mfd-table']");
Console.WriteLine(x);
Console.ReadLine();
}
}
}
Если я запускаю программу на выполнение, при использовании строки кода:
doc.LoadHtml(@"<html><body><div><table id=""foo""><tr><th>hello</th></tr><tr><td>world</td></tr></table></div><div><table class='mfd-table'><tr><th>hello222</th></tr><tr><td>world222</td></tr></table></div></body></html>");
то в консоли выводиться: "HtmlAgilityPack.HtmlNodeCollection" - для меня это является признаком, что все нормально работает.
Но если я заменю предыдущую строку в программе на строку:
doc.LoadHtml("mfd.ru/centrobank/correspondentaccountbalances/");
то при выполнении программы в консоли ничего не выводиться - для меня это признак некорректной работы данной программы.
Что необходимо сделать для того, чтобы программа корректно работала с "ссылочным" указанием пути к Html-коду?