Для общего случая решение - парсить meta property="og:image". Здесь сайты содержат ссылку на изображение, которое должно представлять этот сайт.
Для частных случаев, когда этого тега нет, как у YouTube, надо искать отдельные решения, одно из них уже написал
Zettabyte.