Исходя из тех данных, что я вижу, напрашивается вариант просто сделать лису и подпись одной картинкой.
Ну серьезно, зачем их разделять? Вы потом захотите рядом с лисой написать elephant? Двигать лису относительно текста тоже вроде бессмысленно при такой графике.
В теории, конечно, можно придумать какую-то хитрую адаптивность, но тогда сначала нужно четко сформулировать что нужно получить, а уж потом думать как.