интересно может ли робот проиндексировать html, ведь по ссылкам попасть туда он не может
Если Вы где-то не прописывали ссылку на этот файл, например, в
sitemap.xml, вряд ли какой-то поисковик будет тратить свои ресурсы, в поисках файлов, которых теоретически на сервере нет. По этому, с вероятностью 99% можно сказать, что проиндексирован он не будет (даже если поисковик, каким-то чудесным образом узнал бы о том, что есть такой файл как "index.html", вряд ли бы он стал его индексировать исходя из тех соображений, что пользователь по ссылкам всё равно не сможет туда попасть).
Соотв., если Вы хотите, что бы он проиндексировался - нужно добавить на него ссылку (где-нибудь), а если хотите максимально быть уверенным в том, что файл не попадёт в индекс - можете заблокировать доступ к нему в файле
robots.txt