Уважаемые специалисты.
В логах часто вижу, что на статьи сайта пытаются зайти по "кривым" ссылкам, с различными довесками, хочу это исправить.
Есть вот такая строчка
RewriteRule ^(.+?)\.html(?!/amp/).+$ https://%{HTTP_HOST}/$1.html [L,R=301]
Она отсекает дополнительные символы после .html (исключая .html/amp/). Но не отсекает GET запросы, т.е. запросы такого вида
.html?<тут может быть что угодно>.
Как доработать команду, дабы отсекались ещё и все GET запросы, за исключением вот этой
...html?srp=xxxxx&srk=yyyyy
xxxxx и
yyyyy, естественно, могут принимать любые значения.
P.S.
Думаю, что стоит написать о структуре ссылок на сайте, она следующая:
https://site.ru/material.html - ссылки на материалы такие
https://site.ru/material.html/amp/ - ссылки на AMP (используются для мобильной выдачи Google) материалы такие
https://site.ru/kategoriya/ - ссылки на категории (разделы) такие
https://site.ru/tag/imya_tega/ - ссылки на теги, выводятся статьи с указанными в них тегами
https://site.ru/manage-subs-comments.html?srp=xxxxx&srk=yyyyy - ссылки на управление подпиской для посетителей, оставивших комментарии