Задать вопрос

Как на Хабре искать тест в своих комментариях?

У меня 1200 комментариев. Я хочу найти среди них те, в которых есть слово «напишите». Как это сделать?
-Поиск по сайту по этому слову выдает кучу ссылок и на всех пользователей, а не только на меня
-Поиск в гугле\яндексе на сайте Хабра по моему нику и этому слову выдает кучу страниц с чужими комментариями с этим словом и моими без него
-Поиск в гугле\яндексе этого слова на сайте tangro.habrahabr.ru/comments/ не выдает ничего
-Листать комментарии по страницам и искать на каждой поиском браузера немного скучновато (много страниц). Открыть все комментарии на одной нельзя (ну, или я не умею).

Есть какие-то адекватные способы (окромя «написать паука, чтобы собрал все страницы с комментами и поискал в них»)?
  • Вопрос задан
  • 2580 просмотров
Подписаться 3 Оценить Комментировать
Решения вопроса 1
webscout
@webscout
tangro &&/+3 «напишите» site:habrahabr.ru — для яндекса.
+3 — значит расстояние не более трех предложений в прямом направлении. Выдает, по-моему, по большей части ваши комментарии.
Ответ написан
Пригласить эксперта
Ответы на вопрос 5
@Rulin
в robots.txt (http://%username%.habrahabr.ru/robots.txt) запрещена индексация всего что находиться на поддомене пользователя, поэтому поисковые системы не могут ничего найти

User-agent: *
Disallow: /
Host: %username%.habrahabr.ru
Ответ написан
Комментировать
Ramzeska
@Ramzeska
Вы сами описали все возможные способы. Остается лишь модный вариант для гиков — найти SQL-Injection баг и выполнить поиск по базе :)
Ответ написан
ntkt
@ntkt
Потомственный рыцарь клавиатуры и паяльника
Комментарии лежат на странице вида %USERNAME%.habrahabr.ru/comments/page%NUMBER%/
Номер последней страницы находим руками — наводим мышку на стрелку.

Далее варианты:

( 0) YQL, к сожалению, отпадает из-за запрета на индексацию в robots.txt )
1) шелл-скрипт, который вызовет wget с задержкой. Получим N хтмл-ников, найти можно.
Для винды, если нет wget или неохота писать батник, можно на VBScript/JScript — это тоже недолго.
2) жаваскрипт-one-liner в адресную строку браузера, который с задержкой добавит в страницу N ифреймов.
В браузере отключаем картинки и флэш, получим голую текстовую страницу, Ctrl + F рулит.

Если это не подпадает под определение «написать паука», по-моему — вполне себе выход.
Ответ написан
Комментировать
ntkt
@ntkt
Потомственный рыцарь клавиатуры и паяльника
А вот и ответы:

1) венда/wget — в одну строку не влезает, плюс c задержкой в CMD туго:

set MAXPSTO=30
set HABRUSER=tangro
for /L %i in (1,1,%MAXPSTO%) DO @echo http://%HABRUSER%.habrahabr.ru/comments/page%i/ >> tmp.url
wget -w 5 tmp.url


2) никсы/wget — без комментариев:

$ for i in {1..30} ; do wget http://tangro.habrahabr.ru/comments/page$i/ && sleep 5 ; done


3) Кроссплатформенно — жаваскрипт в адресную строку браузера, в опере и хроме вроде, работает, главное — заранее отрубить картинки и плагины. По ходу нашел странное поведение setInterval, и вообще, некоторый код в формате «javascript: код», похоже, работает только из ссылки, а не из адресной строки, поэтому скрипт резко вырос.

pastebin.com/EXc7DFQC

Ногами пинать бессмысленно, на-коленочное решение же :)
Ответ написан
Комментировать
@Denter
Извращенный вариант:
1) ставим расширение AutoPager для хрома или лисы.
2) Идем на страницу с комментами и жмем «End». Браузер автоматом подтягивает следующую страницу и выводит её ниже.
3) Повторям п2. пока не получим «простыню» со всем своим креативом
4) Ищем нужное средствами браузера
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 дек. 2024, в 13:01
50000 руб./за проект
22 дек. 2024, в 10:44
15000 руб./за проект
22 дек. 2024, в 10:12
10000 руб./за проект