Комментарии пользователя Timon — Хабр Q&A

Задать вопрос

Комментарии

Habr.com где посмотреть авторов?

Timon @Geronom Автор вопроса

Про Гугл спасибо, но там совсем не то, увы. Аналогично в других ПС. Про api также не то и потому, что неизвестно имя и т.д. То есть делать брутфорс по символам это вечность, а там иначе никак. Нет списка кого найти и ники чтобы были хоть примерные.

Написано более года назад
Habr.com где посмотреть авторов?

Timon @Geronom Автор вопроса

Василий Банников, Даже проще, а где есть список пользователей? Дальше всегда можно выбрать

Написано более года назад
Habr.com где посмотреть авторов?

Timon @Geronom Автор вопроса

Василий Банников, Тут не скажу точно, но там есть список авторов только топ на немного страниц. Но вот чтобы всех глянуть тут никак

Написано более года назад
Ozon.ru sitemap - может кто видел где или как?

Timon @Geronom Автор вопроса

Вот и стало не совсем понятно, где же хранят сие дело

Написано более трёх лет назад
Есть ли хороший прокси для парсинга Яндекс?

Timon @Geronom Автор вопроса

И там и там

Написано более трёх лет назад
Есть ли хороший прокси для парсинга Яндекс?

Timon @Geronom Автор вопроса

Кирилл, а были тесты с ними или это просто как вариант, но реальных тестов не было?

Написано более трёх лет назад
Есть ли хороший прокси для парсинга Яндекс?

Timon @Geronom Автор вопроса

Интересное предложение, но разгадывание капчи в автоматическом режиме без сервисов и чтобы все были корректно - есть.

Проблемы разгадать капчу никакой нет, поэтому просто купить разгадывание, которое и без того реализовано, увы, не решение проблемы с частым появлением капчи как таковой.

И да, проблема именно в самих прокси, пока свежие все хорошо, но быстро становятся "не вариант", отсюда и вопрос о том, какие взять хорошие прокси или как еще можно решить данный вопрос.

Написано более трёх лет назад
Есть ли хороший прокси для парсинга Яндекс?

Timon @Geronom Автор вопроса

bqio, пробовал, толку не было, там прокси просто жуткие по данной части, увы

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

#, актуально. Ответ любой удобный, мне главное что-то от чего отталкиваться.

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

test1 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 4",
"текст 5"
};

test2 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 3",
"текст 4",
"текст 5"
};

test3 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 49870",
"текст 687"
};

test4 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 411",
"текст 611"
};

Если обходить с начала в конец, то берется test1 и считается что он маркерный и все остальное сравнить с ним и будет в результате набор объединений, внутри которых не обязательно все элементы содержат одинаковые наборы данных, т.е. минимум 3 совпадения по значениям.

Если так делать, то на первой итерации будет группа

test1 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 4",
"текст 5"
};

test2 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 3",
"текст 4",
"текст 5"
};

test3 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 49870",
"текст 687"
};

Так как test2 и test3 имеют что-то общее с test1.
Теперь сравнение внутри группы и получается, что тут может быть 2 вариант

Лишний

test3 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 49870",
"текст 687"
};

Или лишний

test3 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 49870",
"текст 687"
};

Какой именно убрать помогает понять (тут не знаю точно как это сделать) последующие подобные рассуждения, когда становится видно, что удастся сформировать еще пару только в случае, когда лишний в первой группе будет

test2 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 3",
"текст 4",
"текст 5"
};

Так как его можно совместить с

test4 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 411",
"текст 611"
};

И не потерять объединение.

Итого получится

1 пара

test1 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 4",
"текст 5"
};

test3 = new List()
{
"текст 1",
"текст 2",
"текст 3",
"текст 49870",
"текст 687"
};

И вторая пара

test2 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 3",
"текст 4",
"текст 5"
};

test4 = new List()
{
"текст 01",
"текст 02",
"текст 03",
"текст 411",
"текст 611"
};

И вводных таких наборов данных в плане test может быть любое количество, четное или нечетное как угодно, но на выходе никаких дублей и прочего быть не должно, а что не удается объединить, то будет само по себе по типу объединение содержит 1 элемент ну и пусть.

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

Извиняюсь если не так пояснил, но вот такая идея

Результат

Название объединения – номер
Ключи в группе

То есть в данном случае это словарь, в котором ключ это порядковый номер объединения, а значение это лист входящих в него названий test.

То есть

1
test1
test3

2
test2
test4

и т.д.

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

как угодно, конечный вариант довести до ума не проблема. мне главное саму идею понять и все

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

Может не так поясняю, но сама суть вот такая:

Для того, чтобы ключи попали в одну группу, требуется наличие у всех них единого набора тех же самых общих данных.

Вариант, когда будут объединения и внутри могут быть элементы, которые не обязательно между собой имеют что-то общее из данных я сделал, там проблем не возникло, а вот с учетом что данные общие обязаны быть вот тут возникла проблема.

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

результат просто список
ключ 2 - объединение
ключ 4
ключ 1 - объединение
ключ 3

объединение указывает на старт нового объединения, а далее все что в нем пишется

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

#, test1 содержит
"текст 1",
"текст 2",
"текст 3",

test3 содержит
"текст 1",
"текст 2",
"текст 3",

Они объединяются, так как в этой группе у каждого из элементов будет некий набор общих value и число таких value не меньше 3.

test2 содержит
"текст 01",
"текст 02",
"текст 03",

И

test4 содержит

"текст 01",
"текст 02",
"текст 03",

Но если смотреть на сравнение по первому элементу, то можно собрать группу
test1
test2
test3

так как test2 и test3 имеют не менее 3-х общих элементов с test1, только в этой группе все test не будут между собой иметь одинаковый набор элементов, а потому такая группа не будет верной.

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

#, не получается сделать группировку так, чтобы в одной группе были только те данные, которые между собой имеют одинаковые минимум 3 элемента

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

Когда я редактирую вопрос у меня все данные показываются четко. Издеваться мне неинтересно и лучше умет общаться, а не такое писать, когда в редакторе одно, а тут почему-то другое, я не знаю как это править иначе.

Написано более трёх лет назад
Поиск и объединение данных по условию в ConcurrentQueue / Dictionary – как?

Timon @Geronom Автор вопроса

Да, поправил, редактор сбил код.

Написано более трёх лет назад
Как получить GOOGLE_ABUSE_EXEMPTION?

Timon @Geronom Автор вопроса

profesor08, спасибо за совет, но тут речь исключительно и только про парсинг выдачи Гугл т.е. делает запрос по типу https://www.google.com/search?q=вопрос и в какой-то момент Гугл отдает рекапчу v2. Ее решает сервис и возвращает токен, я его отправляю по адресу вида https://www.google.com/sorry/index?q=специальный параметр как получить известно&continue=урл куда перенаправить когда все ок&g-recaptcha-response=токен. И в ответ на данный post запрос должен быть редирект и далее получение куки, но этого нет и идет неприятное сообщение, которое говорит о не прохождении капчи но ТОЛЬКО на поиске, никаких других сайтов тут нет.

Ставить вручную, получать и после ставить и другие варианты тут не срабатывают.

Написано более трёх лет назад

Самые активные сегодня

Пума Тайланд
- 3 ответа
- 0 вопросов
Илья лук
- 1 ответ
- 1 вопрос
Drno
- 1 ответ
- 0 вопросов
Андрей Вшивков
- 0 ответов
- 1 вопрос
Ямзду Нибиру
- 1 ответ
- 0 вопросов
Кот Абсолютный
- 1 ответ
- 0 вопросов