Ответы пользователя по тегу Python
  • Какие есть API для поиска файлов в свободном доступе?

    @nebo_oben Автор вопроса
    Еще нашел сервис Scribd, там есть API для поиска по загруженным документам https://ru.scribd.com/developers/platform/api/docs...
    Ответ написан
    Комментировать
  • Как начать тащить данные из API Instagram с помощью Python?

    Немножко примеров с разбором тут, а сам код целиком здесь, как пример для быстрого старта сойдет
    Ответ написан
    Комментировать
  • Как правильно собрать данные из Instagram API и Foursquare API?

    1. Обходить ограничения на один токен => нужно больше токенов, либо морочишься и регаешь кучу аккаунтов в данных соцсетях, либо вооружаешься поисковиками и ищешь на сайтах аля pastebin, ссылка на поисковик по 100+ таких ресурсов тык тык, там идешь в раздел Documents -> Custom Pastebins (Meta search). Цель - найти исходники чьи то, из которых забыли убрать токены, я однажды около 10 так насобирал, но заранее напиши себе небольшой скрипт чекер токенов, например такой:
    from requests import get
    ig_api_key = 'YOUR INSTAGRAM API KEY'
    answer = get('https://api.instagram.com/v1/users/search?q=facebook' + '&access_token=' + ig_api_key, verify=True).json()
    print answer

    Там соответственно подставляешь токен найденный и смотришь ответ, если все нормально, значит токен рабочий.
    НО: уверен, что в ToS Instagram API такое делать запрещено, поэтому на свой страх и риск.

    2. Как и сказано выше, кури доки и читай про Pagination, вот для примера два метода, которые вытаскивают данные о фотках пользователя (осторожно быдлокод, но для примера хватит).
    def get_data_from_json(json_text):
        answer = list()
        for element in json_text['data']:
            answer.append(element)
        return answer
    
    
    def get_media(username):
        answer = list()
        user_id = get_user_id(username)
        data = get('https://api.instagram.com/v1/users/' + user_id + '/media/recent/?access_token=' +\
                   ig_api_key, verify=True).json()
        try:
            if data[u'meta'][u'code'] == 200:
                if data[u'pagination'] == {}:
                    answer += get_data_from_json(data)
                else:
                    answer += get_data_from_json(data)
                    while True:
                        if data[u'pagination'] != {}:
                            data = get(data[u'pagination'][u'next_url'], verify=True).json()
                            answer += get_data_from_json(data)
                        else:
                            break
            else:
                answer = list()
        except:
            answer = list()
        return answer

    3. Теперь про город, для этого тебе нужно знать его координаты (либо можешь сам это автоматизировать через Google Maps API, там будет адрес -> координаты), далее придумываешь алгоритм по которому из двух координат lat\long будет генериться множество точек для последующего запроса к Instagram API, конкретнее, обратись к вот этому методу, он дает возможность получить данные по координатом на дистанции от 1 до 5 км, значит просто нужно покрыть город кругами с радиусом в 5 км, статья с хабра с похожей тематикой и кодом на питоне вот здесь. Дерзай и удачи!
    Ответ написан
    4 комментария
  • Как определить вхождение слова в текст, допуская незначительные грам. ошибки в нем?

    Самый простой путь - расстояние Хэмминга вот здесь, можно, например, рассмотреть типовые ошибки + опечатки, на основе длины слова делать вывод о возможном количестве ошибок, а затем уже считать расстояние Хэмминга и на этом основании принимать решение. Еще можно посмотреть на алгоритмы перцептивного хэширования для строк (похожие аргументы дадут похожий хэш) с последующим применением того же расстояния Хэмминга.
    Ответ написан
    Комментировать