Ответы пользователя Astrohas по тегу «Python»

Как в python сделать случайный выбор, но с определенной вероятностью?

Astrohas @Astrohas

Python/Django Developer

random.choices(['q1', 'q2', 'q3'], weights=[0.2, 0.3, 0.5])

Для того чтобы убедиться что работает

collections.Counter( random.choices(['q1', 'q2', 'q3'], weights=[0.2, 0.3, 0.5]))[0]         for _ in range(100000))

результат

>>> collections.Counter( random.choices(['q1', 'q2', 'q3'], weights=[0.2, 0.3, 0.5]) [0]  for _ in range(100000))
Counter({'q3': 49981, 'q2': 30018, 'q1': 20001})

Ответ написан более трёх лет назад

Комментировать

Как scrapy заставить сканировать страницу каждый час?

Astrohas @Astrohas

Python/Django Developer

Cron

Ответ написан более трёх лет назад

1 комментарий

Как воспроизвести видео в PyGame?

Astrohas @Astrohas

Python/Django Developer

Есть еще pyglet

import pygame, pyglet, ctypes

#setup pyglet & the video
path = r"C:\SomeVideo.avi"

player = pyglet.media.Player()
source = pyglet.media.load(path)
player.queue(source)
player.play()

#setup pygame
pygame.init()
pygame.display.set_mode((800,800), 0)
pygame.display.set_caption("Video in Pygame!")
screen = pygame.display.get_surface()
pygame.display.flip()

#blit the video in a standard pygame event loop
while True:
    events = pygame.event.get()
    for event in events:
        if event.type == pygame.QUIT:
            sys.exit(0)
    screen.fill(0)
    
    player.dispatch_events()
    tex = player.get_texture()
    raw = tex.get_image_data().get_data('RGBA',tex.width*4)
    raw = ctypes.string_at(ctypes.addressof(raw), ctypes.sizeof(raw))
    img = pygame.image.frombuffer(raw, (tex.width, tex.height), 'RGBA')
    screen.blit(img, (0,0))
    
    pygame.display.flip()

Способ костыльный, но можно попробовать

Ответ написан более трёх лет назад

1 комментарий

Как подсчитать число уникальных строк больше 1 млн. при вводе?

Astrohas @Astrohas

Python/Django Developer

Множества использовать не пробовали? Есть пример входных данных?
Если принципиально использование памяти а время не важно, то можно хешировать строки и сохранять хеши в множестве. По памяти должно быть меньше 5 мб. По времени 2 - 3 секунды

Ответ написан более трёх лет назад

Комментировать

Python docx. Как изменить положение таблицы и её стиль?

Astrohas @Astrohas

Python/Django Developer

Сложновато все с подобными библиотеками. Лучше сделать html и конвертировать в docx

Ответ написан более трёх лет назад

Комментировать

С помощью каких приложений объяснить ребенку (9 лет) python?

Astrohas @Astrohas

Python/Django Developer

Лучше Scratch (https://scratch.mit.edu/ ) или CodeMonkey https://www.playcodemonkey.com/ , а еще лучше не заставлять бедняжку

Ответ написан более трёх лет назад

Комментировать

Парсить json файл и после инициализации чтоб был доступен?

Astrohas @Astrohas

Python/Django Developer

Паттерн называется синглтон.

class EnvironmentSetup(unittest.TestCase):
    base_config = None

    @classmethod
    def setUpClass(cls):
        cls.base_config = cls.setConfig()

    @classmethod
    def setConfig(cls):
        with open('../config.json') as file:
            config = json.load(file)
        return config

    def __new__(cls):
        # Перекрываем создание объекта класса
        if not hasattr(cls, 'instance'):
            cls.instance = super().__new__(cls)
        return cls.instance

ту и при init делать все вещи

Ответ написан более трёх лет назад

Комментировать

Как в несколько потоков проверять существование url?

Astrohas @Astrohas

Python/Django Developer

asyncio

Ответ написан более трёх лет назад

7 комментариев

Как сделать Android приложение на Python + HTML5?

Astrohas @Astrohas

Python/Django Developer

Мне вот https://beeware.org/ нравиться
На нем можно даже SPA нафигачить
https://beeware.org/project/using/single-page-web-app/

Ответ написан более трёх лет назад

1 комментарий

Как классифицировать большие данные с использованием Sklearn?

Astrohas @Astrohas Автор вопроса

Python/Django Developer

Ответ на мой вопрос из SO https://stackoverflow.com/a/56243314/11535126

You can utilize warm_start=True and call .partial_fit() (instead of .fit()).

See the documentation here for the model you are using where it describes that argument and function respectively.

Basically, you would load only a portion of the data at a time, run it through your pipeline and call partial_fit in a loop. This would keep the memory requirements down while also allowing you to train on all the data, regardless of the amount.

EDIT

As noted in the comments, the above mentioned loop will only work for the predictive model, so the data pre-processing will need to occur separately.

Here is a solution for training the CountVectorize...
This question contains a TFIDF implementation tha...

So the final solution would be to preprocess the data in two stages. The first for the CountVectorizer and the second for the TFIDF weighting.

Then to train the model you follow the same process as originally proposed, except without a Pipeline because that is no longer needed.

Перевод

Вы можете использовать warm_start=Trueи позвонить .partial_fit()(вместо .fit()).

См. Здесь документацию по используемой модели, где она описывает этот аргумент и функцию соответственно.

По сути, вы будете загружать только часть данных за раз, запускать их через конвейер и вызывать Partical_fit в цикле. Это снизит требования к памяти, а также позволит вам тренироваться на всех данных, независимо от их количества.

РЕДАКТИРОВАТЬ

Как отмечено в комментариях, вышеупомянутый цикл будет работать только для прогнозирующей модели, поэтому предварительная обработка данных должна будет выполняться отдельно.

Вот решение для многократного обучения CountVectorizer.

Этот вопрос содержит реализацию TFIDF, которая не требует загрузки всех данных в память.

Таким образом, окончательным решением будет предварительная обработка данных в два этапа. Первый для CountVectorizer и второй для взвешивания TFIDF.

Затем, чтобы обучить модель, вы следуете той же процедуре, что и первоначально предложенная, за исключением того, что без конвейера, потому что это больше не нужно.

Ответ написан более трёх лет назад

Комментировать

Как сделать REST API с описанием в формате Swagger(python)?

Astrohas @Astrohas

Python/Django Developer

https://github.com/noirbizarre/flask-restplus
https://flask-restplus.readthedocs.io/en/stable/sw...

Ответ написан более трёх лет назад

Комментировать

Где научиться алгоритмам?

Astrohas @Astrohas

Python/Django Developer

Кормен . Алгоритмы вводный курс (ну или Т. Кормен - Алгоритмы. Построение и анализ)
Дасгупта С., Пападимитриу Х., Вазирани У. - Алгоритмы - 2014 хорош в паре с курсом лекций от Lektorium.

Ответ написан более трёх лет назад

Комментировать

Какой алгоритм эффективнее ищет минимум?

Astrohas @Astrohas

Python/Django Developer

первый O(N)
второй N*log(n) * C
для поиска одного минимума хорош первый
а для множественного поиска хорош второй в паре с банальным бинарным поиском

Ответ написан более трёх лет назад

Комментировать

Как установить библиотеку PyAudio на Windows 10?

Astrohas @Astrohas

Python/Django Developer

Поставьте Microsoft Visual C++ 14.00 там у вас на втором скрине даже ссылка есть

Ответ написан более трёх лет назад

Комментировать

Как можно написать этот код короче (предложите свои варианты)?

Astrohas @Astrohas

Python/Django Developer

def check_username_and_description(self, status):
    return not any(
            x in " ".join([status.user.screen_name, status.user.description]).lower()
            for x in BOT_SETTINGS['banned_username_userinfo_words']
        )

или

def check_username_and_description(self, status):
    return not bool(
        set((status.user.screen_name + " " +  status.user.description).lower()).intersection(
            set(BOT_SETTINGS['banned_username_userinfo_words'])
        )
    )

Ответ написан более трёх лет назад

1 комментарий

Как лучше преобразовать ответ БД в JSON?

Astrohas @Astrohas

Python/Django Developer

https://blogs.gnome.org/danni/2013/03/07/generatin...

Ответ написан более трёх лет назад

Комментировать

Python работа с массивом?

Astrohas @Astrohas

Python/Django Developer

class Name:
   __data = dict()

Ответ написан более трёх лет назад

Комментировать

Python работа с последовательным портом?

Astrohas @Astrohas

Python/Django Developer

делайте бесконечный цикл как то так https://stackoverflow.com/a/13018267/7831712

Ответ написан более трёх лет назад

1 комментарий

Как получить текст в python3 из PDF?

Astrohas @Astrohas

Python/Django Developer

import textract
text = textract.process("path/to/file.extension")

textract.readthedocs.io/en/latest
https://github.com/deanmalmgren/textract

Ответ написан более трёх лет назад

1 комментарий

Почему выдается ошибка в данном коде?

Astrohas @Astrohas

Python/Django Developer

Замените условие на

if not b and ( c=='mod' or c=='/' or c=='div'):
    print("Делеение на ноль")

или лучше на

if not b and c in ['/','%', 'mod', 'div']:
    print("Делеение на ноль")

а так пара других вариантов

a = float(input())
b = float(input())
c = input()
z_div = 'Деление на ноль!"
OPERATORS = {
    "+": a + b,
    "-": a - b,
    "*": a * b,
    "/": a / b if b else z_div,
    "mod": a % b if b else z_div,
    "div": a // b if b else z_div,
    "pow": a ** b 
}
print(OPERATORS[c])

более понятный вариант, но придется вычислять все варианты.
Более python way :

a = float(input())
b = float(input())
c = input()
z_div = 'Деление на ноль!'
OPERATORS = {
    "+": lambda x, y: x + y,
    "-": lambda x, y: x - y,
    "*": lambda x, y: x * y,
    "/": lambda x, y: x / y if y else None,
    "mod": lambda x, y: x % y if y else None,
    "div": lambda x, y: x // y if y else None,
    "pow": lambda x, y: x ** y 
}
print(OPERATORS[c](a, b))

АНАЛог с eval :

a =  input()
b =  input()
c = input()

OPERATORS = {
    "+": "+",
    "-": "-",
    "*": "*",
    "/": "/",
    "mod": "%",
    "div": "//",
    "pow": "**"
}

if not float(b) and c in ['/','%', 'mod', 'div']:
    print('Деление на ноль!')
else:
    print(
        eval(
            a + OPERATORS[c] + b
        )
    )

Ответ написан более трёх лет назад

3 комментария

Войдите на сайт