Задать вопрос
  • Зачем изучать несколько языков программирования(c++, java)?

    sergey-gornostaev
    @sergey-gornostaev
    Седой и строгий
    Во-первых, гипотеза лингвистической относительности утверждает, что чем больше языков знаешь, тем гибче и богаче твой логический аппарат. По своему опыту могу сказать, что это правда. Например изучение Lisp'ов существенно расширило мои возможности в других языках. Но мой опыт и мнение не так авторитетны, как авторов всемирно известного бестселлера "Программист-прагматик" - Эндрю Ханта и Дэвида Томаса, которые пишут: «Изучайте по крайней мере один новый язык ежегодно. Разные языки решают одни и те же проблемы разными способами. Изучив несколько разных подходов, вы сможете расширить свой кругозор и не погрязнуть в рутине.»

    Во-вторых, рано или поздно профессиональный рост java-программиста, например, неизбежно приводит его к необходимости глубоко понимать работу компилятора и виртуальной машины, а это невозможно без знания C++, на котором они написаны.

    В-третьих, java-программист свободно лазающий за ответами в исходники JVM, способный дебажить сборщик мусора, писать JNI-библиотеки и использовать Compiler API для метапрограммирования имеет больше предложений работы и более выгодные условия.
    Ответ написан
    4 комментария
  • Знаете ли вы чаты, где можно пообщаться с начинающими программистами?

    myjcom
    @myjcom
    Список интересных групп, каналов и ботов телеграма. Чаты Telegram для программистов и разработчиков, гиков, айтишников, сисадминов и девопсов, а также прочих неравнодушных к компьютерам и программированию.
    https://github.com/goq/telegram-list/blob/master/R...
    Ответ написан
    1 комментарий
  • Как ускорить код с подсчетом похожести?

    @deliro
    1. Убери повторения (в моём примере это уже сделано), сравнивать id=5 с id=1 не надо, если ты уже сравнил id=1 с id=5. Они симметричны
    2. Если кэш поможет (в чём я сомневаюсь) — можно его оставить. Если ты уверен, что не будет двух неуникальных list_word_int — выбрасывай кэш смело.
    3. Это вроде можно распараллелить. Задействуй все ядра
    4. Перепиши это на быстрый компилируемый язык вроде Golang или Cython

    Однопоточный код
    import difflib
    from functools import lru_cache
    from itertools import combinations
    
    arr = [
        {"_id": 1, "list_word_int": (189, 114, 188, 90, 2, 68, 96, 0, 250, 168, 150, 126)},
        {"_id": 2, "list_word_int": (224, 26, 56, 153, 139, 128, 126, 220, 190, 137)},
        {"_id": 3, "list_word_int": (188, 241, 225, 134, 134, 30, 134, 187, 204, 227, 3)},
        {"_id": 4, "list_word_int": (224, 166, 159, 236, 82, 17, 82, 21, 227, 97)},
        {"_id": 5, "list_word_int": (98, 96, 38, 107, 142, 134, 13, 36, 23)},
    ]
    
    
    @lru_cache(maxsize=2 ** 13)
    def get_ratio(lst1, lst2):
        return difflib.SequenceMatcher(None, lst1, lst2).ratio()
    
    
    if __name__ == "__main__":
        for a, b in combinations(arr, 2):
            ratio = get_ratio(a["list_word_int"], b["list_word_int"])
            print(
                "id= ",
                a["_id"],
                "Сравниваемый id=",
                b["_id"],
                "Коэффициент похожести:",
                ratio,
            )
    
        print(get_ratio.cache_info())
    Параллельное выполнение, генерация комбинаций во всех процессах
    import difflib
    import multiprocessing as mp
    import os
    from itertools import combinations, cycle
    
    arr = [
        {"_id": 1, "list_word_int": [189, 114, 188, 90, 2, 68, 96, 0, 250, 168, 150, 126]},
        {"_id": 2, "list_word_int": [224, 26, 56, 153, 139, 128, 126, 220, 190, 137]},
        {"_id": 3, "list_word_int": [188, 241, 225, 134, 134, 30, 134, 187, 204, 227, 3]},
        {"_id": 4, "list_word_int": [224, 166, 159, 236, 82, 17, 82, 21, 227, 97]},
        {"_id": 5, "list_word_int": [98, 96, 38, 107, 142, 134, 13, 36, 23]},
    ]
    
    
    def target(id_, count):
        pid = os.getpid()
    
        for i, (a, b) in zip(cycle(range(count)), combinations(arr, 2)):
            if i != id_:
                continue
            ratio = difflib.SequenceMatcher(
                None, a["list_word_int"], b["list_word_int"]
            ).ratio()
            print(f"PID: {pid} id={a['_id']} & {b['_id']} ratio={ratio}")
    
    
    if __name__ == "__main__":
        processes = []
    
        for x in range(mp.cpu_count()):
            p = mp.Process(target=target, args=(x, mp.cpu_count()))
            p.start()
            processes.append(p)
    
        for p in processes:
            p.join()
    Один процесс генерирует комбинации в очередь, остальные обрабатывают
    import difflib
    import multiprocessing as mp
    import os
    from itertools import combinations
    
    arr = [
        {"_id": 1, "list_word_int": [189, 114, 188, 90, 2, 68, 96, 0, 250, 168, 150, 126]},
        {"_id": 2, "list_word_int": [224, 26, 56, 153, 139, 128, 126, 220, 190, 137]},
        {"_id": 3, "list_word_int": [188, 241, 225, 134, 134, 30, 134, 187, 204, 227, 3]},
        {"_id": 4, "list_word_int": [224, 166, 159, 236, 82, 17, 82, 21, 227, 97]},
        {"_id": 5, "list_word_int": [98, 96, 38, 107, 142, 134, 13, 36, 23]},
    ]
    
    
    def queue_creator(q, w_count):
        pid = os.getpid()
        print("Created queue generator PID", pid)
    
        for a, b in combinations(arr, 2):
            q.put((a, b))
        for _ in range(w_count):
            q.put(("stop", None))
    
    
    def worker(q):
        pid = os.getpid()
        print("Created worker PID", pid)
    
        while True:
            a, b = q.get()
            if a == "stop":
                break
    
            ratio = difflib.SequenceMatcher(
                None, a["list_word_int"], b["list_word_int"]
            ).ratio()
            print(f"PID:{pid} {a['_id']} & {b['_id']} ratio={ratio}")
    
    
    if __name__ == "__main__":
        queue = mp.Queue()
        # 1 воркер на генерацию комбинаций, остальные на обработку
        workers_count = (mp.cpu_count() - 1) or 1
        q_process = mp.Process(target=queue_creator, args=(queue, workers_count))
        q_process.start()
        processes = [q_process]
    
        for x in range(workers_count):
            p = mp.Process(target=worker, args=(queue,))
            p.start()
            processes.append(p)
    
        for process in processes:
            process.join()

    Ответ написан
    22 комментария
  • Как в Debian посмотреть загрузку процессора?

    Tolly
    @Tolly Автор вопроса
    Все нашел в Интернете:
    ps aux | awk '{s += $3} END {print s "%"}'
    Ответ написан
    Комментировать