Ошибка RuntimeError: can't start new thread на Python (MacBook Pro M1 2020 ОЗУ 8 Гб) как настроить или обойти?

Question

Melograno @Melograno

Ошибка RuntimeError: can't start new thread на Python (MacBook Pro M1 2020 ОЗУ 8 Гб) как настроить или обойти?

Я не являюсь програмистом и знания очень скудные по данной теме.
Передо мной стоит задача выгрузить исторические данные из Yahoo Finance.
Для этого использую Python и конкретно библиотеку yf.download
Код верный, так как у преподавателя все работает, НО! он использует ПК на Windows, у меня же MacBook Pro (M1 2020 ОЗУ 8 Гб).
Необходимо выгрузить данные по 4933 акциям, и когда доходит примерно до 2000 процесс останавливается и не идет дальше. и выскакивает ошибка RuntimeError: can't start new thread
Я думаю, что проблема в компьютере (логично предположить).

Если кто-нибудь знает, как это обойти (без смены компьютера), пожалуйста, напишите.

на этом сайте был вопрос, но решение не подошло

код:

nasdaq_stocks = yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker')

Результат:

[                       0%                       ]  13 of 4933 completed
---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
Input In [25], in <cell line: 1>()
----> 1 nasdaq_stocks = yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker')

File ~/opt/anaconda3/lib/python3.8/site-packages/yfinance/multi.py:105, in download(tickers, start, end, actions, threads, group_by, auto_adjust, back_adjust, progress, period, show_errors, interval, prepost, proxy, rounding, timeout, **kwargs)
    103 _multitasking.set_max_threads(threads)
    104 for i, ticker in enumerate(tickers):
--> 105     _download_one_threaded(ticker, period=period, interval=interval,
    106                            start=start, end=end, prepost=prepost,
    107                            actions=actions, auto_adjust=auto_adjust,
    108                            back_adjust=back_adjust,
    109                            progress=(progress and i > 0), proxy=proxy,
    110                            rounding=rounding, timeout=timeout)
    111 while len(shared._DFS) < len(tickers):
    112     _time.sleep(0.01)

File ~/opt/anaconda3/lib/python3.8/site-packages/multitasking/__init__.py:119, in task.<locals>.async_method(*args, **kwargs)
    116     single = config["POOLS"][config["POOL_NAME"]]['engine'](
    117         target=_run_via_pool, args=args, kwargs=kwargs)
    118 config["TASKS"].append(single)
--> 119 single.start()
    120 return single

File ~/opt/anaconda3/lib/python3.8/threading.py:852, in Thread.start(self)
    850     _limbo[self] = self
    851 try:
--> 852     _start_new_thread(self._bootstrap, ())
    853 except Exception:
    854     with _active_limbo_lock:

RuntimeError: can't start new thread

[********************  41%                       ]  2033 of 4933 completed

Вопрос задан более года назад
671 просмотр

11 комментариев

Подписаться 1 Средний 11 комментариев

FOUREX @FOUREX

Можно весь код?

Написано более года назад
Melograno @Melograno Автор вопроса

FOUREX,

Доброго времени суток.

Если честно я не знаю как код сюда засунуть, я не программист, увы ;(
Сейча спосле вашего ответа искал как поделиться ноутбуком нашел ответ что самое лучшее на github разместить. Я туда залил.

https://github.com/Melogra/Melogra/blob/main/stock...

Если это не удобно, подскажите как я мог бы его выслать.

Написано более года назад
FOUREX @FOUREX

Вы говорили преподавателю об этой проблеме? Он вам ответил?

Написано более года назад
Melograno @Melograno Автор вопроса

FOUREX, да говорил. там была еще проблема в данными. мы думали, что устранив её код будет исполняться. У преподавателя все работает, но у него windows, а у меня мак (никогда бы не подумал, что огребу такие проблемы с яблоком). Поскольку проблема вылезла только сегодня, преподаватель еще не ответил по решению. Завтра поищет решение, но я решил обратиться в сеть, поскольку вся эта история нужна для работы и сроки поджимают, думал, что это просто решить. Но начал читать про многопоточность и у меня волосы дыбом стали. ничего не понимаю ((((

Написано более года назад
Melograno @Melograno Автор вопроса

FOUREX, я вычитал про threading, но как это встроить в свой блокнот не понимаю совсем (я финансист). наверняка как-то можно написать код чтобы он типо частями выгружал данные с yahoo. Не может быть, чтобы комп на котором запускаются тяжелые программы для обработки видео и т.п., не потянул парсинг (если я правильно употребляю этот термин) простых данных. Там их не так-то уж и много.

Написано более года назад
Алан Гибизов @phaggi Куратор тега Python

Код в вопросе надо обернуть тегом code для корректного отображения. Удобно это делать кнопкой </>
См.п.3.8 Регламента.

Написано более года назад
Алан Гибизов @phaggi Куратор тега Python

Melograno, преподаватель запускает код на своем windows в jupyter notebook/Anaconda?

Написано более года назад
Melograno @Melograno Автор вопроса

Алан Гибизов, я не знаю если честно. 99% что да.

Написано более года назад
Melograno @Melograno Автор вопроса

Алан Гибизов, извините новичок. не знал

Написано более года назад
Алан Гибизов @phaggi Куратор тега Python

Melograno, на будущее ознакомьтесь
И я думаю, совет ScriptKiddo, ограничить threads - хорош. По-умолчанию там «сколько влезет», но возможно с M1 не всё так просто.

Написано более года назад
Melograno @Melograno Автор вопроса

Алан Гибизов, Ознакомился.

К сожалению, перепробовал False, 3, 5, 100, но моя проблема не решена. Буду пытаться дальше найти ответ.
Скорее всего он на поверхности и тут дело действительно в новом процессоре M1

Написано более года назад

Решения вопроса 1

6 комментариев

Everything_is_not_so_bad @2ord

Возможно, достаточно и 3-5 потоков.

Написано более года назад

Melograno @Melograno Автор вопроса

К сожалению, не помогло :(

yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker', threads=3)

выводит это

[                       0%                       ]  10 of 4933 completed
---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
Input In [23], in <cell line: 1>()
----> 1 yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker', threads=3)

File ~/opt/anaconda3/lib/python3.8/site-packages/yfinance/multi.py:105, in download(tickers, start, end, actions, threads, group_by, auto_adjust, back_adjust, progress, period, show_errors, interval, prepost, proxy, rounding, timeout, **kwargs)
    103 _multitasking.set_max_threads(threads)
    104 for i, ticker in enumerate(tickers):
--> 105     _download_one_threaded(ticker, period=period, interval=interval,
    106                            start=start, end=end, prepost=prepost,
    107                            actions=actions, auto_adjust=auto_adjust,
    108                            back_adjust=back_adjust,
    109                            progress=(progress and i > 0), proxy=proxy,
    110                            rounding=rounding, timeout=timeout)
    111 while len(shared._DFS) < len(tickers):
    112     _time.sleep(0.01)

File ~/opt/anaconda3/lib/python3.8/site-packages/multitasking/__init__.py:119, in task.<locals>.async_method(*args, **kwargs)
    116     single = config["POOLS"][config["POOL_NAME"]]['engine'](
    117         target=_run_via_pool, args=args, kwargs=kwargs)
    118 config["TASKS"].append(single)
--> 119 single.start()
    120 return single

File ~/opt/anaconda3/lib/python3.8/threading.py:852, in Thread.start(self)
    850     _limbo[self] = self
    851 try:
--> 852     _start_new_thread(self._bootstrap, ())
    853 except Exception:
    854     with _active_limbo_lock:

RuntimeError: can't start new thread

а при обращении к переменной зависает

nasdaq_stocks

[********************  41%                       ]  2028 of 4933 completed

Написано более года назад

Everything_is_not_so_bad @2ord

Melograno, надо проверить нагрузку на компьютер во время работы скрипта. Если есть возможность отслеживать количество потоков - лучше. Может, ресурсов не хватает на создание нового потока.

Написано более года назад
Melograno @Melograno Автор вопроса

Román Mirilaczvili, добрый день. Вот это имеете ввиду?

Написано более года назад
Everything_is_not_so_bad @2ord

Melograno, да, именно это.
Возможно, есть лимит ОС на количество потоков. Попробуй закрыть менее важные программы, поскольку они также требуют потоки. Может, поможет.

Написано более года назад
Melograno @Melograno Автор вопроса

ScriptKiddo добрый день

Выставил yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker', threads=0)
и помогло. Качает медленно. на всю базу потребовалось около получаса. Но вроде бы скачало. Теперь надо как-то рандомно проверить корректность скачанных данных, но это уже другая задача.

Спасибо вам.

Написано более года назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- 3 часа назад
- 55 просмотров
2

ответа
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 5 часов назад
- 14 просмотров
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 6 часов назад
- 48 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 17 часов назад
- 115 просмотров
1

ответ
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 19 часов назад
- 72 просмотра
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- вчера
- 46 просмотров
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- вчера
- 99 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 140 просмотров
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 233 просмотра
3

ответа
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 17 апр.
- 141 просмотр
2

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Протестировать веб-сервис на Django и подготовить отчеты

19 апр. 2024, в 18:05

1000 руб./в час

Доработать проект на Django

19 апр. 2024, в 18:02

80000 руб./за проект

Разработать 3 сайта по готовому дизайну (оптимизирован под tilda)

19 апр. 2024, в 17:56

30000 руб./за проект

FOUREX,

Доброго времени суток.

Если честно я не знаю как код сюда засунуть, я не программист, увы ;(
Сейча спосле вашего ответа искал как поделиться ноутбуком нашел ответ что самое лучшее на github разместить. Я туда залил.

https://github.com/Melogra/Melogra/blob/main/stock...

Если это не удобно, подскажите как я мог бы его выслать.
Вы говорили преподавателю об этой проблеме? Он вам ответил?
FOUREX, да говорил. там была еще проблема в данными. мы думали, что устранив её код будет исполняться. У преподавателя все работает, но у него windows, а у меня мак (никогда бы не подумал, что огребу такие проблемы с яблоком). Поскольку проблема вылезла только сегодня, преподаватель еще не ответил по решению. Завтра поищет решение, но я решил обратиться в сеть, поскольку вся эта история нужна для работы и сроки поджимают, думал, что это просто решить. Но начал читать про многопоточность и у меня волосы дыбом стали. ничего не понимаю ((((
FOUREX, я вычитал про threading, но как это встроить в свой блокнот не понимаю совсем (я финансист). наверняка как-то можно написать код чтобы он типо частями выгружал данные с yahoo. Не может быть, чтобы комп на котором запускаются тяжелые программы для обработки видео и т.п., не потянул парсинг (если я правильно употребляю этот термин) простых данных. Там их не так-то уж и много.
Код в вопросе надо обернуть тегом code для корректного отображения. Удобно это делать кнопкой </>
См.п.3.8 Регламента.
Melograno, преподаватель запускает код на своем windows в jupyter notebook/Anaconda?
Алан Гибизов, я не знаю если честно. 99% что да.
Алан Гибизов, извините новичок. не знал
Melograno, на будущее ознакомьтесь
И я думаю, совет ScriptKiddo, ограничить threads - хорош. По-умолчанию там «сколько влезет», но возможно с M1 не всё так просто.
Алан Гибизов, Ознакомился.

К сожалению, перепробовал False, 3, 5, 100, но моя проблема не решена. Буду пытаться дальше найти ответ.
Скорее всего он на поверхности и тут дело действительно в новом процессоре M1

Answer 1 · 2022-08-10 21:40:26

Попробуйте выставить параметр threads в False, чтобы грузить в один поток или числом укажите нужное количество потоков. Например: 10

yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker', threads=False)
yf.download(tickers = nasdaq_tickers, period = 'max', interval = '1d', group_by = 'ticker', threads=10)

Answer 2 · 2022-08-11 20:26:32

Можно слегка изменить код и скачать сначала четные а потом нечетные тикеры. Может проблема с потоками M1 проскочит мимо. Ну не проскочит - тогда поделить на 4 части. Тикер по модулю 4. Я всегда так делал. Если какая-то инфо-система подавилась данными. Делаем партишенинг.

Ошибка RuntimeError: can't start new thread на Python (MacBook Pro M1 2020 ОЗУ 8 Гб) как настроить или обойти?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт