В крупных компаниях пишут свои нейронки или берут предобученные?
На данный момент я учусь на Data Scientista, и мне интересно следующее - как разрабатываются нейронные сети в любых компаниях(больших или маленьких),а именно разрабатывается ли архитектура с нуля или берутся готовые модели по типу ResNet, YOLO или того же BERT?
А я то тут сидел пыхтел, делал свой трансформер с многоголовым вниманием, опираясь на блог tensorflow, а на практике оказывается можно было взять готовую модель из TF Hub, но ничего, лишним не будет)
Бывает и так и так. Только вот используя исключительно готовые модели специалистом по Data Science себя можно считать только в своем воображении. В лучшем случае - Data Analyst. Примерно так, как человека который использует написанные кем-то программы никто не назовет Программистом.