Что и на каком уровне нужно знать что бы устроиться биоинформатиком?
Вопрос к биоинформатикам, если они тут есть канешно:) Сейчас работаю молекулярным биологом,могу писать простенькие программы на python, хочу перепрофилироваться на биоинформатика. Насколько знаю там используеться python, R алгоритмы и графы. На каком уровне надо знать? И где можно потренироваться. Не будут ли на собеседовании придираться к диплому?
Смотря куда устроиться. Чаще всего требуется высокий уровень по одной из дисциплин и некий средний по второй. Чаще всего узкие специалисты плохо понимают потребности друг друга и особо не владеют смежными технологиями. Python очень поможет, однозначно. Я например, рисую иллюстрации в Inkscape, анализирую полученные данные в python, занимаюсь автоматизированным анализом изображений. Тут чаще ценится сама гибридность и возможность быстро учиться новому. Прикладные задачи всегда крайне узкие. Я бы еще посоветовал в сторону нейросетей посмотреть.
Tsimur_S: Как я сказал, ценятся гибридные специалисты. Нужно быть в достаточной мере компетентным в узкой области, чтобы понимать задачи и предлагать свои решения без "переводчика". Самая большая проблема - коммуникация между очень узкими областями. Вот прямо профильное образование необязательно на мой взгляд. Впрочем, я с другой стороны баррикад. Я по профессии врач. Мне кажется, будет достаточно Coursera в нужном направлении. А узкий специалист уже поставит задачу. Задача программиста - сформулировать требования к исходным данным для получения хороших результатов и обработать эти данные. Грубо говоря, объяснить, что для корректного анализа фотографии срезов должны быть нормализованы по балансу белого, экспозиции и другим параметрам. Или предложить использовать другой краситель, чтобы не долбаться с сегментацией темно-синих ядер на синем фоне. То есть не только получать сырые данные, но и подсказывать оптимальные пути. Вообще, конечно, зависит от направления. У меня в основном анализ изображений, статистическая обработка и поддержание it-инфраструктуры.
Важно хорошо знать статистику. Полезно уметь программой разбирать текстовые файлы сложной структуры.
Много биоинформатического софта работает под Linux, полезно уметь с ним работать.
Ну и базы данных - SQL, в будущем может возрастет роль SPARQL (уже сейчас много биомедицинских онтологий, просто мало кто умеет с ними работать).
Плюс ко всему вышесказанному - R - идеальный инструмент для биоинформатики (менее идеальный чем питон, конечно же). Но в вопросах анализа NGS-данных и визуализации ( я сам занимаюсь обработкой транскриптомов) - прекрасно работает.
Ищите компетентных специалистов, которые уже работают в этой сфере и достигли там успеха определенного, учитесь у них, становитесь их помощниками - гораздо больше пользы будет чем от институтской волокиты...