Иногда в поисках IT-направления, где реализоваться, соискатели сталкиваются с такой профессией как «Data Scientist», тогда назревает резонный вопрос: кто это и что он должен знать?
На этот и на другие вопросы, связанные с профессией «дата-сайентист», мы постараемся ответить в этой статье.
Data Scientist — кто это?
Data Scientist — это тот, кто является экспертом в аналитике данных. Помимо этого, он должен обладать глубокими техническими знаниями для решения непростых технических задач. Это и математики, и компьютерные специалисты в одном лице, задача которых работать и анализировать большое количество информации.
Ключевыми словами этой профессии являются:
- громадные объемы информации;
- полное отсутствие структуры в представленной информации.
Типичным примером такой работы является:
- обработка метеорологических данных за какой-нибудь большой период времени и выявление закономерности;
- обработка статистики запросов пользователей в поисковой системе;
- анализ результатов спортивных соревнований;
- работа с геномом различных микроорганизмов;
- и мн. др.
Обычно работа дата-сайентиста включает в себя математическую статистику и машинное обучение. Такой специалист проводит глубокий анализ данных, находит закономерности и составляет прогнозы, чтобы найти оптимальное решение к поставленной задаче. А задачи бывают разные.
Не стоит путать Data Scientist и бизнес-аналитику. Это совершенно разные вещи, хотя в обеих профессиях идет работа с огромным объемом информации. Разница скрыта в конечных результатах, которые получают в этих сферах:
- Data Scientist — это тот, кто работает «для будущего», так как он находит в большом объеме информации закономерность и взаимосвязь, для того чтобы предугадать возможный результат, который может получиться в будущем. Он смотрит, как решить поставленную задачу с технической стороны.
- Бизнес-аналитик сосредотачивается на финансовых показателях компании, а не на технической части разрешения поставленных задач. Например, он анализирует эффективность рекламной компании, количество продаж за определенный период и т. д. И, получив подобную информацию, старается улучшить коммерческие показатели организации. Иногда для своего анализа такой специалист может привлечь Data Scientist в помощь.
Полезен ли труд Data Scientist?
На самом деле с трудами этих специалистов мы сталкиваемся в каждый день, ведь это:
- прогнозирование погоды;
- голосовой помощник;
- прогрессивный чат-бот;
- генная инженерия;
- представление возможных друзей в соцсетях;
- и др.
Полезен ли такой труд? Скорее всего да, чем нет. Кстати, у основания поисковых алгоритмов и алгоритмов распознавания человеческого лица тоже стоят специалисты Big Data.
Где можно встретить Data Scientist?
Data Scientist — это тот, кто может работать в различных сферах. Хоть эта профессия и имеет тесную связь с IT, но специалистов Big Data можно встретить где угодно:
- В любом направлении бизнеса. Дата-сайентист может создать алгоритм для вычисления спроса на товар или услугу компании или же провести анализ: имеет ли смысл открывать новое направление в бизнесе или открывать бизнес в новом регионе и т. д.
- В банковской сфере. Тут такой специалист легко рассчитает платежеспособность клиента и подскажет, можно ли ему выдавать кредит.
- В логистике. Алгоритмы Big Data помогут рассчитать оптимальный маршрут и способ доставки груза.
- В IT-направлении. Data Scientist может разработать бота, поисковый алгоритм или алгоритм машинного обучения.
- В производственных предприятиях. Тут разрабатываются различные алгоритмы вычисления необходимого количества производимой продукции, программы для вычисления вероятности сбоя оборудования или появления дефекта в продукции.
- В страховых организациях. Подобные программы вычисляют вероятности возникновения страховых случаев.
- В медицине. Автоматическое выставление диагноза на основании полученных данных — это тоже алгоритмы Big Data.
- В сельском хозяйстве. Прогноз возможного объема урожая и подбор оптимального использования земли — это рабочая сфера Data Scientist.
- В генной инженерии. Современные исследования в этой области просто немыслимы без обработки огромного объема информации.
- В метеорологии. Мы уже затрагивали сегодня эту тему, прогноз погоды — это результат деятельности дата-сайентиста.
И список можно продолжать и продолжать. Это и физические исследования, и космос, и спорт и мн. др. Везде, где нужно составить прогноз на основе большого количества данных, — это поле деятельности для Data Scientist.
Заработок Data Scientist
Это достаточно востребованная профессия с хорошим заработком. Открытые вакансии по этой профессии найти несложно, но нужно быть хорошим профессионалом своего дела. Машинное обучение сейчас впереди планеты всей, а обучающие алгоритмы для этого и есть непосредственное поле деятельности Data Scientist.
Что там по зарплатам? Приведем среднестатистические цифры, потому что многое определяют опыт специалиста, сфера работы и деятельность самой компании. На первое полугодие 2021-го года на hh.ru примерно вот такой расклад:
- Зарплата по Российской Федерации начинается от 65 тысяч рублей, в столице — от 90 тысяч, притом что это заработная плата для новичков в этой профессии.
- Зарплата более опытного специалиста 90-160 тыс. рублей по РФ и 140-200 тыс. в Москве.
- Data Scientist высокой квалификации зарабатывает от 250 тыс. рублей.
Чем конкретно занимается Data Scientist?
В разных отраслях и в различных компаниях деятельность Data Scientist, возможно, будет немного различаться, но в целом сценарий работы будет похож:
- Выяснить конкретную цель у заказчика, что ему нужно.
- Определить, решает ли машинное обучение поставленную задачу.
- Если «да», тогда готовятся данные для анализа и подготавливается будущая модель оценки.
- Идет непосредственное программирование и тренировка модели машинного обучения.
- Определение целесообразности применяемой модели машинного обучения.
- Внедрение модели непосредственно в производственный процесс.
- Введение, обработка и обработка введенной модели машинного обучения.
Что должен знать Data Scientist
Опять же, в разных ситуациях по-разному, однако если в общих чертах, то это:
- Математика.
- Математическая статистика.
- Программирование.
- Основы машинного обучения.
- Сфера, где будете трудиться как Data Scientist.
- Личные качества: коммуникабельность, ответственность, присутствие логики и аналитического мышления, усидчивость, целеустремленность и мн. др.
С математикой и математической статистикой — лучше окончить специализированные курсы и читать профильную литературу. Благо в сети много материалов на эту тему специально для подготовки Data Scientist.
Что касается языка программирования, то непосредственным лидером этой сферы является Python. Он очень широко применяется в машинном обучении и в Big Data, соответственно. Учится достаточно легко, поэтому его часто рекомендуют даже новичкам. Плюс этого языка в том, что даже если вы не сможете себя реализовать, как Data Scientist, то этот язык сможет вам пригодиться в других IT-сферах. Но если вы его выучите и упорно будете идти к Data Scientist, то нужно будет пройти еще несколько курсов непосредственно по алгоритмам машинного обучения. В сети их тоже достаточно, как платных, так и бесплатных.
Заключение
Data Scientist — это достаточно интересная специальность, в которой вы будете не только кодить, но и решать интересные задачи, возможно, даже очень важного значения. Порог входа в эту профессию достаточно высок, однако при должном упорстве и желании обучиться любой заинтересованный новичок с ним справится.
Данная профессия совмещает в себе программирование и еще какую-нибудь сферу, в которой, возможно, вы сильны, и это будет вашим преимуществом. Поэтому дело за малым: решиться и начать обучаться.
Другое