Про Big Data слышал каждый, кто хоть косвенно интересуется или связан с IT-сферой. Но не всегда понятно, что это такое. Какое обучение или курсы по Big Data нужно пройти, чтобы стать специалистом в этой сфере? Кто такой специалист по Big Data? Вопросов вокруг этой сферы очень много, особенно у молодых айтишников.
Big Data — вокруг нас. Любое наше «прикосновение» к интернету формирует Big Data:
устройство для входа в интернет;
какой контент мы просматривали;
поисковые запросы;
наши социальные сети;
и т. д.
Big Data помогает формировать «цифровые личности» каждого пользователя, чтобы потом эта информация использовалась для улучшения интернета, ну и для рекламы, конечно же. Это что касается Big Data, связанной с пользователями интернета. Но Big Data есть и во многих других отраслях, например:
медицина,
бизнес,
промышленность,
наука,
метеорология,
и т. д.
Объем данных растет безостановочно — это уже известный факт. Но еще один факт — работать с данными нужно уметь, потому что в основном это неструктурированные массивы, из которых нужно уметь извлекать полезное и необходимое. Для этого и нужны специалисты по Big Data.
Big Data: обучение
Как и в программировании в целом, направление Big Data разделено на множество небольших направлений, где требуются свои навыки и технологии. Это часто вводит в ступор начинающих программистов, которые хотят стать специалистами по работе с большими данными. Условно и очень широко Big Data можно поделить на 2 больших направления, которые часто могут быть «смешаны» внутри одной компании:
Big Data инженерия — это работа над каркасом сбора и анализа информации и над представлением данных другим структурам;
Big Data аналитика — это прямое взаимодействие с данными, которые подготовила инженерия, то есть именно это направление анализирует, ищет закономерности, классифицирует, составляет прогнозы и т. д.
Выбрать направление в Big Data — это то, с чего стартует само обучение. Дальше можно приступать к изучению требуемых технологий.
Big Data-обучение: специалист
Специалист по Big Data — это профессионал, который владеет необходимым набором инструментов для осуществления деятельности, связанной с большими данными. Естественно, что все сразу изучить будет достаточно сложно, поэтому любой курс по Big Data дает вам практический и теоретический минимум для старта в профессии.
Любой путь имеет какое-то начало: если вы выбрали в качестве начала пути курс по Big Data, то нужно проверить, чтобы в нем был заложен тот минимум, который вам будет необходим для старта в профессии. Не все курсы одинаково полезны, а обучение Big Data должно быть качественным.
Представляем вашему вниманию пошаговую инструкцию, как должно выглядеть поэтапное обучение Big Data, где этапы обучения должны идти в указанном порядке.
Для Big Data инженерии и аналитики
Bash Scripting. Это может быть любой курс или официальное руководство, главное, чтобы в процессе обучения было много практики.
Python. Это может быть любой курс по Питону или что-то типа «Python для Big Data». Иногда вместо Питона может быть изучен Java. Этот язык не так распространен в Big Data, как Питон, но им все равно пользуются.
Cloud. Облачные технологии очень плотно вошли в Big Data, особенно Amazon Web Service.
HDFS. Много курсов по этой тематике есть на Udemy.
Далее, в зависимости от выбранного направления, нужно будет изучать отдельные технологии.
Для Big Data аналитики:
Kafka.
Apache Storm.
Apache Kinesis.
Apache Spark Streaming.
Для Big Data инженерии:
Mapreduce.
SQL.
Любой процедурный язык программирования вместо SQL.
Hive.
Pig вместо Hive.
Apache Spark.
Теоретический минимум, который должен знать специалист по Big Data, — это:
как развернуть работу серверов на Linux;
как писать скрипты при помощи командной строки Bash Scripting;
язык программирования для работы с данными: Python, R, Java, Scala;
базовое знание SQL;
основы взаимодействия с облаками.
Заключение
Обучение Big Data — это множество разных путей. Представленный путь оптимальный, но не единственный. В разных компаниях будет разная работа по Big Data, поэтому вполне вероятно, что будут разные требования к специалисту.
Обучение Big Data — это непрерывный процесс, будьте готовы к этому. Того минимума, что вам дадут курсы, хватит только для первого трудоустройства на позицию Junior. А дальше лишь работа над собой и постоянный рост.

Другое