Дата сайентист кто это? 7 ключевых аспектов для понимания.

Datascience
0
(0)

Дата сайентист: кто это, почему эта профессия так популярна и почему не каждый может им стать?

Помните выражение: «кто владеет информацией, тот владеет миром»? В нашу цифровую эпоху она актуальна как никогда.  Только сегодня её стоит перефразировать: «кто владеет наибольшим количеством данных, и умеет их эффективно и грамотно использовать в своих интересах, у того и бабки». Немного пошло, но таковы реалии современного мира.

В условиях жёсткой конкуренции, умение работать с данными и извлекать из них ценную информацию, которой пока ещё не завладели остальные – это ключ к успеху. Такая работа с данными стала целой наукой — Data Science (дата сайентс), а специалист по Data Science – дата сайентист.

Почему профессия дата сайентист стала популярной?

Populyarnost_Datascience

Интенсивное развитие информационных технологий, повлекло за собой бурный рост почти всех отраслей человеческой деятельности: сотовая связь, телевидение, интернет и многое другое.

Каждый клик мышки, скроллинг экрана телефона, нажатие клавиши клавиатуры и прочее генерируют огромные объёмы трафика данных, который по некоторым статистическим источникам достигает 2,5 квинтиллиона байт ежедневно!

Очевидно, что такие объёмы представляют собой просто несметное количество полезной информации. Уметь отделить «зёрна от плевел», проанализировать данные, сделать правильные выводы и понять, как всё это с пользой применять в дальнейшем – задача дата сайентиста.

 

Дата сайентист кто это?

data scientist kto eto

Эффективную работу с информацией обеспечивают 3 главных области Data Science. Это: математика, разработка и предметная область (т.е. та сфера, где дата сайентс применяется: бизнес, производство, финансы и т.д.). Дата сайентист должен разбираться в них, но не обязательно одинаково хорошо во всех трёх. Почему так?

Если вы попробуете устроиться на вакансию дата сайентиста, и начнёте посещать собеседования разных компаний, то узнаете, что работодатели предъявляют разные требования к этой должности и ожидают совершенно разных результатов от нанимаемых дата сайентистов.

Всё дело в том, что профессия дата сайентист имеет очень обобщённое понятие, в котором эти 3 главных составляющих (математика, разработка и предметная область) варьируются в зависимости от поставленных задач.

Кому-то нужно увеличить точность прогнозирования продаж в своём интернет-магазине, кому-то нужен подробный анализ данных своих клиентов, например, банку для выявления мошенников, ну а кто-то вообще занимается исследовательской работой и нужно придумать новые математические методы.

Вариантов много, но некоторые закономерности определённо присутствуют. Чтобы лучше понять каким разным бывает Data Science, стоит обратиться к математику позапрошлого века Иоганну Дирихле.

Этот дед придумал так называемое распределение вероятностей. Чтобы не уходить в дебри математической науки рассмотрим это распределение Дирихле на примере 3 важнейших областей   Data Science и представим эту сложную (на самом деле не очень) задумку в виде рисунка

Соотношение разных сфер Data Science между собой определяет несколько базовых, можно даже сказать фундаментальных, профессий в этой науке.

Согласно распределению Дирихле, мы можем увидеть основные спецификации дата сайентистов.

Machine Learning Engineer.

Математика и разработка — специалист в области машинного обучения. Занимается внедрением моделей машинного обучения и их дальнейшей поддержкой.  Это специалист по искусственному интеллекту, который автоматизирует человеческий труд и может делать множество разных интересных штук, например:

  • Рекомендации товаров в интернет-магазине на основе истории покупок и предпочтений пользователя;
  • Прогноз цен на акции на основе данных финансовых рынков;
  • Модели машинного обучения для выявления подозрительных операций с банковскими картами на основе поведения клиента и истории транзакций;

Data Analyst.

Математика и предметная область. Проще говоря- аналитик данных.

Аналитик данных- это человек (пока ещё), который собирает, обрабатывает, изучает и интерпретирует данные. Например:

  • Финансовый аналитик – анализирует данные о доходах и расходах компании, оценивает эффективность инвестиций и причины убытков, прогнозирует возможные риски и потенциальные выгоды;
  • Маркетинговый аналитик – анализирует поведение потребителей, каналы продвижения, прогнозирует спрос и выявляет потенциальных клиентов;
  • Аналитик в производстве – анализирует причины дефектов, оптимизирует процессы, оценивает каналы сбыта и прогнозирует спрос на продукцию;

Любой бизнес, в широком смысле этого слова, готов пожертвовать многим, в обмен на грамотного и эффективного аналитика. Поэтому практически в любой сфере человеческой деятельности ему есть и будет применение.

Data Engineer.

Предметная область и разработка. Дата инженер создаёт и поддерживает системы хранения данных в компании. Разработка и оптимизация баз данных, настройка ETL – процессов (извлечение, обработка и загрузка данных). Управление хранилищами и организация безопасности данных. Мониторинг и оптимизация производительности систем обработки информации.

Machine Learning Researcher.

Здесь основой всего является математика. В матане надо шарить серьёзно. Уклон в Machine Learning Researcher приходится главным образом на исследовательскую работу. Специалист этой профессии исследует, разрабатывает и оптимизирует модели машинного обучения. Грубо говоря, если Machine Learning Engineer работает и внедряет уже существующие модели обучения и алгоритмы для ИИ (искусственного интеллекта), то Researcher их создаёт.

Аналитик.

Как рыба в воде чувствует себя в предметной области, т.е. в той сфере, которая требует какого-либо улучшения, оптимизации, качественного преобразования.

Аналитик главным образом решает вопросы бизнеса и в меньшей мере погружён в тонкости математической составляющей тех методов, которыми пользуется в своей работе.

Devops.

Максимально сосредоточен на разработке и автоматизации процессов, связанных с публикацией и запуском моделей машинного обучения. Выпускает спроектированные и протестированные модели в «свет»:

  • Установка модели на сервер;
  • Создание API для доступа к модели;
  • Настройка систем мониторинга и управления моделью;
  • Обеспечение безопасности;

Вот таким разным может быть дата сайентист, в зависимости от своих навыков и задач. Как когда-то давно понятие «компьютерщик» объединяло в себе и программистов, и системных администраторов, и вообще почти любого человека, который не боится нажимать на «кнопки» компа, так и сейчас дата — сайентист- это человек, работа которого тем или иным образом связана с обработкой большого количества различных данных.

Карьера в Data Science, или почему у вас ничего не получится.

Дата сайентист – интересная, востребованная, высокооплачиваемая профессия. Перспективы фантастические, а возможности безграничны. Data Science- это не только IT (информационные технологии — это лишь инструмент реализации), Data Science — это неотъемлемая часть бизнеса, науки, производства и вообще почти любой сферы человеческой деятельности.

Data Science позволяет масштабировать и автоматизировать многие процессы, оптимизировать человеческий труд и сделать легко и просто то, что человек сделать либо не в силах, либо сделает несоизмеримо дольше, хуже и затратнее. Если сказать совсем по-простому, то дата сайентист помогает минимизировать затраты и многократно увеличить прибыль.

Именно это качество дата сайентиста побуждает владельцев бизнеса экономить на чём угодно в пользу Data Science и специалистов, которые умеют эффективно применить эту науку там, где это потребуется.  Зарплаты в Data Science растут быстрее и чаще чем где бы то ни было, и это понятно. Дата сайентист для бизнеса – это курица, которая несёт золотые яйца.

Желающих стать дата сайентистом прибавляется с каждым годом, но далеко не у всех это получается и на это есть несколько причин.

Во-первых, Data Science – это сложно. Не стоит строить никаких иллюзий, за простую работу никто не станет платить больших денег, и Data Science не исключение.

Во-вторых, обучение может занимать от нескольких месяцев до нескольких лет – в зависимости от того, какие цели вы ставите перед собой.

В- третьих: конкуренция в сфере Data Science очень высокая и с каждым годом становится ещё выше.

В-четвёртых, очень сложно найти хорошую работу не имея опыта. Эта проблема не уникальна для Data Science и является головной болью молодого специалиста в практически любой отрасли.

Это самые очевидные проблемы для новичка, чаще всего именно на этом рушатся иллюзии тех, кто решил вот так вот запросто стать супер-мега успешным специалистом в модной профессии и сказочно на этом разбогатеть. Всё гораздо прозаичнее и в целом подтверждает народную мудрость про труд и рыбу в нём.

Подробнее о сложностях

slozhnosti data science

Если вы откровенный гуманитарий, то будьте готовы к тому, что придётся учить математику. Обойтись без матана в Data Science не получится. Однозначно. Но не стоит пугаться. Поступать в университет и получать вышку совсем не обязательно, для начального уровня достаточно будет базы, которую при желании может освоить любой.

Просто изучать одно из направлений, например, дата инженеринг, дата аналитику или машинное обучение недостаточно. Для получения работы по специальности нужно иметь какой-то практический багаж, тот самый опыт, которого у новичков, как правило, взять негде.

Рассчитывать на быстрое трудоустройство не стоит. Придётся побегать по собеседованиям, даже если вы неплохо разбираетесь в матчасте. Хорошую службу может сослужить тематические комьюнити, или говоря проще –  тусовки дата сайентистов.

Там можно встретить и дельные советы по общению на собеседованиях, и рекомендации по обучению, и даже свои, сугубо дата сайентисткие фишки и лайфхаки. Ну в общем тусовка, она и есть тусовка, никогда не стоит пренебрегать общением с людьми, которые уже прошли тот путь, на который вы только вступили.

Всегда приветствуется наличие стажировки. Скорее даже рекомендуется такую стажировку пройти, пусть даже она будет бесплатной, прежде чем пытаться устроиться на испытательный срок в хорошую компанию. Никогда не брезгуйте возможностью получения реальных навыков, даже на самых непривлекательных условиях.

Что нужно для старта?

В общих чертах, для того чтобы стать дата сайентистом вам потребуется:

  • Время
  • Деньги
  • Обучение
  • Практика
  • Нетворк – сеть полезных контактов и знакомств

Хорошо если вы имеете какую-то смежную специальность, тогда можно через фриланс укрепить навыки, подтянуть базу и выдвинуть свою кандидатуру, например, на позицию джуниора. Скорее всего, вы такой специальностью не владеете и решили зайти в Data Science через пожарный вход. Тогда вам будет полезным узнать, что самыми проходными профессиями считаются:

  • Data Analyst
  • Data Engineer
  • Machine Learning Engineer

Их нельзя назвать лёгкими, но порог входа у них значительно ниже чем в остальных, и при этом они очень актуальны на сегодняшний день.

Из них наиболее широкое применение получила аналитика. Она активно применяется как в it-компаниях, так и в маркетинге, HR и т.д. Поэтому, проще всего заходить именно с этой стороны, но при условии, что вам это нравится, возможно, вы готовы начать с большего.

Как устроиться дата сайентистом по объявлению?

ob'yavlenie data science

Сайт hh.ru по самому общему запросу «data science» выдаёт 732 вакансии (на момент написания этой статьи).

Это говорит о том, что при желании, работу можно найти даже по объявлению в интернете. Да, есть масса нюансов, но в целом, специалистов ищут. Работы много.

Сегодня работодателя уже мало интересует диплом о высшем образовании, гораздо важнее практический опыт, правильно составленное резюме и хорошо подвешенная метла (да простят меня ревнители русского языка).

Всё это можно получить в интернете, нужны только деньги и время. Образовательные площадки в сети заточены главным образом именно на производство узкоспециализированных специалистов. Таких, которые пусть и не обладают уровнем выпускника технического университета, но имеют всё только самое необходимое для решения актуальных задач бизнеса. Никакой шелухи, только самое необходимое.

Где учиться, чтобы не разочароваться?

obuchenie v it

Многие сегодня имеют одну мечту и одну цель – бабки. Если вы из этих людей, то попробуйте поискать более простые и быстрые пути, Data Science- это другая история. Если вы решили зайти сюда только из-за хайпа и высокой зарплаты, то вы очень скоро разочаруетесь, потому что есть способы заработать денег гораздо проще и быстрее.

В случае,если вам на самом деле интересна область больших данных, и вы видите в этом своё будущее, то вот вам бесплатный совет: не спешите выкладывать свои денежки. Образование- дело, конечно стоящее и перспективное, но хороших учителей не так-то просто встретить. Гораздо больше инфоцыган и просто недоучек, возомнивших себя гуру.

Даже если вы найдёте хорошую образовательную площадку (тренинг, менторинг, школу и т.п.), это ещё не гарантирует что вы сможете стать хорошим специалистом. Даже если вы заплатите очень большие деньги, учиться вместо вас никто не будет. Это как в автошколе: вы платите за обучение, но это совсем не значит, что вы сумеете сдать экзамен в ГАИ и стать хорошим водителем, тут всё зависит от вас лично.

У вас может быть прекрасный преподаватель, замечательная база и вообще полный фарш всего необходимого, но… Учиться придётся ТОЛЬКО ВАМ. Поэтому, рекомендуем вам, прежде чем заплатить кому-то деньги, получше познакомиться с профессией. Взвесить все «за» и «против», трезво оценить свои возможности и убедиться, действительно ли Data Science это то, что вам нужно.

Для этого достаточно подписаться на нашу бесплатную библиотеку «Слюнявый джун», где в свободном доступе можно скачать книгу «Data Science. Наука о данных с нуля», «Просто Big Data». Эти материалы сокровище для начинающего дата сайентиста и самое главное – никаких денег! Только ваше волевое решение начать.

Другие бесплатные материалы для входа в Data Science

data science besplatno

Ещё раз повторю: прежде чем отдавать кому-то деньги, попробуйте узнать поближе профессию, которой решили себя посвятить. Вот вам небольшая подборка бесплатных материалов для ознакомления:

Только ваше желание отделяет вас от вашей мечты! Дерзайте, и всё обязательно получится!

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 0 / 5. Количество оценок: 0

Оценок пока нет. Поставьте оценку первым.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *