Просто искать работу сложно: DATA SCIENTISTS
Обсудим с Валерием Бабушкиным:
— Как ИИ трансформирует работу дата сайнтиста — от построения моделей до продакшн-пайплайнов
— Нужны ли будут DS-специалисты, когда нейросети сами пишут код и подбирают модели
— Какие направления в Data Science и ML останутся перспективными для карьеры
Гость стрима — Валерий Бабушкин. Ex-VP Data Science в Blockchain.com, ex-VP ML в Alibaba Russia, ex-Senior Director в X5 Retail Group. Kaggle Grandmaster (Топ-23 мирового рейтинга). Автор книги «ML System Design». Преподаватель ВШЭ и karpov.courses.
📝 Саммари
Data Scientist в 2026 году: грейды, навыки, найм и будущее профессии — интервью Senior Director of Data, Analytics & AI
Последнее обновление: март 2026
Гость: Валерий Бабушкин — Senior Director of Data, Analytics & AI в одной из крупнейших энергетических компаний мира, Лондон. Управляет командами данных ~600 человек в двух третях бизнес-юнитов компании: трейдинг и шиппинг (9000+ кораблей), ритейл (сопоставим с X5), Castrol, авиационное топливо, EV/водород/ветер. До этого прошёл путь через Яндекс, X5 Retail Group (Senior Director), Alibaba Russia (VP ML), Meta/WhatsApp и Blockchain.com (VP Data Science). Kaggle Competitions Grandmaster — топ-23 в мировом рейтинге. Соавтор книги ML System Design (Manning Publications, совместно с Арсением Кравченко). Преподаватель ВШЭ и karpov.courses (HardML, A/B-тестирование). Автор Telegram-канала «Время Валеры» (28 000+ подписчиков).
Ведущая: Кира Кузьменко — рекрутер с 20-летним стажем в IT. Фаундер международного рекрутингового агентства NEWHR. Автор курса по поиску работы Hello New Job. Ведущая YouTube-шоу «Просто искать работу сложно».
Со-ведущая: Оксана Прутьянова — руководитель направления рекрутинга Data Science и аналитиков в NEWHR.
Главное из интервью
Data Scientist в 2026 году — это по-прежнему размытая профессия: в зависимости от компании и региона за одним названием скрываются 10–20 разных работ. Но AI уже чётко разделил рынок на тех, кто добавляет интеллектуальную стоимость (думает — «зачем?», «что если?»), и тех, кто служит «человеком-машинным интерфейсом» — просто переводит запросы бизнеса в SQL-код. Вторым, по словам Бабушкина, «надо серьёзно задуматься о будущем». Написание кода становится общим местом, а главным бутылочным горлышком теперь является умение задизайнить систему, понять бизнес-контекст и охватить всю картинку в голове. Самое неожиданное: бездумные AI-агенты в эксперименте Бабушкина додумались посчитать ключевую метрику, которую пропустила команда живых аналитиков.
«Data Scientist — зверь очень непонятный»: кто это вообще такой в 2026 году
Data Scientist — одна из тех профессий, которую невозможно определить одной фразой. И в 2020-м было непонятно, и в 2026-м яснее не стало. Бабушкин начинает разговор с честного признания: единого понимания профессии не существует.
Приходишь в 10 разных компании, говоришь — покажите ваших дата-сайентистов. А это, оказывается, абсолютно 10 разных типов специалистов.
— Валерий Бабушкин
Если всё же пытаться нащупать общее — Data Scientist отличается от дата-аналитика тем, что больше работает с машинным обучением. Хотя, как замечает Бабушкин, грань становится с каждым годом тоньше. Это человек, который пишет код на Python, иногда на SQL, работает с ML, занимается статистикой — и при этом запросто может делать аналитику. Код может занимать от 20% до 60% его времени. Качество этого кода — от «достаточно плохого» до «очень хорошего уровня».
Важно региональное различие: на западном рынке Data Scientist — это скорее «мощный аналитик», который применяет продвинутые инструменты для аналитического вывода, но ни в коем случае не инженер. В России дата-сайентисты часто делают много инженерной работы — то, что уже называется ML-инженер.
А какую задачу бизнеса решает DS? Бабушкин формулирует просто: зарабатывает деньги за счёт оптимизации.
Весь машинный лёрнинг, вся аналитика, весь AI в принципе зачастую построен на том, что ты зарабатываешь деньги на оптимизации.
— Валерий Бабушкин
Два классических примера из ритейла: оптимизация алгоритма ценообразования в X5 (формирование оптимальной цены с нащупыванием разницы — между «раздать бесплатно» и «никто не купит») и прогнозирование спроса (купил больше помидоров — они сгниют, купил меньше — люди унесли деньги к конкуренту). Второй тип заработка — технологические компании, которые продают доступ к своей технологии напрямую (Яндекс с поиском и рекламой, например). Но и там под капотом — оптимизация.
«Человек-машинный интерфейс — скорее всего, умрёт»
Главный тезис Бабушкина: AI разделил всех специалистов по данным на два лагеря. И разделитель — не в том «умеешь ли ты пользоваться ChatGPT», а в другом — добавляешь ли ты интеллектуальную стоимость.
Вот приходит бизнес и говорит: вот метрика, посчитай мне её, пожалуйста. Садится аналитик, начинает писать код на SQL, приходит результат метрики.
Какой интеллектуальный вклад здесь вложил аналитик в этом случае?
Никакой. По факту, такой аналитик — человек-машинный интерфейс.
— Валерий Бабушкин
Если весь интеллектуальный труд уже проделал бизнес (сформулировал метрику, знает, что с ней делать), а аналитик просто перевёл запрос в SQL-код — это работа, которая полностью заменяется AI. И Бабушкин не смягчает: «Если твоя работа такая, то извини. Надо серьёзно задуматься о будущем».
Противоположная модель — когда специалист сам думает: что нужно сделать, какие сценарии развития возможны, что мы будем делать с результатом. Вот эта работа имеет будущее.
Бабушкин предлагает простое упражнение: сядь и в течение недели-двух распиши, что ты делаешь каждый день. Общаешься с бизнесом? Пишешь код? Думаешь? Дизайнишь? Дальше — прикинь, что из этого уже неплохо делает LLM. Найди своё бутылочное горлышко, которое не позволяет тебе ускоряться и пофиксь его с помощью AI.
Раньше, если твоим бутылочным горлышком был код, то теперь это фиксится с помощью AI. Ты перестаёшь проседать. Т
Нужно задать себе вопрос: а у меня труд интеллектуальный или квазиинтеллектуальный? И если добавочный интеллектуальный труд у меня был низкий — всё очень плохо.
— Валерий Бабушкин
Агенты vs люди: эксперимент с ценообразованием складов
Один из самых ярких кейсов интервью — собственный эксперимент Бабушкина, где он столкнул AI-агентов с командой живых аналитиков.
Задача: ценообразование складских помещений. Специфика в том, что если склад заполнен на 50% — любая продажа идёт практически в чистый плюс (склад уже построен, затраты не растут). Если заполняемость 100% — цены надо повышать. Первым делом нужно понять заполняемость — от этого зависит кардинально разная стратегия.
Я встречаюсь с командой людей, и они начинают какие-то разумные предположения: вот мы можем вот такие сделать промо, вот так... Я говорю: хорошо, пацаны, а заполненность-то какая? — А мы не посчитали. А агенты, зараза, первым делом посчитали заполняемость. Получается: агенты 1 — люди 0.
— Валерий Бабушкин
Агенты работали неделю, люди — тоже неделю. Результат агентов Бабушкин оценивает как «средненький». Но ключевую метрику они нашли, а люди — нет.
Практический вывод Бабушкина: если ты сделал какой-то анализ, написал документ — разумная практика — пойти и попросить AI-систему покритиковать твою работу. Не написать за тебя, а именно покритиковать. Дальше, правда, нужно приложить интеллектуальную добавочную стоимость, чтобы эту критику принять или отбросить.
При этом Бабушкин не очарован текущим уровнем агентов: «Я пока не очень поражён тем, как они работают в рамках аналитических, умных, долгосрочных задач. Вообще их качество в аналитике довольно посредственное. LLM — это такая средняя посредственность. Но терпение и труд всё перетрут».
Классический ML vs GenAI: где сейчас деньги
Оксана Прутьянова задаёт важный вопрос: изменился ли баланс между классическим ML и LLM-экономикой? Бабушкин настаивает — подавляющее количество денег по-прежнему зарабатывается классическим ML.
Вся агентская экономика, вся LLM-экономика строится на чём? Мы поднимем продуктивность. Что такое поднятие продуктивности? Это возможность делать то же самое с меньшим количеством людей. Вся эта экономика LLM строится лишь на том, что мы там всех вас поувольняем.
— Валерий Бабушкин
При этом граница между GenAI и классическим ML размыта. Если LLM-эмбеддинг используется внутри поисковой системы — это GenAI или ML? Бабушкин считает, что тут тяжело разграничить. Чётко GenAI — это когда заменяют customer support на AI-агента.
Есть реальные истории успеха: Revolut автоматизировал три четверти саппорта через LLM — и саппорт, по признанию Бабушкина, «действительно на уровне, решает проблемы, тебе не нужно пользоваться человеком». Но это всё-таки саппорт, а не та грандиозная история успеха, которую ожидает рынок.
Прогноз Бабушкина: агенты заменят десятки миллионов людей в бэк офисах крупных компаний (Индия, Малайзия и т.д.) в горизонте 3–5 лет. Но возврата инвестиций на внедрение AI в бизнес пока и близко нет, и скорее всего не будет даже в следующем году.
Профессия Data Scientist по грейдам: от джуна до хеда
Джуны: «Мы мысленно с вами»
Бабушкин не щадит: джунам сейчас плохо.
Слава богу, что у меня нет детей, которым 18–20 лет сейчас, и мне не нужно входить в профессию. У меня нет ответа.
— Валерий Бабушкин
Нанимает ли Бабушкин к себе джунов? Практически нет. Но когда нанимают интернов, то берут таких, которых раньше взяли бы на мидла. Один из ста стажёров соответствует этому уровню — и именно такие завалены офферами, пока остальные «ходят и грустят».
Что отличает «элитного стажёра»? Он может задизайнить систему, уже реализовывал проекты, строил какие-то системы. Бабушкин задаёт риторический вопрос: что мешает любому сейчас взять и построить веб-сервис, нагнать 100 юзеров и поработать с этим? Ничего не мешает. Но из тысячи посмотревших стрим пойдут и сделают 10–20 человек.
Нужна, как ни смешно, агентность. Инициатива, агентность. Забавно, что в эпоху агентов мы ищем людей с агентностью.
— Валерий Бабушкин
Агентность и инициативность — это, по мнению Бабушкина, не навык, а характеристика человека. Не то, что можно кардинально в себе изменить. Результат — жёсткое расслоение: небольшая когорта элитных людей завалена предложениями, а основная масса не может найти работу. И это расслоение будет только увеличиваться.
Мидлы DS: «Им, наверное, ещё хуже»
Эти пацаны думали, что вот они и вошли. Вот они и зацепились. А суровый сапог искусственного интеллекта давит им по пальцам.
— Валерий Бабушкин
Мидлам нужно делать самое неприятное — анализировать свою работу и понимать, где они тратят больше всего времени. Бабушкин рассказывает, как в Meta и Яндексе он работал по 3 часа в день и получал отличные перформанс ревью — потому что чётко понимал, что важно. Огромное количество инженеров этого не понимают.
Если ты не понимаешь, что важно, но знаешь, что тебя будут оценивать — то максимально рациональная стратегия: делать как можно больше всего подряд. Это как лотерея, «промывка золота» — промываешь огромный объём руды в надежде собрать крупицы. Люди в Meta доходили до нервного срыва перед перформанс ревью.
Совет Бабушкина мидлам: начать анализировать свой труд. Зачем я это сделал? Это полезно или нет? Что важно? Кто меня тормозит? Посмотреть на себя со стороны — тяжело и неприятно. Не все смогут. Но тем, кто сможет — будет хорошо. И здесь очень полезно попросить кого-то со стороны — консультанта, ментора — потому что в другом человеке увидеть проблемы гораздо проще.
Сеньоры DS: «Жизнь стала лучше»
Для настоящих сеньоров мало что поменялось — потому что хороший сеньор всегда был автономной единицей, отвечающей за систему или процесс. Просто теперь сложнее спрятаться за «я сеньор, я пишу код, не трогайте меня».
Раньше сеньоры давали задачи мидлам и джунам — прямо как агенту, мелко нарезанные. Теперь, в каких-то моментах, вместо джунов и мидлов могут появиться агенты. Жизнь у сеньоров стала лучше.
— Валерий Бабушкин
Если у тебя ограничением было то, что понятно, что делать, но не хватает рук — теперь инструментов больше. Раньше ты мог проверить одну двадцатую часть гипотез — теперь одну пятую. Это серьёзный прирост.
При этом Бабушкин скептичен к мифу о «сеньоре с x3 мощностями», потому что основное ограничение продуктивности сеньора — это не его пропускная способность, а внутренняя бюрократия и абсурдность процессов большой корпорации.
Руководители Data Science: менять систему поощрений
У руководителей задача не изменилась — отвечать за результат и находить новые возможности для заработка. Но появился неудобный вопрос мотивации: если я могу сделать всё, что от меня ожидается, за 15 часов в неделю — зачем работать оставшиеся 25 часов бесплатно?
Получается, что 20 часов в неделю я работаю, но по факту за бесплатно. Потому что всё, что от меня ожидалось, я уже сделал за 15 часов. Есть люди, которые скажут — нет, спасибо, мне достаточно. Правда же?
— Валерий Бабушкин
Из этого следует необходимость пересмотра перформанс ревью. Идёт расслоение производительности — нужно поощрять топ-перформеров. Например, Meta уже реагирует: бонусы до 300% от зарплаты для лучших, повышенные мультипликаторы на RSU-рефреши. Классический перформанс «все плюс-минус получают одно и то же» — больше не работает.
Отдельный удар приходится по middle менеджменту. Если каждый сеньор — мега-автономный чувак с агентами, зачем столько менеджеров? Та же Meta хочет сделать «гига-менеджеров»: вместо 5 репортов — 10, никаких еженедельных one-on-one.
Легче быть менеджером у пяти джунов или у 15 сеньоров?
— Валерий Бабушкин
Hard skills Data Scientist: что комодити, а что критично
Бабушкин чётко разделяет:
- Комодити: написание кода. Всё ещё нужно, но перестаёт быть отличительным преимуществом.
- Критично: умение дизайнить системы. Понимать trade-off'ы, находить баланс между решениями, чётко излагать мысли и охватывать систему целиком в голове. Это становится только важнее.
На вопрос «какие технологии учить» Бабушкин отвечает неожиданно:
Технологии — это ерунда. Технологии сегодня одни, завтра другие. Нужно уметь решать задачи. Попробуй сделать какой-то веб-сервис, нагони туда 100 пользователей, поработай с этим. А все нужные технологии и так на слуху — ты их и учишь.
— Валерий Бабушкин
Из конкретных инструментов — минимум: любая веб-форма LLM (ChatGPT, Gemini) уже по умолчанию. А вот любая агентская среда разработки — Cursor, Claude Code или аналоги — это то, что точно надо освоить прямо сейчас.
«Быть в топ-5% — это вообще много ума не нужно»
Бабушкин ссылается на статью Дэна Лу (Dan Luu), которую приводил в своём Telegram-канале: чтобы быть в топ-5% — это «вообще ни о чём». Инструкция простая: взял, проанализировал, посмотрел, как делают успешные люди, в крайнем случае пошёл за консультацией, поправил, применил, повторил.
Поразительно, но многие люди сознательно как будто всё делают, чтобы не улучшаться. И даже то, что мы сейчас скажем — всё равно сделает 5 человек из 100. И хорошо. Если бы было 20 — конкуренция была бы в 4 раза выше.
— Валерий Бабушкин
Из конкретного, что помогает выделиться на рынке: Kaggle (если дошёл до Grandmaster — это 0,01% популяции, «с тобой точно можно поговорить»), олимпиады, open source (но не те коммиты, где просто «комменты меняли»), публикации, выступления. Суть не в конкретной активности, а в доказательстве, что ты умеешь вгрызться и довести дело до результата.
Процесс найма Data Scietists в крупных компаниях: три собеседования
Процесс собеседования на сеньора в компании, где работает Бабушкин — три интервью:
1. Код (два формата на выбор). Первый — дают существующий код на ревью: «посмотри, что хорошо, что плохо, что бы ты изменил». Второй — дают boilerplate и просят реализовать классический ML-алгоритм. Можно пользоваться Google и даже LLM для подсказок — но не для написания всего кода. Смотрят, как человек решает проблемы.
2. System Design (два формата). Greenfield — «представь такую задачу, задизайнь систему с нуля». Brownfield — «расскажи про систему, которую ты строил, и как бы ты её сейчас изменил с учётом всего, что узнал за это время».
3. Behavioral (поведенческое). Как человек вёл себя в таких-то ситуациях, как рассказывает о своём опыте.
Главная ошибка кандидатов, по Бабушкину: не думать над финальным ответом, а потом менять его, когда уточняют «это твой финальный ответ?». Проблема не в неправильном ответе — а в том, что человек не провернул внутри себя критическую проверку.
FOMO и страх: «Паршиво, пацаны, что говорить»
Бабушкин отвечает на оба страха одним аргументом: если новички могут быстро войти в профессию (а сейчас это так), то и переучиться в новую роль тоже можно быстро. То, что сейчас происходит на рынке — это спринт-обучения новым скилам, а не конец света.
Если вдруг в какой-то момент я пойму, что мне нужно что-то выучить, для того, чтобы оставаться востребованным на рынке, то это потребует какого-то короткого времени, просто это будет спринт. Звучит посильно.
— Валерий Бабушкин
А рецепт борьбы с обоими страхами — тот же, что и для карьерного роста: сядь и проанализируй рынок, вакансии, себя. «Мы работаем в области аналитики — значит, должны уметь анализировать. В том числе себя»..
Блиц: будущее профессии глазами Бабушкина
Пошёл бы ты в Data Science в 26-м году с нуля?
Я не уверен, что пошёл бы в дата-сайенс, честно говоря. Это красный океан. Это смерть.
— Валерий Бабушкин
Бабушкин признаёт, что вошёл в DS в своё время потому, что было легко войти, много денег, и это было лучше его работы на тот момент. Сейчас условия другие — и на вопрос «а куда бы пошёл?» честно отвечает: не знает. «Классическая проблема человека в начале карьеры».
Через 3 года команда 600 человек станет больше или меньше?
Я думаю, меньше станет.
— Валерий Бабушкин
Кем будет Data Scientist в 2029 году?
Бабушкин отказался прогнозировать — и объяснил почему:
Мне кажется, что ничего сильно не поменяется. Но это всегда так — люди думают, что ничего сильно не поменяется, а потом смотришь на 10 лет назад и думаешь: ё-моё, как всё изменилось.
— Валерий Бабушкин
Какие направления в DS и ML наиболее устойчивы к автоматизации?
Сценарный анализ и принятие рисков. Вот принятие рисков точно AI не заберёт.
— Валерий Бабушкин
Риск — это ответственность. А ответственность должен нести человек, не машина
FAQ
Кто такой Data Scientist в 2026 году?
По словам Бабушкина, это по-прежнему «зверь непонятный» — в разных компаниях и странах за этим названием скрываются 10–20 разных типов задач. Общее: работа с ML, код на Python/SQL, статистика. На Западе ближе к аналитике, в России — к ML-инженерии.
Стоит ли сейчас входить в Data Science джуном?
Бабушкин честен: у него нет ответа. В компании, где он сейчас руководит аналитикой, практически не нанимает джунов. Тех стажёров, которых берут, раньше наняли бы на мидла. Но если у вас есть агентность и реализованные проекты — шансы есть.
Какие навыки Data Scientist самые важные в 2026 году?
Умение дизайнить системы, понимать business-контекст и отвечать на вопросы «зачем?», «для чего?», «что если?». Написание кода становится коммодити. Конкретные технологии меняются — важнее умение решать задачи.
Заменит ли AI дата-сайентистов?
Тех, кто служит «человеком-машинным интерфейсом» (переводит запросы бизнеса в SQL) — да, практически полностью. Тех, кто добавляет интеллектуальную стоимость: анализирует сценарии, принимает решения, берёт на себя риски — нет, не в ближайшие годы.
Где сейчас больше денег — в классическом ML или GenAI?
По оценке Бабушкина, подавляющее количество денег по-прежнему зарабатывается классическим ML. GenAI-экономика строится на замене людей, но возврата на инвестиции пока нет.
Как подготовиться к собеседованию на DS-позицию?
В компании, где сейчас работает Бабушкин — три этапа: код (ревью или реализация алгоритма), system design (greenfield или brownfield) и behavioral. Главная ошибка — давать ответ, не проверив его внутри себя, и менять его при уточняющем вопросе.
Как выделиться среди других DS-кандидатов?
Kaggle (Grandmaster = 0,01% популяции), олимпиады, осмысленный open source, публикации, собственные проекты с реальными пользователями. Суть — доказать, что умеешь вгрызться и довести до результата.
Где найти Валерия Бабушкина
- Telegram-канал «Время Валеры» — 28 000+ подписчиков
- Книга ML System Design — Manning Publications (в соавторстве с Арсением Кравченко)
Ресурсы, которые Бабушкин рекомендует:
- Канал Игоря Котенкова — «Сиолошная»
- Pragmatic Engineer (Gergely Orosz) — блог на английском
Об авторах
Валерий Бабушкин — Senior Director of Data, Analytics & AI в компании из нефтегазовой Big Five, Лондон. Управляет командами данных ~600 человек в двух третях бизнес-юнитов компании. До этого — Яндекс, X5 Retail Group (Senior Director), Alibaba Russia (VP ML), Meta/WhatsApp, Blockchain.com (VP Data Science). Kaggle Competitions Grandmaster — топ-23 в мировом рейтинге. Соавтор книги ML System Design (Manning Publications). Преподаватель ВШЭ и karpov.courses. Telegram: «Время Валеры».
Кира Кузьменко — рекрутер с 20-летним стажем в IT. Фаундер международного рекрутингового агентства NEWHR. Автор курса по поиску работы Hello New Job. Ведущая YouTube-шоу «Просто искать работу сложно». Telegram: @kirafound. Личный ТГ-канал: «Рекрутинг, котики и апокалипсис». LinkedIn.
Оксана Прутьянова — руководитель направления рекрутинга Data Science и аналитиков в NEWHR.