Анджей Аршавский, Газпром нефть: “Мы стремимся к демократизации работы с Data Science”

– Самые интересные практические задачи в нашей области сегодня находятся в промышленном секторе. Для меня это долгосрочный выбор. В банкинге – достаточно ограниченный круг задач. Там существует порядка десятка типов задач, которые решаются с помощью “искусственного интеллекта” (ИИ).

Искусственный интеллект – это набор технологий, которые позволяют заменять когнитивную функцию человека

Направление получило свой новый виток развития, когда появились методы машинного обучения, особенно – продвинутые методы, типа deep learning.

ИИ в нашем понимании – набор предиктивных технологий, технологий анализа данных ( в том числе – статистического анализа), технологий математической оптимизации и неких экспертных правил. Данный технологический “микс” позволяет решать те задачи, которые ранее мог решать только человек, поэтому подход и получил название “искусственный интеллект”. Несколько лет назад многие были против этого термина, но сейчас он понемногу приживается.

Особенности применения ИИ в промышленности

– В промышленности много мест принятия решения, где можно превзойти человека за счет автоматизации. Но там есть и свои сложности. Например, не всегда практично учиться на тех данных, которые накоплены, поскольку сами системы меняются быстрее, чем мы накапливаем данные.

Сами системы меняются быстрее, чем мы накапливаем данные

Так, технологический процесс может все время меняться из-за поступления нового оборудования, изменения технологических схем и т.д. Исторические данные устаревают быстрее, чем накапливаются.

– Аналогичная проблема есть и в банкинге, социум меняется тоже очень быстро. Но в отличие от банковского сектора, где все равно приходится ждать накопления исторических данных, в промышленности есть другие подходы. Развивается обучение на малых данных – one shot learning, буквально – на нескольких примерах. Reinforcement learning позволяет моделировать в виртуальном пространстве то, что происходит сейчас, и учиться искать новые пути решения задач. Возможна и генерация или псевдо-генерация данных, которая позволяет обучаться, когда исторических данных не очень много.

– В промышленности мы еще не подошли к тому этапу, когда системы могут сами автоматически принимать решения. Хотя есть и исключения – системы. которые работают на уровне АСУТП и которые также применяют решения на основе технологий ИИ, могут принимать решения в режиме реального времени. В основном, разрабатываются рекомендательные системы, системы поддержки принятия решений. Системы могут автоматизировать человеческий труд, но результаты этой автоматизации контролируются экспертами.

Проблема “черного ящика”

– На самом деле, человек также не всегда может объяснить, как он принимает решения. Решения часто – явления многофакторные. Оператор принимает решения, опираясь на нормативные решения плюс собственный опыт. Это такой же “черный ящик”. Эта проблема имеет скорее, юридический, аспект.

Центр монетизации данных ГПН

– Направление ИИ является одним из ключевых направлений цифровой трансформации в нашей компании.

– Наш Центр монетизации данных работает во всей цепочке создания добавленной стоимости Газпром нефти: от разведки месторождений до добычи, логистики и сбыта. . Наиболее интересны для нас задачи по моделированию месторождений и принятию решений по разработке месторождений, там зарыты самые большие издержки для компании.

– Есть две составляющие того, чем занимается наш Центр:

  • Первая – это решения в области Data Science, которые применяются в бизнес-процессе компании или в технологическом процессе.
  • Вторая – разработка платформ, облегчающих работу с данными, с применением аналитических инструментов и инструментов управления данными. На этих платформах разворачиваются среды для дата-сайентистов.

– Платформы строит наша команда дата-инженеров или девопсов. Платформа – это некий конгломерат решений и инструментов, предоставляющий некий функционал. Те платформы, что сегодня предоставляют вендоры, – это тоже некие сборки инструментов. В силу нашей специфики, нам часто нужны другие инструменты, либо они должны по-другому между собой взаимодействовать. Универсальной платформы для Data Science промышленной компании не существует.

Technical Analytic Data Science

– Между датасайентистами и потановщиками задач – технологами существует разрыв. Этот разрыв не всегда эффективно заполняется при общении одних с другими на производстве. Проблема в том, что у датасайентистов не всегда хватает времени на общение с постановщиками задач. Задачи все уникальные, все они требуют погружения в технологический процесс.

– Поэтому мы сформулировали особую роль, которую мы назвали “ technical analytic data scientist ”. Это специалисты, которые выросли из датасайентистов, но они не занимаются как таковым моделированием. Все свое время они тратят на общение с технологами.

Мы решили, что технолога обучить математике гораздо сложнее, чем математика обучить любой технологии

– Они отвечают не только за первоначальную постановку задачи. но и за сопровождение проекта на всем его жизненном цикле. Они отвечают за то, что разработками датасайентистов потом действительно можно будет пользоваться. Также они отвечают за испытания и приемку, консультируют по продукту. У TADS – большая нагрузка по погружению в предметную область, при этом они должны хорошо понимать инструменты Data Science.

– В проектной команде нет “главных”, но в нашей концепции на первую роль выходят TADS. Именно они отвечают за то, что делаются правильные вещи, которые на деле будут внедряться.

– TADS должны уметь подсчитать экономику проекта, оценить, насколько точными могут быть модели, устойчиво применение.

Демократизация Data Science

– Мы в этом году планируем широко применять инструменты для “Citizen’s Data Science”, для демократизации работы с данными и аналитики. Мы считаем, что технологи и продуктологи, при условии доступности инструментов, могут сами экспериментировать с данными, у них могут рождаться новые идеи.

– Сейчас наши команды, которые создают продукт, состоят из дата-аналитиков, дата-инженеров, TADS и разработчиков, которые все это переводят в продуктив. А в будущем мы стремимся к Citizens’ Data Science, к демократизации инструментов, которая позволит менеджерам, технологам, главным инженерам без программирования, “мышкой” проводить “разведочный” анализ данных.

Это позволит им предлагать новые продуктовые идеи, либо пытаться понять, почему сбоит тот или иной технологический процесс. Сейчас появляются такие инструменты, надо только сделать их доступными вместе с данными. И дообучить людей.

– Вместе с Яндексом мы открываем программу на базе “Сириуса” в Сочи, которая называется “Когнитивный реактор”. В рамках нее будет программа для людей, которые не являются датасайентистами и не планируют ими становится, но хотят погрузиться в эту тематику.

Сейчас к этой программе подключаются РЖД и другие компании. Наша идея в том. чтобы сделать программу для специалистов в разных областях, которая даст им возможность поработать с этими инструментами, чтобы они руками пощупали, как это работает.

– В плане экономики проектов у нас довольно мягкий режим. Мы довольно широко экспериментируем с цифровыми технологиями. Мы “инвестируем” в разные мелкие проекты, исходя из венчурного подхода и двигаясь поэтапно. Есть градуированное разбиение: НИОКР, прототип, MVP, продукт.

Переход с этапа на этап предполагает проверку результатов и принятие решений по дальнейшим инвестициям. Поэтому не не делаем глубокой проработки экономики проекта на ранних этапах.

Полностью беседу с Анджеем Аршавским смотрите на канале “Перезапуск: другие инновации” https://youtu.be/jY5kADeInoA

Ассоциация Индустриальные инновации
Ассоциация Индустриальные инновации

Ассоциация “Индустриальные инновации” — общественное объединение, ставящее своей целью создание условий для развития промышленных инноваций в России, формирование цивилизованного рынка инновационных решений и технологий. К участию в Ассоциации приглашаются государственные и частные промышленные корпорации и предприятия. Членами Ассоциации являются ведущие промышленные компании: «Газпромнефть — цифровые решения», “НефтеТрансСервис”, "Северсталь" и др.

Follow Me
This error message is only visible to WordPress admins

Error: No connected account.

Please go to the Instagram Feed settings page to connect an account.