Комментарий предоставлен Крисом МакСпириттом, Domino.
6 февраля 2026 г. | На протяжении десятилетий роль статистических программистов в разработке лекарственных препаратов была четко определена. Они отвечали за создание проверенных таблиц, списков и диаграмм на основе данных клинических испытаний, чаще всего с использованием систем статистического анализа (SAS), в рамках структурированных рабочих процессов для подачи документов в регулирующие органы. Эта модель работала, потому что источники данных контролировались, планы исследований были четко определены заранее, а требования регулирующих органов в основном были сосредоточены на стандартизированных результатах, получаемых в рамках установленных рабочих процессов.
Эта модель сейчас находится под давлением. По мере роста объемов данных и расширения аналитических подходов расширяется и сфера деятельности статистического программиста. То, что когда-то было преимущественно функцией, ориентированной на SAS, превращается в гибридную роль, требующую также свободного владения языками с открытым исходным кодом, такими как R (а иногда и Python), наряду с новыми инструментами искусственного интеллекта (ИИ). От статистических программистов теперь ожидается, что они будут выступать в качестве партнеров в аналитике, проверке моделей и интерпретации данных, неся большую ответственность и оказывая стратегическое влияние.
Этот сдвиг обусловлен рядом взаимосвязанных изменений в данных, технологиях и регулировании. Одним из наиболее значимых факторов является растущая сложность данных. Фармацевтические компании включают в свой анализ гораздо более разнообразные источники данных, в частности, данные из реальной клинической практики (RWE), в дополнение к данным клинических испытаний. Сегодня 82% заявок на регистрацию лекарственных препаратов в FDA включают данные из реальной клинической практики, и это число продолжает расти из года в год. Внешние наборы данных, данные за длительный период и менее структурированные источники создают новые проблемы, связанные с интеграцией, происхождением и согласованностью. Хотя эти данные позволяют получить более глубокие аналитические выводы, они также затрудняют поддержание жестких, линейных рабочих процессов.
По мере роста аналитических требований традиционные закрытые экосистемы испытывали трудности с масштабированием для работы с разнородными данными и методами. Это привело к более широкому внедрению инструментов с открытым исходным кодом, таких как R, в качестве практического решения для более сложных анализов и более быстрых циклов итераций. Открытый исходный код обеспечивает большую гибкость, расширенные аналитические возможности и более богатые визуализации, но он также вносит больше вариативности в то, как выполняются анализы.
В ответ на эту изменчивость изменились и требования регулирующих органов. По мере диверсификации методов и расширения набора инструментов регулирующие органы уделяют все больше внимания отслеживаемости, воспроизводимости и подходам к качеству, основанным на оценке рисков. От специалистов по статистическому программированию теперь ожидается демонстрация не только результатов анализа, но и того, как эти результаты были получены, проверены и контролированы на протяжении всего процесса.
Кроме того, распространение ИИ открыло новый мир возможностей, что оказывает давление на специалистов по статистическому программированию. Фармацевтические компании ожидают от них проведения большего объема анализов — быстрее, чем когда-либо прежде — при сохранении тех же стандартов качества, проверки и соответствия требованиям.
В совокупности эти факторы создают реальное напряжение. От специалистов по статистическому программированию требуется брать на себя больше ответственности, работая с большим количеством источников данных, инструментов и предъявляя более высокие требования к качеству, но зачастую без соответствующих изменений в процессах или инфраструктуре. Без надлежащей поддержки это создает трения и риски, когда организации находятся под давлением необходимости двигаться быстрее.
Меняющаяся динамика требует от специалистов по статистическому программированию новых навыков.
Хотя SAS остается основополагающим языком во многих организациях, статистическим программистам все чаще требуется знание R и, возможно, Python. Фактически, многие будущие статистические программисты заканчивают колледж, уже свободно владея R и Python (но не SAS). Открытый исходный код этих языков делает их хорошо подходящими для проведения сложных аналитических исследований, особенно по мере того, как источники данных продолжают диверсифицироваться.
Еще одна важная область развития навыков — это искусственный интеллект. Системы автоматического программирования позволяют командам быстрее создавать код, но программисты-статистики должны ответственно управлять этими инструментами. Это включает в себя проверку сгенерированного кода, определение момента его готовности к внесению в репозиторий и использование больших языковых моделей для поддержки документации. Хотя от программистов-статистиков не ожидается, что они будут инженерами по машинному обучению, им необходимо твердое понимание того, как работают модели, на каких предположениях они основаны и как следует интерпретировать их результаты.
Поскольку ИИ ускоряет создание кода, эффективные методы управления кодом приобретают еще большее значение. Использование надежных инструментов контроля версий, таких как Git, вместо полагания на общие файловые ресурсы, способствует воспроизводимости, повторному использованию результатов в разных исследованиях и повышению операционной эффективности.
Ответственность фармацевтических компаний
Фармацевтические компании играют решающую роль в обеспечении успеха статистических программистов в этой новой роли. Это начинается с создания структурированных программ обучения для повышения квалификации и переподготовки, а также с обеспечения программистов временем и ресурсами для обучения в дополнение к их повседневным обязанностям. Практика найма также должна развиваться, отдавая приоритет гибридным навыкам, а не сосредотачиваясь исключительно на опыте работы с одним инструментом.
Не менее важно и то, что этот новый способ работы требует соответствующей технологической базы. Многие организации осознают необходимость в современной среде статистических вычислений (ССП), которая снижает трение и риски по мере того, как инструменты с открытым исходным кодом и ИИ все глубже интегрируются в аналитические рабочие процессы.
Современная система SCE: важнейшая основа
Современные системы статистического программирования (SCE) объединяют людей, процессы и технологии для поддержки меняющейся роли статистического программиста. В основе современной SCE лежит регулируемый доступ и воспроизводимое выполнение. Она поддерживает версионированный код и данные, а также готовые к аудиту рабочие процессы в SAS, R, Python и инструментах искусственного интеллекта.
Современные системы статистического анализа кода (SCE) обеспечивают контролируемую, но гибкую среду, позволяя сотрудничать и одновременно соблюдать требования законодательства. Поскольку специалисты по статистическому программированию все чаще используют инструменты с открытым исходным кодом и на основе искусственного интеллекта, системы SCE обеспечивают отслеживаемость и возможность аудита, необходимые для выполнения нормативных требований.
Роль статистического программиста будет продолжать развиваться по мере роста сложности данных и совершенствования новых технологий. Фармацевтические компании сейчас находятся на переломном этапе. Те, кто инвестирует в необходимые навыки, процессы и среду, смогут быстрее и качественнее подавать заявки, обладая большей уверенностью. Те, кто этого не сделает, рискуют отстать в масштабируемости, готовности к проверкам и долгосрочной устойчивости.
Кристофер МакСпиритт — вице-президент по стратегии в области медико-биологических наук в Domino Data Lab. Он занимается изучением потребностей клиентов и сотрудничает с командами управления продуктами и маркетинга для разработки стратегий выхода на рынок в секторе медико-биологических наук. Кристофер начал свою карьеру в медико-биологической отрасли, присоединившись к небольшому стартапу в сфере электронных клинических исследований в 2005 году. С тех пор он имел возможность работать как в консалтинговых фирмах, так и в ведущих компаниях-разработчиках программного обеспечения в качестве менеджера проектов, бизнес-аналитика, консультанта, менеджера по продуктам и стратега. С ним можно связаться по адресу christopher.mcspiritt@dominodatalab.com.
Источник: www.bio-itworld.com




















