Сара Нобрега рассказывает о переходе от науки о данных к разработке ИИ-приложений, об использовании магистерских программ в качестве моста к DevOps и об одном инженерном навыке, необходимом начинающим специалистам по данным, чтобы оставаться конкурентоспособными.
Делиться

В серии «В центре внимания — автор» редакторы TDS беседуют с членами нашего сообщества об их карьерном пути в области науки о данных и искусственного интеллекта, их писательской деятельности и источниках вдохновения. Сегодня мы рады поделиться нашей беседой с Сарой Нобрега.
Сара Нобрега — инженер в области искусственного интеллекта с образованием в области физики и астрофизики. Она пишет о магистерских программах, временных рядах, смене карьеры и практических рабочих процессах в сфере ИИ.
У вас степень магистра физики и астрофизики. Как ваше образование влияет на вашу работу в области анализа данных и разработки искусственного интеллекта?
Физика научила меня двум вещам, на которые я постоянно опираюсь: как сохранять спокойствие, когда я не знаю, что происходит, и как разбить пугающую проблему на более мелкие части, пока она перестанет быть страшной. Кроме того… физика действительно смиряет. Быстро понимаешь, что быть «умным» не имеет значения, если ты не можешь объяснить свои рассуждения или воспроизвести результаты. Этот образ мышления, пожалуй, наиболее полезен для меня в области анализа данных и инженерии.
Вы недавно подробно рассказали о своем переходе от специалиста по анализу данных к инженеру по искусственному интеллекту. В чем заключается самое большое различие в вашем мышлении в GLS между этими двумя ролями в повседневной работе?
Для меня самым большим изменением стал переход от вопроса «Хороша ли эта модель?» к вопросу «Сможет ли эта система выдержать испытания в реальных условиях?». Работа инженера по искусственному интеллекту заключается не столько в поиске идеального ответа, сколько в создании чего-то надежного. И, честно говоря, поначалу это изменение было неприятным… но благодаря ему моя работа стала казаться гораздо более полезной.
Вы отметили , что в то время как специалист по анализу данных может потратить недели на настройку модели, у инженера по искусственному интеллекту может быть всего три дня на ее развертывание. Как вы находите баланс между оптимизацией и скоростью?
Если у нас есть три дня, я не буду гнаться за мелкими улучшениями. Я буду стремиться к уверенности и надежности. Поэтому я сосредоточусь на надежной базовой модели, которая уже работает, и на простом способе отслеживания того, что произойдет после запуска.
Мне также нравится внедрять продукт небольшими шагами. Вместо того чтобы думать: «сразу развернуть конечный продукт», я думаю: «развернуть самую маленькую версию, которая создает ценность, не вызывая хаоса».
Как, по-вашему, можно использовать программы магистратуры в области прикладных наук (LLM) для преодоления разрыва между специалистами по анализу данных и специалистами DevOps? Можете ли вы привести пример, где это хорошо сработало для вас?
Специалисты по анализу данных говорят об экспериментах и результатах, а специалисты по DevOps — о надежности и воспроизводимости. Я думаю, что степень магистра права может помочь в практическом плане в качестве переводчика. Например, в создании тестов и документации, чтобы то, что работает на моей машине, стало «работать в продакшене».
Простой пример из моей собственной работы: когда я создаю что-то вроде API-интерфейса или конвейера обработки данных, я привлекаю магистра делового администрирования (LLM) для помощи в составлении скучных, но важных частей, таких как тестовые примеры, граничные случаи и понятные сообщения об ошибках. Это значительно ускоряет процесс и поддерживает мотивацию. Я думаю, главное — относиться к LLM как к младшему специалисту, который работает быстро, помогает и иногда ошибается, поэтому проверка всего важна.
Вы привели данные исследования, свидетельствующие о значительном росте числа вакансий в сфере ИИ к 2027 году. Если начинающему специалисту по анализу данных необходимо освоить в этом году только один инженерный навык, какой именно следует выбрать?
Если бы мне пришлось выбрать что-то одно, я бы выбрал умение создавать и внедрять результаты своей работы воспроизводимым способом! Возьмите один проект и сделайте его таким, чтобы он работал надежно и без вашего постоянного контроля. Потому что в реальном мире лучшая модель бесполезна, если ею никто не может пользоваться. А выделяются те, кто может воплотить идею из блокнота в реальность.
В последнее время ваша работа в значительной степени сосредоточена на LLM и временных рядах. Заглядывая в 2026 год, какая из новых тем в области ИИ вызывает у вас наибольший интерес для написания следующей статьи?
Я всё больше склоняюсь к написанию статей о практических рабочих процессах в области ИИ (как перейти от идеи к чему-то надёжному). Кроме того, если я и буду писать на «актуальную» тему, я хочу, чтобы это было полезно, а не просто захватывающе. Я хочу писать о том, что работает, а что нет… Мир науки о данных и ИИ полон компромиссов и неопределённости, и это меня очень увлекает.
Меня также всё больше интересует искусственный интеллект как система: как различные её компоненты взаимодействуют друг с другом… Следите за публикациями в этом году!
Чтобы узнать больше о работе Сары и быть в курсе ее последних статей, вы можете подписаться на нее в TDS или LinkedIn.
Источник: towardsdatascience.com

























