Архив рубрики ~Обо всем~

Какой именно проект в области машинного обучения я бы создал, чтобы устроиться на работу в 2026 году?

Какой именно проект в области машинного обучения я бы создал, чтобы устроиться на работу в 2026 году?

Следуйте этой схеме, чтобы создать проект, который произведет впечатление на менеджеров по найму.

Делиться

Изображение предоставлено автором.

Меня постоянно спрашивают:

«Какой проект мне следует реализовать?»

Вопрос задан с благими намерениями, но в корне ошибочен.

Я просмотрел буквально более 100 заявок и портфолио, и лишь в нескольких случаях проект кого-либо настолько меня впечатлил, что я довел дело до этапа собеседования.

В этой статье я расскажу вам о разработанной мной методике, которой я следовал, чтобы найти идеальный проект в области машинного обучения, который поможет вам получить работу.

Давайте начнём!

Почему большинство проектов машинного обучения терпят неудачу

Позвольте мне сказать вам то, что думают все менеджеры по найму в каждой компании, где я работал.

Когда мы видим модель прогнозирования цен на жилье или классификатор выживаемости на «Титанике», мы не думаем о «надежных фундаментальных показателях». Мы думаем о «дальнейшем развитии».

Я нисколько не шучу.

Эти проекты выполнялись так много раз, что они ничего не говорят мне о человеке, который их создал.

Это лишь говорит мне о том, что они могут следовать стандартному руководству и воспроизводить результаты.

Проект, благодаря которому вас возьмут на работу, состоит из четырех ключевых элементов:

  • Это личное дело — вас действительно волнует, что он предсказывает.
  • Это необычно — я не видел этого сотни раз до этого.
  • Это актуально — это связано с той работой, которой вы хотите заниматься.
  • Это прямая трансляция — люди могут увидеть это в действии.

Если вы правильно выполните все четыре условия, ваш проект заставит менеджера по найму запомнить вас, и это основано на моем личном опыте найма.

Проблема в том, что никто не сможет просто так поручить вам такой проект. Он должен исходить от вас самих.

Поэтому вместо того, чтобы сразу предлагать вам идею, я дам вам структуру, которой вы сможете следовать при разработке подобного проекта.

Я также преобразовал эту структуру в 7-страничный загружаемый PDF-файл, который вы можете посмотреть в описании ниже, чтобы поработать над ним и найти подходящий проект, который поможет вам устроиться на работу.

Структура построения проекта
Украдите ТОЧНО ту же самую структуру идеи проекта, которую я использую, чтобы получать предложения с зарплатой более 100 000 долларов, и присоединитесь к более чем 8000 соискателей работы в сфере обработки данных уже сегодня. projects.egorhowell.com

Пример проекта

Прежде чем я углублюсь в описание структуры проекта, позвольте мне привести пример проекта, выполненного кандидатом, которого мы наняли.

В одной из моих предыдущих компаний мы нанимали младшего специалиста по анализу данных для работы над задачами оптимизации и исследования операций.

Нанятый нами кандидат выделялся по одной главной причине: у него был очень актуальный и глубоко личный проект, который идеально соответствовал требованиям вакансии.

Они были увлечены фэнтези-футболом НФЛ и хотели улучшить способ формирования своих еженедельных командных прогнозов.

Поэтому они разработали собственный механизм оптимизации, чтобы более эффективно распределять игроков в рамках ограничений программы.

Дело было не только в самом двигателе; они читали научные статьи о стратегиях оптимизации и изучали, как другие подходят к решению той же проблемы.

Этот проект отвечает всем четырем пунктам, упомянутым нами ранее:

  • Это личное дело – их интересовала именно эта личная проблема.
  • Это было необычно – уникально, и мы ничего подобного не видели ни до, ни после.
  • Это уместно – это продемонстрировало их увлеченность и интерес к оптимизации и исследованию операций, а именно на таких сотрудников мы и нанимали.
  • Это было опубликовано в режиме реального времени – информация имела непосредственное отношение к вакансии, на которую они претендовали.

Теперь позвольте мне подробно рассказать о структуре, которой вы можете следовать для создания именно такого проекта.

Начните со своих интересов.

Когда люди ищут проект для разработки, они открывают список наборов данных для машинного обучения, скорее всего, на Kaggle, и пытаются найти что-нибудь интересное.

Это неправильно.

Начните с себя и своих интересов.

Более конкретно, запишите пять вещей, которые вам действительно важны вне работы и вне сферы данных и машинного обучения.

Сосредоточьтесь на своих хобби, увлечениях и других вещах, о которых вы с удовольствием могли бы говорить целый час без каких-либо проблем.

Когда я это сделал, мой список выглядел примерно так:

  • Инвестирование
  • Хоккей
  • Тренажерный зал/фитнес-центр
  • Фильмы
  • YouTube

Почему нам нужно выбирать то, что нас интересует?

Потому что проект, который вам небезразличен и которым вы интересуетесь, вы обязательно завершите.

Не могу не подчеркнуть, насколько проще заниматься проектом, который действительно вас мотивирует, чем тем, который вы «считаете», что должны делать.

Определив пять своих интересов, пожалуйста, напишите по пять вопросов для каждого из них, на которые вы действительно хотите получить ответы.

Например, «Какие игроки в фэнтези-футбол недооценены на этой неделе?» — это вопрос, тогда как «Футбольная статистика» — нет.

Не стоит слишком много об этом думать, просто запишите все.

Теперь у вас потенциально может быть 25 идей для проектов, которые, скорее всего, будут совершенно уникальными или, по крайней мере, мало кто видел.

Отфильтруйте ваши лучшие предложения

Теперь нам нужно сократить этот список до наших лучших вариантов.

Первый шаг — исключить вопросы или идеи, которые явно не относятся к задачам машинного обучения. Например, «Почему мне нравятся фильмы?» — отличный вопрос, но он не является задачей машинного обучения.

На самом высоком и примитивном уровне машинное обучение можно разделить на 5 ключевых областей:

  • Прогнозирование числа — регрессия.
  • Прогнозирование категории — классификация.
  • Прогнозирование во времени — временные ряды.
  • Рекомендации — рекомендательные системы.
  • Группировка вещей — кластеризация.

Просмотрите свои 25 или менее вопросов и найдите те, которые соответствуют одной из этих 5 областей, а те, которые не соответствуют.

В результате у нас должно остаться около 10-15 жизнеспособных идей, которые мы можем решить с помощью машинного обучения.

Теперь вам нужно выбрать одну, и для этого необходимо оценить каждую из этих идей по следующим критериям:

  • Насколько это личный вопрос?
  • Насколько это необычно?
  • Насколько это актуально для тех должностей, на которые я претендую?
  • Насколько сложно получить эти данные?
  • Насколько сложно построить?

Оцените каждый вариант по 5-балльной шкале, суммируйте баллы, и тот, у которого наивысший балл, вы и построите.

Проверить проект

Прежде чем вы потратите несколько недель на создание этого проекта, я хочу, чтобы вы провели три быстрые проверки.

Во-первых, откуда именно берутся ваши данные? Назовите реальный источник — API, общедоступный набор данных или любой другой уникальный источник. Если вы не можете назвать ни одного, поиск данных — ваша первая задача.

Во -вторых, сможете ли вы создать черновой вариант примерно за два месяца, уделяя этому час-два в день? Если проект окажется больше, уменьшите его. Небольшой проект, который вы действительно завершите, всегда лучше большого, который вы бросите.

Третий момент — насколько это распространено на самом деле? Ничто никогда не бывает по-настоящему оригинальным, но если вы уже несколько раз видели подобный проект, то, возможно, стоит пересмотреть свое решение и выбрать второй вариант.

Пройдите все три проверки, и всё готово.

Отлично! У вас есть свой проект, который менеджер по найму не видел сотни раз, и который вы действительно можете завершить.

Оживите это

Как и большинство людей, вы, вероятно, будете проводить первоначальные исследования и прототипирование этого проекта в блокноте Jupyter Notebook.

Однако сегодня компаниям нужны люди, способные внедрять их решения для достижения реальных бизнес-результатов.

Даже если ваша модель — лучшее изобретение со времен трансформатора, она бесполезна, если застряла внутри ноутбука.

Развертывание модели на самом деле не так сложно, как кажется. Я помог нескольким своим клиентам создать свою первую комплексную модель машинного обучения, не имея никакого предыдущего опыта, используя следующий технологический стек и процесс:

  • Создайте прототип решения в блокноте Jupyter Notebook.
  • Разбейте этот Jupyter Notebook на отдельные файлы Python, соответствующие стандартам производственного кода, и реализуйте такие функции, как типизация, форматирование и документация.
  • Добавьте свои файлы Python в репозиторий Git и создайте подробный файл README, который объяснит суть проекта.
  • Добавьте все ключевые инструменты и концепции разработки программного обеспечения, включая модульные тесты, систему управления зависимостями Poetry, Makefiles и PyEnv.
  • Создайте панель мониторинга Streamlit для демонстрации результатов и разверните ее в облаке сообщества Streamlit.
  • Настройте свой репозиторий для ежедневного запуска с помощью GitHub Actions.

Биш. Баш. Бош.

Вы только что развернули свою модель от начала до конца, используя стандартные отраслевые инструменты, которые я, как инженер по машинному обучению в ведущих технологических компаниях, использую уже много лет.

Я понимаю, что для новичка это может показаться совершенно непосильной задачей, особенно если рядом нет никого, кто мог бы помочь, поэтому я создал шаблон репозитория со всем необходимым кодом для настройки.

GitHub – egorhowell/ML-Project-Starter
Внесите свой вклад в разработку проекта egorhowell/ML-Project-Starter, создав учетную запись на GitHub.github.com.

Ещё кое-что!

Если вы всерьез настроены получить работу, связанную с обработкой данных или машинным оборудованием, то я открыл несколько мест в своей программе обучения .

В течение 12 месяцев вы будете работать лично со мной и моей командой в рамках этой специально разработанной программы, которая поможет вам не просто подать заявку, но и получить работу вашей мечты в сфере обработки данных/машинного обучения.

Подайте заявку и запишитесь на бесплатную консультацию здесь .

Получите работу мечты в сфере обработки данных!
Получите работу мечты в сфере анализа данных — и увеличьте свою зарплату до 150 000 долларов! coaching.egorhowell.com

Свяжитесь со мной

  • YouTube
  • LinkedIn
  • Инстаграм
  • Веб-сайт

Егор Хауэлл. Все работы Егора Хауэлла.

Источник: towardsdatascience.com

Оцените материал:

Читайте также
Архив рубрики ~Лента новостей~ Следующее поколение процессоров AMD Ryzen может лишиться iGPU в пользу NPU Архив рубрики ~Лента новостей~ Компания Apple планирует изменить функцию конфиденциальности «Скрыть мою электронную почту», что может снизить её эффективность. Архив рубрики ~Коротко из Telegram~ 🚨 На конференции AgentCon спикеры призвали разработчиков перестать использовать ИИ… Архив рубрики ~Коротко из Telegram~ Скидываем рутину на ИИ как профи — появился сайт с… Архив рубрики ~Лента новостей~ MCP vs CLI + Skill: что выгоднее для ИИ‑агента при работе с внутренними API Архив рубрики ~Лента новостей~ Почему крошечный VibeThinker-3B от Weibo снова стал причиной споров в мире ИИ о результатах тестов? Архив рубрики ~Лента новостей~ ИИ помогает создавать приложения за 1 день. Проблема в том, что они никому не нужны Архив рубрики ~Лента новостей~ Сможет ли искусственный интеллект подсказать, где вы оставили ключи? Архив рубрики ~Лента новостей~ Производитель микросхем Nvidia планирует привлечь более 25 миллиардов долларов в рамках первой с 2021 года сделки по выпуску облигаций. Архив рубрики ~Лента новостей~ Пройдите локальную магистерскую программу с помощью OpenClaw на вашем Mac Mini. Архив рубрики ~Лента новостей~ Согласно данным о продажах, недавний конфликт Anthropic с администрацией Трампа может даже пойти ей на пользу. Новости робототехники Репортаж с ICRA 2026 из Вены Архив рубрики ~Лента новостей~ Передовая британская лаборатория Nerve Lab использует искусственный интеллект для анализа влияния времени, проводимого детьми перед экраном. Архив рубрики ~Лента новостей~ GLM-5.2 от Z.ai, использующая открытые веса, превосходит GPT-5.5 в нескольких долгосрочных тестах программирования при стоимости в 6 раз меньшей. Архив рубрики ~Лента новостей~ Следующее поколение процессоров AMD Ryzen может лишиться iGPU в пользу NPU Архив рубрики ~Лента новостей~ Компания Apple планирует изменить функцию конфиденциальности «Скрыть мою электронную почту», что может снизить её эффективность. Архив рубрики ~Коротко из Telegram~ 🚨 На конференции AgentCon спикеры призвали разработчиков перестать использовать ИИ… Архив рубрики ~Коротко из Telegram~ Скидываем рутину на ИИ как профи — появился сайт с… Архив рубрики ~Лента новостей~ MCP vs CLI + Skill: что выгоднее для ИИ‑агента при работе с внутренними API Архив рубрики ~Лента новостей~ Почему крошечный VibeThinker-3B от Weibo снова стал причиной споров в мире ИИ о результатах тестов? Архив рубрики ~Лента новостей~ ИИ помогает создавать приложения за 1 день. Проблема в том, что они никому не нужны Архив рубрики ~Лента новостей~ Сможет ли искусственный интеллект подсказать, где вы оставили ключи? Архив рубрики ~Лента новостей~ Производитель микросхем Nvidia планирует привлечь более 25 миллиардов долларов в рамках первой с 2021 года сделки по выпуску облигаций. Архив рубрики ~Лента новостей~ Пройдите локальную магистерскую программу с помощью OpenClaw на вашем Mac Mini. Архив рубрики ~Лента новостей~ Согласно данным о продажах, недавний конфликт Anthropic с администрацией Трампа может даже пойти ей на пользу. Новости робототехники Репортаж с ICRA 2026 из Вены Архив рубрики ~Лента новостей~ Передовая британская лаборатория Nerve Lab использует искусственный интеллект для анализа влияния времени, проводимого детьми перед экраном. Архив рубрики ~Лента новостей~ GLM-5.2 от Z.ai, использующая открытые веса, превосходит GPT-5.5 в нескольких долгосрочных тестах программирования при стоимости в 6 раз меньшей.

Оставить комментарий