Технологический фон с цифровыми словами, неоновая графика, инновации, защищенные данные.

Правило, которое все упускают из виду: как перестать путать loc и iloc в Pandas

Фев 5, 2026 0

Простая ментальная модель, позволяющая запомнить, когда каждый из методов работает (с примерами, которые в конечном итоге помогут разобраться).

Делиться

Если вы когда-либо работали с pandas, вы, вероятно, сталкивались с этой классической проблемой: следует ли использовать loc или iloc для извлечения данных? На первый взгляд, они выглядят почти одинаково. Оба используются для нарезки, фильтрации и извлечения строк или столбцов из DataFrame — однако одно крошечное различие в их работе может полностью изменить ваши результаты (или вызвать ошибку, которая заставит вас чесать затылок).

Я помню, как впервые попытался выбрать строку с помощью df.loc[0] и удивился, почему это не сработало. Причина? Pandas не всегда «думает» в терминах позиций — иногда он использует метки. Вот тут и возникает различие между loc и iloc.

В этой статье я расскажу о простом мини-проекте, использующем небольшой набор данных об успеваемости студентов. К концу вы не только поймете разницу между loc и iloc, но и будете точно знать, когда использовать каждый из них в собственном анализе данных.

Представляем набор данных

Набор данных получен из ChatGPT. Он содержит основные записи о результатах экзаменов студентов. Вот снимок нашего набора данных.

import pandas as pd df = pd.read_csv('student_scores.csv') df

Выход:

Я попробую выполнить некоторые задачи по извлечению данных с помощью loc и iloc, например:

Извлечение одной строки из DataFrame
Извлечение одного значения
Извлечение нескольких строк
Нарезка диапазона строк
Извлечение определенных столбцов и
Булева фильтрация

Для начала позвольте мне кратко объяснить, что такое loc и iloc в Pandas.

Что такое loc и iloc?

Loc и iloc — это методы извлечения данных в Pandas. Они очень полезны для выбора данных из записей.

Loc использует метки для извлечения записей из DataFrame, поэтому мне проще его использовать. Iloc, однако, полезен для более точного извлечения записей, поскольку Iloc выбирает данные на основе целочисленных позиций строк и столбцов, аналогично тому, как вы индексируете список или массив в Python.

Но если вы, как и я, задаетесь вопросом: если loc явно проще из-за меток строк, зачем вообще использовать iloc? Зачем пытаться вычислять индексы строк, особенно если вы работаете с большими наборами данных? Вот несколько причин.

Зачастую наборы данных не содержат четких индексов строк (например, 101, 102, …). Вместо этого используется простой индекс (0, 1, 2, …), или же при извлечении записей может быть допущена ошибка в написании меток строк. В этом случае лучше использовать iloc. Мы также рассмотрим этот вопрос позже в этой статье.
В некоторых сценариях, например, при предварительной обработке данных в машинном обучении, метки не имеют особого значения. Вас интересует только моментальный снимок данных. Например, первые или последние три записи. В таких случаях iloc очень полезен. iloc делает код короче и менее уязвимым, особенно если метки меняются, что может привести к сбою модели машинного обучения.
Во многих наборах данных встречаются повторяющиеся метки строк. В этом случае iloc всегда работает, поскольку позиции уникальны.
В итоге, используйте `loc`, когда ваш набор данных содержит четкие и содержательные метки, и вы хотите, чтобы ваш код был читаемым.
Используйте iloc, когда требуется управление на основе положения или когда метки отсутствуют или расположены неаккуратно.

Теперь, когда я внес ясность, вот базовый синтаксис для команд loc и iloc:

df.loc[rows, columns] df.iloc[rows, columns]

Синтаксис практически тот же. Используя этот синтаксис, давайте попробуем получить несколько записей с помощью loc и iloc.

Извлечение одной строки из DataFrame

Для наглядной демонстрации давайте сначала изменим индекс столбца и назначим его student_id. В настоящее время pandas выполняет автоматическую индексацию:

# Установка student_id в качестве индекса df.set_index('student_id', inplace=True)

Вот результат:

Выглядит лучше. Теперь давайте попробуем получить все записи Боба. Вот как это можно сделать с помощью `loc`:

df.loc[102]

Здесь я всего лишь указываю метку строки. Это должно извлечь все записи о Бобе.

Вот результат:

Имя Боб, математика 58, английский 64, наука 70. Имя: 102, тип данных: объект.

Самое замечательное в этом то, что я могу детализировать информацию, создавая своего рода иерархию. Например, давайте попробуем получить конкретную информацию о Бобе, такую как его оценка по математике.

df.loc[102, 'math']

Результатом будет 58.

Теперь давайте попробуем использовать iloc. Если вы знакомы со списками и массивами, индексация всегда начинается с 0. Поэтому, если я хочу получить первую запись в DataFrame, мне нужно указать индекс 0. В данном случае я пытаюсь получить Боба, который является второй строкой в нашем DataFrame — поэтому в этом случае индекс будет равен 1.

df.iloc[1]

В результате мы получим тот же результат, что и выше:

Имя Боб, математика 58, английский 64, наука 70. Имя: 102, тип данных: объект.

А если я попытаюсь получить оценку по математике Боба, наш индекс также будет равен 1, учитывая, что математика находится во второй строке.

df.iloc[1, 1]

Результатом будет 58.

Ладно, на этом я могу закончить статью, но loc и iloc предлагают ещё несколько впечатляющих функций. Давайте быстро рассмотрим некоторые из них.

Извлечение нескольких строк (конкретных студентов)

Pandas позволяет получать несколько строк данных с помощью методов `loc` и `iloc`. Я проведу демонстрацию на примере получения записей нескольких студентов. В этом случае вместо хранения одного значения в методе `loc`/`iloc` мы будем хранить список. Вот как это можно сделать с помощью `loc`:

# Записи Алисы, Чарли и Эдварда df.loc[[101, 103, 105]]

Вот результат:

Вот как это сделать с помощью iloc:

df.iloc[[0, 2, 4]]

Результат будет тот же:

Надеюсь, у вас всё получается.

Выделить диапазон строк

Ещё одна полезная функция Python Pandas — возможность нарезать диапазон строк. Здесь вы можете указать начальную и конечную позицию. Вот синтаксис для нарезки с помощью loc/iloc:

df.loc[start_label:end_label]

Однако в функции `loc` в выходные данные будет включена конечная метка — это совершенно отличается от стандартного среза в Python.

Синтаксис для iloc тот же, за исключением того, что конечная метка будет исключена из выходных данных (точно так же, как и при стандартном срезе в Python).

Давайте рассмотрим пример:

Я пытаюсь получить доступ к записям нескольких студентов. Давайте попробуем сделать это с помощью функции `loc`:

df.loc[101:103]

Выход:

Как вы видите выше, конечная метка включена в результат. Теперь давайте попробуем сделать это с помощью iloc. Если вы помните, индекс первой строки будет равен 0, что означает, что индекс третьей строки будет равен 2.

df.iloc[0:3]

Выход:

Здесь исключается третья строка. Но если вы, как и я, часто задаетесь вопросами, то, возможно, задаетесь вопросом: зачем вообще исключать последнюю строку? В каких ситуациях это может быть полезно? А что, если я скажу, что это на самом деле упростит вам жизнь? Давайте быстро это проясним.

Предположим, вы хотите обрабатывать ваш DataFrame порциями по 100 строк каждая.

Если бы нарезка была включающей, вам пришлось бы прибегнуть к сложным математическим вычислениям, чтобы избежать повторения последней строки.

Но поскольку нарезка происходит только в конце, это можно сделать довольно легко, вот так.

df.iloc[0:100] # первые 100 строк df.iloc[100:200] # следующие 100 строк df.iloc[200:300] # следующие 100 строк

Здесь не будет наложений, и размеры фрагментов будут постоянными. Еще одна причина – это сходство с работой диапазонов в Pandas. Обычно, когда вы хотите получить диапазон строк, он также начинается с 0 и не включает последнюю строку. Наличие той же логики в нарезке iLoc очень полезно, особенно при работе с веб-скрейпингом или переборе диапазона строк.

Извлечение данных из определенных столбцов (тем).

Также я хотел бы познакомить вас со знаком двоеточия :. Он позволяет получить все записи в вашем DataFrame с помощью loc. Аналогично символу * в SQL. Преимущество этого метода в том, что вы можете фильтровать и извлекать подмножество столбцов.

Обычно я начинаю именно с этого. Я использую это, чтобы получить общее представление о конкретном наборе данных. Оттуда я могу начать фильтровать и детализировать данные. Позвольте мне показать, что я имею в виду.

Давайте получим все записи:

df.loc[:]

Выход:

Отсюда я могу извлечь определенные столбцы следующим образом. С помощью loc:

df.loc[:, ['math', 'science']]

Выход:

С помощью iloc:

df.iloc[:, [2, 4]]

Результат будет тем же.

Мне очень нравится эта функция, потому что она очень гибкая. Допустим, я хочу получить оценки Алисы и Боба по математике и естественным наукам. Это будет выглядеть примерно так. Я могу просто указать диапазон записей и столбцов, которые мне нужны.

С местоположением:

df.loc[101:103, ['name', 'math', 'science']]

Выход:

С помощью iloc:

df.iloc[0:3, [0, 1, 3]]

Результат будет тот же.

Булевы фильтры (Кто набрал более 80 баллов по математике?)

Последняя функция, которой я хочу с вами поделиться, — это булевы фильтры. Это позволяет более гибко извлекать данные. Допустим, я хочу получить записи о студентах, набравших более 80 баллов по математике. Обычно в SQL приходится использовать условия WHERE и HAVING. Python значительно упрощает этот процесс.

# Количество студентов, изучающих математику на уровне > 80. df.loc[df['math'] > 80]

Выход:

Также можно фильтровать по нескольким условиям, используя операторы AND (&), OR (|) и NOT (~). Например:

# Математика > 70 и Естественные науки > 80 df.loc[(df['math'] > 70) & (df['science'] > 80)]

Выход:
P.S. Я написал статью о фильтрации с помощью Pandas. Вы можете прочитать её здесь.

Обычно эта функция используется с loc. С iloc это может быть немного сложнее, поскольку он не поддерживает логические условия. Чтобы сделать это с iloc, вам придется преобразовать логическую фильтрацию в список, например, так:

# Студенты, имеющие математические способности > 80. df.iloc[list(df['math'] > 80)]

Чтобы избежать головной боли, просто сделайте прическу с локоть.

Заключение

При работе с набором данных вы, вероятно, будете часто использовать методы loc и iloc. Поэтому крайне важно понимать, как они работают, и различать их. Мне нравится, насколько легко и гибко извлекать записи с помощью этих методов. Если у вас возникнут вопросы, просто помните, что loc относится к меткам, а iloc — к позициям.

Надеюсь, эта статья оказалась для вас полезной. Попробуйте запустить эти примеры на собственном наборе данных, чтобы увидеть разницу в действии.

Я пишу эти статьи, чтобы проверить и укрепить собственное понимание технических концепций, а также поделиться своими знаниями с другими, кто, возможно, идёт по тому же пути. Не стесняйтесь делиться ими с другими. Давайте учиться и развиваться вместе. Всего доброго!

Не стесняйтесь поздороваться на любой из этих платформ.

Середина

Твиттер

YouTube

Источник: towardsdatascience.com

Метки:

Медитация у озера с ярким мистическим порталом в горах на закате.

ПРЕДЫДУЩАЯ ЗАПИСЬ

05.02.2026

Психоделический препарат 5-MeO-DMT вызывает состояние мозга, схожее с состоянием во время медитации.

СЛЕДУЮЩАЯ ЗАПИСЬ

05.02.2026

Поскольку зимы теплые, спортсменам приходится справляться с более твердым снегом и коварным льдом

Горный пейзаж с заснеженными склонами и озером, вид сверху в ясный день.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Взаимодействие человека и машины погружается под воду.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Лента новостей~

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Вкратце Опубликовано: Изображение предоставлено: Thos Robinson/Getty Images для The New York Times (откроется в новом окне) Джули Борт Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Как почистить виниловые пластинки (2026): пылесос, ультразвук, чистящий раствор, щетка.

Эти щелчки и треск недопустимы. Приведите свою музыку в порядок с помощью этого удобного руководства. Источник: www.wired.com

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

ЧИТАТЬ

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Правило, которое все упускают из виду: как перестать путать loc и iloc в Pandas

Представляем набор данных

Что такое loc и iloc?

Извлечение одной строки из DataFrame

Извлечение нескольких строк (конкретных студентов)

Выделить диапазон строк

Извлечение данных из определенных столбцов (тем).

Булевы фильтры (Кто набрал более 80 баллов по математике?)

Заключение

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ Отменить ответ

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Присоединяйтесь
к нам в