Что такое Reindexing в Pandas?

Этот вопрос проверяет, как можно изменять индексы строк и столбцов в DataFrame.

Короткий ответ

Reindexing (переиндексация) – это изменение индексов строк и/или столбцов DataFrame. Используется метод reindex(), который позволяет задавать новый порядок индексов и заполнять отсутствующие значения NaN.

Длинный ответ

В Pandas индексы строк и столбцов играют важную роль, позволяя обращаться к данным. Иногда требуется изменить их порядок, добавить или удалить элементы. Это можно сделать с помощью reindex():

import pandas as pd

df = pd.DataFrame({"A": [1, 2, 3]}, index=["a", "b", "c"])
print(df.reindex(["c", "a", "b", "d"]))  # Новый индекс

Если индекс отсутствует в исходном DataFrame, Pandas добавит NaN:

     A
c  3.0
a  1.0
b  2.0
d  NaN

Также можно переиндексировать столбцы:

df = df.reindex(columns=["A", "B"])

Чтобы избежать появления NaN, можно задать fill_value:

df.reindex(["c", "a", "b", "d"], fill_value=0)


Метод reindex() позволяет переупорядочивать строки и столбцы, добавлять недостающие индексы и заполнять их значениями. Это полезно при подготовке данных перед анализом.

Уровень

  • Рейтинг:

    2

  • Сложность:

    4

Навыки

  • Pandas

Ключевые слова

Подпишись на Data Science в телеграм