Что такое Reindexing в Pandas?
Этот вопрос проверяет, как можно изменять индексы строк и столбцов в DataFrame.
Короткий ответ
Reindexing (переиндексация) – это изменение индексов строк и/или столбцов DataFrame. Используется метод reindex(), который позволяет задавать новый порядок индексов и заполнять отсутствующие значения NaN.
Длинный ответ
В Pandas индексы строк и столбцов играют важную роль, позволяя обращаться к данным. Иногда требуется изменить их порядок, добавить или удалить элементы. Это можно сделать с помощью reindex():
import pandas as pd
df = pd.DataFrame({"A": [1, 2, 3]}, index=["a", "b", "c"])
print(df.reindex(["c", "a", "b", "d"])) # Новый индексЕсли индекс отсутствует в исходном DataFrame, Pandas добавит NaN:
A
c 3.0
a 1.0
b 2.0
d NaNТакже можно переиндексировать столбцы:
df = df.reindex(columns=["A", "B"])Чтобы избежать появления NaN, можно задать fill_value:
df.reindex(["c", "a", "b", "d"], fill_value=0)
Метод reindex() позволяет переупорядочивать строки и столбцы, добавлять недостающие индексы и заполнять их значениями. Это полезно при подготовке данных перед анализом.