Какие структуры данных поддерживает Pandas?
Этот вопрос объясняет основные структуры данных в Pandas и их применение.
Короткий ответ
В Pandas есть две основные структуры данных:
- Series – одномерный массив с индексами, похожий на список.
- DataFrame – двумерная таблица с метками строк и столбцов, аналогичная SQL-таблице или таблице в Excel.
Длинный ответ
Pandas предоставляет две ключевые структуры данных:
1. Series – это одномерная структура, аналогичная массиву NumPy, но с индексами:
import pandas as pd
data = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(data)Вывод:
a 10
b 20
c 30
dtype: int64
2. DataFrame – это двумерная структура, похожая на таблицу:
df = pd.DataFrame({'Имя': ['Анна', 'Борис'], 'Возраст': [28, 34]})
print(df)Вывод:
Имя Возраст
0 Анна 28
1 Борис 34
DataFrame позволяет хранить разнородные данные (числа, строки), в отличие от Series. В Pandas также есть Index – объект, управляющий метками строк.