Какие структуры данных поддерживает Pandas?

Этот вопрос объясняет основные структуры данных в Pandas и их применение.

Короткий ответ

В Pandas есть две основные структуры данных:

- Series – одномерный массив с индексами, похожий на список.

- DataFrame – двумерная таблица с метками строк и столбцов, аналогичная SQL-таблице или таблице в Excel.

Длинный ответ

Pandas предоставляет две ключевые структуры данных:

 

1. Series – это одномерная структура, аналогичная массиву NumPy, но с индексами:

import pandas as pd

data = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(data)

Вывод:

a    10
b    20
c    30
dtype: int64

 

2. DataFrame – это двумерная структура, похожая на таблицу:

df = pd.DataFrame({'Имя': ['Анна', 'Борис'], 'Возраст': [28, 34]})
print(df)

Вывод:

    Имя  Возраст
0  Анна       28
1  Борис       34

 

DataFrame позволяет хранить разнородные данные (числа, строки), в отличие от Series. В Pandas также есть Index – объект, управляющий метками строк.

Уровень

  • Рейтинг:

    3

  • Сложность:

    3

Навыки

  • Pandas

Подпишись на Data Science в телеграм