Что такое DataFrame в Pandas?

Этот вопрос проверяет понимание того, что такое DataFrame в Pandas и как он используется для работы с табличными данными.

Короткий ответ

DataFrame – это основная структура данных в Pandas, которая представляет собой таблицу с именованными колонками и индексированными строками. Он позволяет загружать, изменять и анализировать данные, а также выполнять операции фильтрации, группировки и агрегации.

Создать DataFrame можно с помощью pd.DataFrame(data), где data может быть списком, словарем, массивом NumPy, CSV-файлом и т. д.

Длинный ответ

DataFrame в Pandas – это двухмерная структура данных, напоминающая таблицу в базе данных или Excel. Она состоит из:

- Строк (rows) – пронумерованы индексами.

- Колонок (columns) – имеют названия.

- Данных (data) – могут быть разного типа (числа, строки, даты и т. д.).

 

Основные способы создания DataFrame:

Из словаря списков

import pandas as pd  

data = {"Имя": ["Алиса", "Боб", "Чарли"], "Возраст": [25, 30, 35]}  
df = pd.DataFrame(data)  
print(df)  

Из списка списков

data = [[1, "А"], [2, "Б"], [3, "В"]]  
df = pd.DataFrame(data, columns=["ID", "Буква"])  
print(df)  

Из CSV-файла

df = pd.read_csv("data.csv")  


DataFrame – мощный инструмент для работы с табличными данными. Он поддерживает загрузку данных из множества источников и позволяет легко анализировать и обрабатывать их.

Уровень

  • Рейтинг:

    2

  • Сложность:

    4

Навыки

  • Pandas

Подпишись на Data Science в телеграм