Что такое DataFrame в Pandas?
Этот вопрос проверяет понимание того, что такое DataFrame в Pandas и как он используется для работы с табличными данными.
Короткий ответ
DataFrame – это основная структура данных в Pandas, которая представляет собой таблицу с именованными колонками и индексированными строками. Он позволяет загружать, изменять и анализировать данные, а также выполнять операции фильтрации, группировки и агрегации.
Создать DataFrame можно с помощью pd.DataFrame(data), где data может быть списком, словарем, массивом NumPy, CSV-файлом и т. д.
Длинный ответ
DataFrame в Pandas – это двухмерная структура данных, напоминающая таблицу в базе данных или Excel. Она состоит из:
- Строк (rows) – пронумерованы индексами.
- Колонок (columns) – имеют названия.
- Данных (data) – могут быть разного типа (числа, строки, даты и т. д.).
Основные способы создания DataFrame:
Из словаря списков
import pandas as pd
data = {"Имя": ["Алиса", "Боб", "Чарли"], "Возраст": [25, 30, 35]}
df = pd.DataFrame(data)
print(df) Из списка списков
data = [[1, "А"], [2, "Б"], [3, "В"]]
df = pd.DataFrame(data, columns=["ID", "Буква"])
print(df) Из CSV-файла
df = pd.read_csv("data.csv") DataFrame – мощный инструмент для работы с табличными данными. Он поддерживает загрузку данных из множества источников и позволяет легко анализировать и обрабатывать их.