Вопросы React Frontend Developer
Как установить индекс в Pandas DataFrame?
Рейтинг:
1
Сложность:
4
Метод set_index() позволяет сделать столбец, Series или список индексом DataFrame. Он также поддерживает множественные индексы.
Что такое Reindexing в Pandas?
Рейтинг:
2
Сложность:
4
Reindexing (переиндексация) – это изменение индексов строк и/или столбцов DataFrame. Используется метод reindex(), который позволяет задавать новый порядок индексов и заполнять отсутствующие значения NaN.
Какие существуют способы создания DataFrame в Pandas?
Рейтинг:
2
Сложность:
5
В Pandas DataFrame можно создать несколькими способами:
- Пустой DataFrame – pd.DataFrame().
- Из списка – pd.DataFrame(list).
- Из списка списков – pd.DataFrame(list_of_lists).
- Из словаря списков – pd.DataFrame(dict_of_lists).
- Из списка словарей – pd.DataFrame(list_of_dicts).
- Из Series – pd.DataFrame(pd.Series()).
- Из CSV или Excel – pd.read_csv(), pd.read_excel().
Что такое DataFrame в Pandas?
Рейтинг:
2
Сложность:
4
DataFrame – это основная структура данных в Pandas, которая представляет собой таблицу с именованными колонками и индексированными строками. Он позволяет загружать, изменять и анализировать данные, а также выполнять операции фильтрации, группировки и агрегации.
Создать DataFrame можно с помощью pd.DataFrame(data), где data может быть списком, словарем, массивом NumPy, CSV-файлом и т. д.
Как создать копию Series в Pandas?
Рейтинг:
2
Сложность:
3
В Pandas можно создать копию Series двумя способами:
- Поверхностное копирование (shallow copy) – копирует только ссылки на данные, поэтому изменения в копии отразятся на оригинале. Используется ser.copy(deep=False).
- Глубокое копирование (deep copy) – создает полную независимую копию, изменения не влияют на оригинал. Используется ser.copy(deep=True).
По умолчанию copy() создает глубокую копию (deep=True).
Какие существуют способы создания Series в Pandas?
Рейтинг:
2
Сложность:
2
В Pandas Series можно создать разными способами:
- Пустая серия (pd.Series()) создаёт пустой объект.
- Из массива NumPy (pd.Series(np.array([...]))) позволяет использовать массив NumPy.
- С собственным индексом (pd.Series([...], index=[...])) задаёт кастомные индексы.
- Из списка (pd.Series([...])) использует обычный список Python.
- Из словаря (pd.Series({ключ: значение})) создаёт серию с индексами-ключами.
- Из скалярного значения (pd.Series(значение, index=[...])) создаёт серию с повторяющимся значением.
- С помощью функций NumPy (pd.Series(np.linspace(...))) генерирует данные с NumPy.
- Через range() или list comprehension (pd.Series(range(...))) создаёт последовательность.
Что такое Series в Pandas?
Рейтинг:
2
Сложность:
5
Series – это одномерный массив с метками (индексами), хранящий данные одного типа. Он похож на список, но поддерживает индексацию и быстрые операции. Создать Series можно из списка, словаря или массива NumPy.
Какие ключевые возможности есть в Pandas?
Рейтинг:
2
Сложность:
6
Pandas предоставляет мощные инструменты для обработки данных:
- Чтение и запись данных в CSV, Excel, SQL и другие форматы.
- Удаление пропущенных значений и фильтрация данных.
- Объединение, слияние и группировка данных.
- Манипуляции со столбцами и строками.
- Высокая производительность благодаря NumPy.
Какие структуры данных поддерживает Pandas?
Рейтинг:
3
Сложность:
3
В Pandas есть две основные структуры данных:
- Series – одномерный массив с индексами, похожий на список.
- DataFrame – двумерная таблица с метками строк и столбцов, аналогичная SQL-таблице или таблице в Excel.
Что такое Pandas?
Рейтинг:
3
Сложность:
4
Pandas — это библиотека для обработки и анализа данных в Python. Она построена на основе NumPy и предоставляет удобные структуры данных, такие как Series (одномерные массивы) и DataFrame (таблицы). С ее помощью можно загружать, обрабатывать, фильтровать и анализировать большие наборы данных. Pandas поддерживает работу с пропущенными значениями, слияние таблиц и группировку данных. Эта библиотека широко используется в науке о данных и машинном обучении.