Как считать данные в DataFrame из CSV-файла?

Этот вопрос проверяет, как загружать данные из CSV-файлов в DataFrame с помощью Pandas.

Короткий ответ

Для загрузки данных из CSV-файла в Pandas используется метод read_csv(). Он принимает путь к файлу и дополнительные параметры, такие как разделитель или кодировка. Также можно использовать метод read_table(), указав delimiter для CSV-файлов с нестандартными разделителями.

Длинный ответ

CSV (Comma-Separated Values) – один из самых популярных форматов хранения табличных данных. В Pandas для чтения CSV-файлов используется метод:

import pandas as pd

df = pd.read_csv("data.csv")

По умолчанию read_csv() предполагает, что столбцы разделены запятой. Если используется другой разделитель, например ; или \t, можно задать delimiter:

df = pd.read_csv("data.csv", delimiter=";")

Если файл имеет заголовок, его можно пропустить с header=None, а также задать имена столбцов с names:

df = pd.read_csv("data.csv", header=None, names=["A", "B", "C"])

Если данные содержат пропущенные значения, Pandas автоматически подставит NaN. Можно задать свой маркер отсутствующих данных с na_values:

df = pd.read_csv("data.csv", na_values=["?", "N/A"])

Также можно использовать read_table(), если данные имеют другой разделитель:

df = pd.read_table("data.csv", delimiter=",")


read_csv() – основной метод для загрузки данных из CSV-файлов в Pandas. Он поддерживает множество параметров для обработки заголовков, разделителей, пропущенных значений и других особенностей формата.

Уровень

  • Рейтинг:

    1

  • Сложность:

    4

Навыки

  • Pandas

Подпишись на Data Science в телеграм