Как считать данные в DataFrame из CSV-файла?
Этот вопрос проверяет, как загружать данные из CSV-файлов в DataFrame с помощью Pandas.
Короткий ответ
Для загрузки данных из CSV-файла в Pandas используется метод read_csv(). Он принимает путь к файлу и дополнительные параметры, такие как разделитель или кодировка. Также можно использовать метод read_table(), указав delimiter для CSV-файлов с нестандартными разделителями.
Длинный ответ
CSV (Comma-Separated Values) – один из самых популярных форматов хранения табличных данных. В Pandas для чтения CSV-файлов используется метод:
import pandas as pd
df = pd.read_csv("data.csv")По умолчанию read_csv() предполагает, что столбцы разделены запятой. Если используется другой разделитель, например ; или \t, можно задать delimiter:
df = pd.read_csv("data.csv", delimiter=";")Если файл имеет заголовок, его можно пропустить с header=None, а также задать имена столбцов с names:
df = pd.read_csv("data.csv", header=None, names=["A", "B", "C"])Если данные содержат пропущенные значения, Pandas автоматически подставит NaN. Можно задать свой маркер отсутствующих данных с na_values:
df = pd.read_csv("data.csv", na_values=["?", "N/A"])Также можно использовать read_table(), если данные имеют другой разделитель:
df = pd.read_table("data.csv", delimiter=",")read_csv() – основной метод для загрузки данных из CSV-файлов в Pandas. Он поддерживает множество параметров для обработки заголовков, разделителей, пропущенных значений и других особенностей формата.