轻松读取 CSV 文件:read_csv 函数指南
- 手游频道
- 2024-11-24 10:18
- 1
在数据分析领域,读取 CSV(逗号分隔值)文件对于处理结构化数据至关重要。Python 中的 Pandas 库提供了 `read_csv` 函数,这是一个功能强大的工具,可让您轻松高效地读取和操作 CSV 数据。
轻松读取 CSV 文件:read_csv 函数指南
使用 read_csv 函数
`read_csv` 函数具有许多可选参数,可让您根据需要定制读取过程。基本语法如下:
```python import pandas as pd df = pd.read_csv('path/to/file.csv') ```
此代码将读取指定 CSV 文件并将其存储在 DataFrame `df` 中。
可选参数
`sep`:指定分隔符(默认值为逗号)。 `header`:指定是否包含标题行(默认值为 0,指示包含标题)。 `index_col`:指定要作为索引的列名。 `names`:用于 DataFrame 列名的自定义名称列表。 `skiprows`:跳过指定数量的行。 `nrows`:读取前 n 行。
示例
假设您有一个名为 `data.csv` 的 CSV 文件,其中包含分号分隔的数据,没有标题行:
```csv ID;Name;Age 1;John;25 2;Mary;30 ```
要读取此文件并使用分号作为分隔符,您可以使用以下代码:
```python df = pd.read_csv('data.csv', sep=';', header=None) ```
这将创建一个 DataFrame:
``` 0 1 2 0 1 John 25 1 2 Mary 30 ```
您还可以使用 `names` 参数指定自定义列名:
```python df = pd.read_csv('data.csv', sep=';', header=None, names=['ID', 'Name', 'Age']) ```
这将创建一个具有正确列名的 DataFrame:
``` ID Name Age 0 1 John 25 1 2 Mary 30 ```
处理缺失值
`read_csv` 函数还允许您处理 CSV 文件中的缺失值。您可以使用 `na_values` 参数指定要视为缺失值的特定值:
```python df = pd.read_csv('data.csv', na_values=['NA', 'NULL']) ```
这将用 NaN 值替换 CSV 文件中带有 `NA` 或 `NULL` 的任何单元格。
结论
版权声明:本文内容由互联网用户自发贡献。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 836084111@qq.com,本站将立刻删除。
下一篇