如何用 Python 解析 CSV 文件

CSV 文件被广泛用于存储表格数据到一个文件中. 我们可以轻松地将数据从数据库表或Excel文件导出到CSV文件中. 它也容易被人和程序读取。

什么是 Parsing?

解析文件意味着从文件中读取数据. 该文件可能包含文本数据,即所谓的文本文件,或者它们可能是电子表格。

什么是CSV文件?

CSV 代表 Comma Separated Files,也就是说,数据是使用 comma 彼此分开的。 CSV 文件由处理大量数据的程序创建。从 CSV 文件的数据可以很容易地以表格和数据库的形式导出,并导入用于其他程序。让我们看看如何解析 CSV 文件。在 Python 中解析 CSV 文件很容易。Python 拥有内置的 CSV 库,提供读取和写入 CSV 文件的功能。库中有各种 CSV 文件可用格式,使数据处理易于使用。

在 Python 中整理 CSV 文件

使用内置的 Python CSV 模块阅读 CSV 文件。

1import csv
2
3with open('university_records.csv', 'r') as csv_file:
4    reader = csv.reader(csv_file)
5
6    for row in reader:
7        print(row)

出发点:**

Python Parse CSV File

用 Python 编写 CSV 文件

要写一个文件,我们必须在写模式或附件模式中打开它,在这里,我们将数据附加到现有的CSV文件中。

 1import csv
 2
 3row = ['David', 'MCE', '3', '7.8']
 4
 5row1 = ['Lisa', 'PIE', '3', '9.1']
 6
 7row2 = ['Raymond', 'ECE', '2', '8.5']
 8
 9with open('university_records.csv', 'a') as csv_file:
10    writer = csv.writer(csv_file)
11
12    writer.writerow(row)
13
14    writer.writerow(row1)
15
16    writer.writerow(row2)

Python Append To CSV File

使用 Pandas 图书馆对 CSV 文件进行分析

有另一种方法可以使用 CSV 文件,这是最流行的和更专业的,它是使用 pandas库。Pandas 是一个 Python 数据分析库,它提供不同的结构,工具和操作来工作和操纵给定的数据,这主要是两维或一维表。

潘达图书馆的用途和特征

  • 数据集旋转和重塑
  • 数据操纵使用 DataFrame 对象的索引
  • 数据过滤
  • 数据集的合并和合并操作
  • 大型数据集的剪切,索引和子集
  • 数据处理和数据对齐
  • 列/列插入和删除
  • 单维不同的文件格式
  • 读取和写入各种文件格式中的数据工具

要使用 CSV 文件,您需要安装 pandas. 安装 pandas 非常简单,请遵循下面的说明以使用 PIP 安装它。

1$ pip install pandas

Python Install PandasPython Install Pandas[/caption] [caption id="attachment_30145" align="aligncenter" width="727"]Python Install Pandas Cmd

一旦安装完成,你是好的去。

使用 Pandas 模块读取 CSV 文件

您需要知道您的数据文件在您的文件系统中的路径,以及您当前的工作目录,才能使用 pandas 导入您的 CSV 文件数据,我建议将您的代码和数据文件保存在同一个目录或文件夹中,以便您不需要指定路径,从而节省您的时间和空间。

1import pandas
2
3result = pandas.read_csv('ign.csv')
4
5print(result)

出发点( )

Read Csv File Pandas Output

使用 Pandas 模块编写 CSV 文件

使用 pandas 编写 CSV 文件就像读书一样简单。唯一新使用的术语是DataFrame。Panda DataFrame 是一个两维的、不等式的表格数据结构(数据以表格的方式分布在行和列中。

 1from pandas import DataFrame
 2
 3C = {'Programming language': ['Python', 'Java', 'C++'],
 4
 5     'Designed by': ['Guido van Rossum', 'James Gosling', 'Bjarne Stroustrup'],
 6
 7     'Appeared': ['1991', '1995', '1985'],
 8
 9     'Extension': ['.py', '.java', '.cpp'],
10
11     }
12
13df = DataFrame(C, columns=['Programming language', 'Designed by', 'Appeared', 'Extension'])
14
15export_csv = df.to_csv(r'program_lang.csv', index=None, header=True)

出发点( )

Python Pandas Write CSV File

结论

我们学会了使用内置的 CSV 模块和 Pandas 模块来解析 CSV 文件. 有许多不同的方法来解析文件,但程序员不会广泛使用它们. 像 PlyPlus, PLY 和 ANTLR 这样的库是用于解析文本数据的库之一。 现在你知道如何使用内置的 CSV 库和强大的 Pandas 模块来解读和写 CSV 格式的数据。 上面的代码非常基本和简单。 它可以理解任何熟悉 Python 的人,所以我认为没有必要解释。 然而,用空白和模糊的数据输入来处理复杂数据并不容易。 它需要在 Pandas 中练习和了解各种工具。 CSV 是保存和共享数据的最佳方式。 Pandas 是 CSV 模块的绝佳替代品。 您可能在开始时发现它很困难,

Published At
Categories with 技术
Tagged with
comments powered by Disqus