python读文件utf-8|极客教程

python读文件utf-8

在Python中，我们经常需要读取文件内容并对其进行处理。在处理文件时，我们经常遇到的问题是文件编码的格式。特别是在处理中文文本时，使用UTF-8编码格式是最常见的。本文将介绍如何在Python中使用UTF-8编码格式读取文件。

读取文件

在Python中读取文件是一件非常简单的事情。我们可以使用open函数来打开文件并读取其内容。在使用open函数时，我们可以通过指定encoding='utf-8'参数来指定文件的编码格式为UTF-8。下面是一个简单的示例：

with open('test.txt', 'r', encoding='utf-8') as file:
    content = file.read()
    print(content)

在上面的示例中，我们打开了一个名为test.txt的文件，并指定其编码格式为UTF-8。然后我们通过read方法读取文件的内容并打印出来。

运行结果

假设test.txt文件的内容如下：

这是一个测试文件。
测试文件包含一些中文字符。

运行以上代码将输出如下结果：

这是一个测试文件。
测试文件包含一些中文字符。

逐行读取文件

除了一次性读取整个文件内容外，我们还可以逐行读取文件内容。这在处理大型文件时非常有用，可以节省内存空间。下面是一个逐行读取文件内容的示例：

with open('test.txt', 'r', encoding='utf-8') as file:
    for line in file:
        print(line.strip())

在上面的示例中，我们使用for line in file来逐行读取文件内容，并使用strip方法去除每行末尾的换行符。

运行结果

假设test.txt文件的内容如下：

这是第一行。
这是第二行。
这是第三行。

运行以上代码将输出如下结果：

这是第一行。
这是第二行。
这是第三行。

按行读取文件到列表

有时候我们希望将文件内容按行读取到一个列表中，以便后续处理。下面是一个将文件内容按行读取到列表的示例：

with open('test.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()
    for line in lines:
        print(line.strip())

在上面的示例中，我们使用readlines方法将文件内容按行读取到一个列表中，然后可以对该列表进行进一步处理。

运行结果

假设test.txt文件的内容如下：

apple
banana
cherry

运行以上代码将输出如下结果：

apple
banana
cherry

处理异常

在读取文件时，可能会遇到文件不存在或者无法打开的情况，这时候Python会抛出FileNotFoundError或者PermissionError等异常。我们可以使用try...except语句来处理这些异常，以保证程序的稳定性。下面是一个处理文件读取异常的示例：

try:
    with open('not_exist.txt', 'r', encoding='utf-8') as file:
        content = file.read()
        print(content)
except FileNotFoundError:
    print("文件不存在！")
except PermissionError:
    print("无法打开文件！")

在上面的示例中，我们尝试打开一个不存在的文件not_exist.txt，然后捕获FileNotFoundError和PermissionError异常，并进行相应的处理。

运行结果

运行以上代码将输出：

文件不存在！

总结

本文介绍了如何在Python中使用UTF-8编码格式读取文件。我们学习了如何一次性读取文件内容、逐行读取文件内容、按行读取文件内容到列表以及处理文件读取异常。掌握这些知识将有助于我们在处理文件时更加灵活和稳定。

python读文件utf-8