HTML5 – 字符编码

HTML5 – 字符编码

字符编码是将字节转换为字符的一种方法。为了验证或显示HTML文档,程序必须选择一种字符编码。HTML5的作者有三种设置字符编码的方法:

HTTP Content-Type头部

如果您正在编写cgi或类似程序,则可以使用HTTP Content-Type 头部来设置任何字符编码。

下面是一个简单的例子−

print "Content-Type: text/html; charset=utf-8\r\n";

<meta>元素

您可以使用一个带有charset属性的元素,在HTML5文档的前512字节中指定编码。

下面是一个简化的例子−

<meta charset="UTF-8">

上面的语法取代了,尽管那个语法仍然被允许使用。

Unicode字节顺序标记(BOM)

字节顺序标记(BOM)由数据流开始处的字符代码U+FEFF组成,其可用作标志定义字节顺序和编码形式,主要用于未标记的纯文本文件。

许多Windows程序(包括Windows记事本)在保存为UTF-8格式的文档开头添加0xEF,0xBB,0xBF字节。这是Unicode字节顺序标记(BOM)的UTF-8编码,通常称为UTF-8 BOM,即使它与字节顺序无关。

对于HTML5文档,您可以在文件开头使用Unicode字节顺序标记(BOM)字符。该字符提供了所使用的编码的标志。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程