首頁 » 字符编码:它是什么以及为什么它很重要?

字符编码:它是什么以及为什么它很重要?

当在线数字内容从一种语言翻译成另一种语言时,当该翻译内容被传输到不同的媒介时,可能会出现不幸的(且常见的)副作用。

包含重音字母或特殊格式的简单句子在从一个文件复制到另一个文件时可能会出现格式错误。特定字符和标点符号元素通常会呈现为一系列问号或随机的非标准字符。

为什么会这样?字符编码

什么是字符编码?

字符编码告诉计算机如何将数字数据解释为字母、数字和符号。这是通过为字母、数字或符号分配特定数值来实现的。这些字母、数字和符号被归类为“字符”。字符被分组到特定的“字符集”或“字符集”中,每个字符都与一个称为“代码点”的数值相关联。然后这些字符被存储为一个或多个字节。

当您通过键盘或其他方式输入字符时,字符编码会将它们映射到计算机内存中的相关字节。这允许计算机正确显示字符。如果没有正确的编码,计算机将无法理解字符并显示正确的信息。

为了正确呈现翻译的数字内容,必须使用正确的字符编码。例如,包含特殊字符的文本应如下所示:

字符编码 101 作者: Kaðlín Örvardóttir

可能会显示如下:

Ka▯l?n ▯rvard?ttir编写的《字符编码 101》

这里介绍了一些字符集的历史,然后是一些有关如何在您的网站翻译项目中正确利用它们。

字符编码的类型 

直到 20 世纪 60 年代初期,计算机程序员才创建了 whatsapp 数据库 内部表示字符的临时约定。有些计算机区分大小写字母,但大多数计算机不区分。该技术之所以有效,是因为信息通常在一台机器上从头到尾进行处理。因此,不需要标准化的字符编码。

然而,一旦信息交换成为重要考虑因素,程序员就需要一种标准代码,使数据能够在不同的计算机型号之间移动。这导致了 ASCII(美国信息交换标准代码)的开发。

ASCII

1963 年,ASCII(美国信息交换标准代码)字符编码方案建立,作为表示英文字符的通用代码,每个字母分配一个从 0 到 127 的数字值。

大多数现代字符编码子集都基于 ASCII 字符编码方案,并支持几个附加字符。

ANSI/Windows-1252

1985 年 Windows 操作系统问世后,很快便采用了一  说比经济政策的结果更难衡 项新标准,即 ANSI 字符集。“ANSI”一词也被称为 Windows 代码页(代码页 1252),尽管它与美国国家标准协会毫无关系。

Windows-1252 或 CP-1252(代码页 1252)字符编码随着 Microsoft Windows 的出现而变得流行,但最终在 Unicode 在 Windows 中实现时被取代。Unicode 于 1991 年首次发布,为世界上所有语言的每个字符和符号分配一个通用代码。

ISO-8859-1 

ISO-8859-1(也称为 Latin-1)字符编码集包含  消費者數據  Windows-1252 的所有字符,包括标点符号和商业符号的扩展子集。此标准可轻松在多个文字处理器甚至新发布的 HTML 4 版本之间移植。

第一版于 1987 年发布,是 ASCII 字符集的直接扩展。虽然当时支持范围很广,但格式仍然有限。

返回頂端