标准ASCII字符集
字节经常用于保存文本文档中的单个字符。在ASCII字符集, 0到127之间的每一个二进制值都被赋予一个特定的字符。大多数计算机扩展了ASCII字符集,以使用一个字节中256个字符的全部范围。上面的128个字符处理一些特殊的东西,比如普通外语中的重音字符。
你可以在下面看到127个标准ASCII码。计算机存储文本文档,两者都在磁盘而在内存,使用这些代码。例如,如果您在Windows 95/98中使用记事本创建包含单词“四分七年前”的文本文件,记事本将为每个字符使用1个字节的内存(包括单词之间的每个空格字符1个字节——ASCII字符32)。当记事本将句子存储在磁盘上的文件中时,该文件也将每个字符和每个空格包含1个字节。
广告
试试这个实验:在记事本中打开一个新文件,并在其中插入一句话,“四十七年前”。将文件保存到该名称下的磁盘getty.txt.然后使用资源管理器查看文件的大小。您将发现该文件在磁盘上的大小为30字节:每个字符1字节。如果在句尾添加另一个单词并重新保存它,文件大小将跳转到适当的字节数。每个字符消耗一个字节。
如果您像计算机一样查看该文件,您会发现每个字节包含的不是字母而是一个数字——这个数字是对应于字符的ASCII码(见下文)。所以在磁盘上,文件的数字是这样的:
F o u r a n d s e v e n 70 111 117 114 32 97 110 100 32 115 101 118 101 110
通过查看ASCII表,您可以看到每个字符和所使用的ASCII代码之间的一一对应关系。注意空格用了32——32是空格的ASCII码。我们可以将这些十进制数展开为二进制数(因此32 = 00100000),如果我们想在技术上是正确的——这就是计算机真正处理事情的方式。18新利最新登入
前32个值(0到31)是用于回车和换行之类的代码。空格字符是第33个值,后面跟着标点符号、数字、大写字母和小写字母。要查看所有127个值,请查看Unicode.org的图表.
接下来我们将学习字节前缀和二进制数学。