南方教材网-广东南方传媒教育发展有限公司

粤版高中信息技术必修1第一章

知识点汇总

一、数据及其特征

（一）数据的定义

数据是现实世界客观事物的符号记录，是信息的载体，是计算机加工的对象。

（二）数据的基本特征

1．二进制：在计算机中，数据以二进制的形式存储和加工。

2．语义性：语义是将数据符号解释为客观世界的事物。

3．分散性：数据是分散的记录，分别记录不同客观事物的运行状态。

4．多样性与感知性：数据记录的形式是多样的、可看的、可听的、可感知的，如图形、图像、视频、音频、文本等。

二、数据编码

计算机中的信息是用二进制表示的。因为：物理上容易实现、可靠性强、运算简单、通用性强。在计算机中只能识别二进制数码信息，因此，一切字母、数字、符号、图像、声音等信息都必须用二进制特定编码来表示，信息才能传送、存储和处理。

（一）模拟信号与数字信号

表1-1 模拟信号与数字信号对比

项目	模拟信号	数字信号
定义	模拟信号是指用连续变化的物理量所表达的信息。	数字信号是离散时间信号的数字化表示。
示意图
例子	有线电话、无线广播电视等	在计算机中，数字信号的大小常用有限位的二进制数表示。
优点	(1) 当达到相同的效果，模拟信号处理比数字信号处理更简单。 (2) 模拟信号的信息密度更高。由于不存在量化误差,它可以对自然界物理量的真实值进行尽可能逼近的描述。	(1) 加强了通信的保密性。 (2) 提高了抗干扰能力。 (3) 传输差错可以控制，从而改善了传输质量。 (4) 便于使用现代数字信号处理技术来对数字信息进行处理。 (5) 可构建综合数字通信网，传递各种消息，使通信系统功能增强。
缺点	(1) 保密性差。 (2) 抗干扰能力弱。	缺点：占用频带较宽，技术要求复杂，进行模/数转换时会带来量化误差。
思考题	远距离传送时用何种信号？（数字信号，抗干扰强，利于存储、加密和纠错，保密性，可靠性）

（二）编码的基本方式

1．文字编码（文字的常用文件格式：txt，doc，pdf等）

单字节码：ASCII、莫尔斯码

双字节码：国标码（GBK），统一码（Unicode）

图1-1文字编码的发展过程

表1-2 常见的文字编码

编码	说明
ASCII编码	ASCII（American Standard Code for Information Interchange,美国信息交换标准码）是使用最广的。标准的ASCII编码使用8（最高位为0）个二进制数来表示128个符号，包括英文大小写字母、标点符号、数字和特殊控制符。
ANSI编码	为了扩充ASCII编码，以用于显示本国的语言，不同的国家和地区制定了不同的标准，由此产生了GB2312, BIG5 等各自的编码标准。这些使用2个字节来代表一个字符的各种汉字延伸编码方式，称为ANSI编码，又称为"MBCS"。在简体中文系统下，ANSI编码代表 GB2312 编码，在日文操作系统下，ANSI编码代表JIS编码，所以在中文 windows下要转码成GB2312,GBK只需要把文本保存为ANSI 编码即可。不同ANSI编码之间互不兼容。
GB2312编码	GB2312也是ANSI编码里的一种，对ANSI编码最初始的ASCII编码进行扩充，为了满足国内在计算机中使用汉字的需要，中国国家标准总局发布了一系列的汉字字符集国家标准编码，统称为GB码，或国标码。
GBK编码	GBK采用双字节表示，GBK是对GB2312-80的扩展。
BIG5编码	BIG5大五码是一种繁体中文汉字字符集，其中繁体汉字13053个，808个标点符号、希腊字母及特殊符号。大五码的编码码表直接针对存储而设计，每个字符统一使用两个字节存储表示。第1字节范围81H－FEH，避开了同ASCII码的冲突，第2字节范围是40H－7EH和A1H－FEH。因为BIG5的字符编码范围同GB2312字符的存储码范围存在冲突，所以在同一正文不能对两种字符集的字符同时支持。
Unicode编码	如上ANSI编码条例中所述，世界上存在着多种编码方式，在ANSI编码下，同一个编码值，在不同的编码体系里代表着不同的字。如果有一种编码，将世界上所有的符号都纳入其中，无论是英文、日文、还是中文等，大家都使用这个编码表，就不会出现编码不匹配现象。每个符号对应一个唯一的编码，乱码问题就不存在了。这就是Unicode编码。
UTF-8编码	为了提高Unicode的编码效率，于是就出现了UTF-8编码。UTF-8可以根据不同的符号自动选择编码的长短1-4个字节。比如英文字母可以只用1个字节就够了。 UTF-8的编码是这样得出来的，以"汉"这个字为例: "汉"字的Unicode编码是U 00006C49，然后把U 00006C49通过UTF-8编码器进行编码，最后输出的UTF-8编码是E6B189。

2．图像编码

l 矢量图形与位图图像

放大失真是位图图像（常用文件格式：png、jpg、bmp、gif等）

放大不失真是矢量图形（常用文件格式：ai，dwg，cdr等）

l 位图文件

最小单位：像素（光栅点），位图也叫点阵图。

图像量化位数：也叫图像颜色深度，是指图像中每个像素点记录颜色所用二进制数的位数。

BMP位图文件的大小（单位字节B）=文件头（14）信息头(40)

颜色表项(颜色总数*4，24位无颜色表项）图像分辨率*图像量化位数÷8

（颜色总数=2^{图像量化位数}）

l 图像分辨率决定清晰度，量化位数决定了色彩的鲜艳，量化位数为1的是黑白图，量化位数为24为真彩色。

3．声音编码（常用文件格式：wav，mp3，midi等）

l 声音编码的过程：采样、量化、编码。

l 根据安奎斯特采样定理，采样频率高于信号的最高频率的两倍即可采样值包含了原信号的全部信息，常用采样频率：44.1kHz（CD音质）、22.05kHz、11.025kHz。

l 国际声音量化等级分为256个，即2⁸=256，8位二进制数即可表示，最高位表示符号，正数为0，负数为1。

l 在量化过程中，向下取最接近的量化等级的数值。

l WAV格式声音存储空间（字节B）=

采样频率（Hz单位）*量化位数*声道数*时间（秒）÷8

（如果实际声音文件的大小要加上44字节的头文件）

4．压缩（软件：格式工厂）

有损压缩（不能还原）、无损压缩（能还原）

三、信息及其特征

（一）信息的定义

信息是经过加工处理的、具有意义的数据。

（二）信息的基本特征

1．普遍性：只要有事物运动，有数据存在，就会有信息存在。

2．传递性：信息的传递打破了时间和空间的限制。

3．共享性：信息作为一种资源，通过交流可以在不同个体或群体间共享。

4．依附性和可处理性：各种信息必须依附一定的图像、文字、声音等符号才能够表现出来，为人们所接收，并按照某种需要进行处理和存储；信息经过分析和处理，会产生新的信息，使信息得到增值。

5．时效性：信息不是一成不变的，会随着客观事物的变化而变化

6．真伪性：人们接受到的信息，并不都是对事物的真实反映

7．价值相对性：信息作为一种特殊的资源，具有相应的使用价值，但信息使用价值的大小是相对的。