![数据通信原理与技术](https://wfqqreader-1252317822.image.myqcloud.com/cover/453/656453/b_656453.jpg)
1.1.1 消息、信息、数据和信号
在通信中,消息、信息、数据、信号等是经常使用的名词,在某些场合,它们也相互替换,混合使用。
1.消息(Message)
所谓消息,是指通信过程中传输的具体原始对象,例如,电话中语音,电视中的图像画面,电报中的电文,雷达中目标的距离、高度和方位,遥测系统中测量的数据等。很显然,这些语音、图像、电文、参量、数据、符号等消息在物理特征上极不相同,各种具体消息的组成亦不可能相同。
消息通常可以分成两大类:一类是离散消息,另一类是连续消息,它们的共同特点是都具有随机性,并且都可以进行度量。
离散消息和连续消息的统计特性归纳如下:
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0011_0001.jpg?sign=1738836799-MoWqYyMP0RWThI90OiuVQf5C43S3qCqm-0-b3fdb7b1d906ceb11c0d37f62fc160a3)
2.信息(Information)
信息在意义上与消息相似,但它的含义却更抽象。通信中通常把有用的消息认为是信息,消息可以包含信息,但消息不完全等于信息。信息在本质上看是事物的不确性的一种描述。例如,“今天中午我们去吃饭”这句话是消息,对消息的接收者来说,是经常发生的情况,可能没有什么信息;但如果是“今天中午我们吃满汉全席”,这一消息平常不可能出现,或出现的可能性很小,它可能就包含着较多的信息。可见,消息的有用程度与信息的多少有关系。消息出现的概率愈小,则消息中包含的信息就愈多。
信息可以进行度量,消息中信息的多少可直观地用信息量来衡量。根据香农(Shannon)的理论,对于离散消息,信息量I可表述为
表 1-1 模拟通信、数字通信、数据通信的区分
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0015_0001.jpg?sign=1738836799-8pdtvYLhWR8x5g5RzrkYcqqUx9diWIT1-0-4bac07d9abb42c350b57d4e6db2c484a)
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0001.jpg?sign=1738836799-1vjzOj2dOq569IlSiyT7ULcSvIExzxZc-0-f99e33c809523cc442d65b07c7d9ce93)
式中,P是离散消息发生的概率;对数的底数a决定着信息量I的单位:
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0002.jpg?sign=1738836799-1wk95PZKOmC7OWnc7yRciP8lZXStbZ4c-0-9949ba18c76bfe6d373a86f93bdfb454)
在数据通信中,常以二进制(1和0)方式进行传输,因此,二进制的每个符号等概时所包含的信息量为
I=-log2(1/2)= 1(bit)
对于M进制、每个符号等概出现的消息,单一符号的信息量可表示成
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0003.jpg?sign=1738836799-Jr059A1JgWtY8Jt396ma5AVxqiryWdT5-0-6a8c90fb661d9ebddd336ffc9cab2926)
对于更一般的情况,设消息是由一串(m个)符号构成的,若各符号的出现相互独立,则第i个符号的信息量为-log2 Pi,i=1,2,…,m。由于信息量具有相加性,则这个消息的信息量为
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0004.jpg?sign=1738836799-BnOIwTGWniQF1GBhS1Hlkj70YnfL8myQ-0-a4a10aa3e89df2ebcb92d9d8b721e615)
式中,ni为第i个符号出现的次数,Pi为第i个符号出现的概率,m为消息中符号的总数。
当组成消息的符号数目N很大很大时,第i个符号出现的次数,则它具有的信息量是-NPi log2 Pi bit,这个消息所具有的信息量是所有符号信息量的和,即
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0006.jpg?sign=1738836799-IpJ82BspNbToqhJsEayn3zejsEwWLaBQ-0-34ed72d0a054a73cdb55158c15531d43)
而其中一个符号的信息量(称为平均信息量H)为
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0007.jpg?sign=1738836799-MdZYR4jQigsuj4gY4Etxmee40ZLRY2OJ-0-9a69105c35b3d992864c4bd10f0ca61a)
平均信息量有时也称为熵(Entropy),这是因为 H的计算公式与热力学和统计力学中关于系统熵的公式相似的缘故。
可以证明,当消息中每个符号等概出现(P1=P2=…=Pm=P=1/m)时,H具有最大值:
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0008.jpg?sign=1738836799-evJ7eIGcFgI0yQTQbAsSITSByB8oBvCK-0-ce6d5481112fedee2a853d0d93cb346a)
在这种情况下平均信息量等于每一个符号的信息量I,此时式(1-6)与式(1-2)一致。值得说明的是,H的单位是比特/符号(bit/符号),而I的单位是比特(bit)。
如果已知一个消息的符号个数N和符号的平均信息量,则消息的总信息量为
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0012_0009.jpg?sign=1738836799-NxrvLc7mTdl7umaAG2dN7MBPYTrI5JYF-0-5be869a59b2dcdc0b15a96e00b12ecda)
例1-1 已知一消息源由A、B、C、D四个符号组成,它们出现的概率分别为、
、
和
,且每个符号相互独立。消息源每秒输出2400个符号。试求A、B、C、D单个符号的信息量和消息源在1 min内的信息量。
解:各个符号的信息量I可用式(1-1)求得:
IA=IB=-log2(1/4)=2(bit)
IC=-log2(3/8)=1.415(bit)
ID=-log2(1/8)=3(bit)
每个符号的平均信息量H可通过式(1-5)求得:
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0013_0002.jpg?sign=1738836799-KTE0HpHPx6EIRe4h0PG1IIq5PeGoUviN-0-7cfb36eea9b55bf418ee72fb78770809)
消息源每秒输出2400个符号,则在1 min内共输出60×2400个符号,则1 min内的信息量
IΣ=N · H= 60 × 2400 × 1.905625 =274410(bit)
通过例1-1 可以看出,离散消息符号出现的概率愈小,则信息量愈大,可见消息的信息量与符号发生的概率值成减函数关系。另外,消息总的信息量与符号的多少成正比关系。
对于连续消息信息量的计算,可用下式计算:
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0013_0003.jpg?sign=1738836799-4Ml7tDLBEJJwVa28rYowuzuTRGA30edo-0-2db091475e5b90d53c91b14c5be9db40)
式中P(x)为连续消息的概率密度函数,H(x)的单位为奈特。在数据通信中,由于数据是离散消息,故对连续消息信息量的计算不予详述。
3.数据(Data)
“数据”一词是人们日常工作和生活中使用频率很高的词,例如各种实验数据、测量数据、统计数据、计算机数据等。尽管人们经常遇见各种各样的数据,处理和运用数据,但数据很难严格地定义。一般可这样认为:数据是用来描述任何物体、概念、情况,且预先具有特定含义的数字、字母和符号。
在数据通信中,通常认为数据是指具有数字形式的数据,即由二进制或多进制数组成的数字序列(串)。从消息的概念来看,数据就是携带有用信息的离散消息。
4.信号(Signal)
信号是数据的表现形式,是消息的承载者。在通信中所使用的信号,指的是电信号或光信号,即随时间变化的电压、电流或光强。信号是通信系统中传输的主体,它存在于系统的每个环节中,因此,了解信号的特性及分析方法是非常有用的。信号分类和信号特性分别简要归纳如下:
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0013_0004.jpg?sign=1738836799-WSUp8Das2abzJTKVwutWjFWVCfcyWgiP-0-5ca9651646e52dbadd34a0a139865eed)
![](https://epubservercos.yuewen.com/C27923/3590316004058201/epubprivate/OEBPS/Images/figure_0014_0001.jpg?sign=1738836799-Lz8uSYrPV1K2UH9OVB2GlGMeRtmdznqb-0-aae043b7040a4525d3e6612dcf763e3a)