假设一个系统有n 个可能状态。当所有状态发生的概率相等时,系统的熵最大。当一个结果必然发生时,系统的熵最小。
你还可以说得更多。从任何一组概率开始,当你朝着更均匀的方向移动时,熵就会增加。而当你朝着更不均匀的方向移动时,熵就会减少。
这些陈述可以被量化,并更精确地表述。这正是本文其余部分将要讨论的内容。
***
令p i为第 i个状态的概率,令p为p i的向量。
那么p的熵定义为
如果其中一个p为 1,其余p为零,则H ( p ) = 0。(在熵的定义中,0 log 2 0 被视为 0。您可以将其证明为当x趋于零时x log 2 x的极限。)
如果每个p i都相等,即p i = 1/ n ,则H ( p ) = log 2 n 。这是熵的最大值,而在两个极端之间进行折衷总是会降低熵,这是因为熵函数H是凹函数(证明)。也就是说,如果p 1是一个概率列表, p 2是另一个概率列表,那么
当我们非正式地谈到从p 1朝p 2方向移动时,我们的意思是将参数 λ 从 0 增加到不超过 1 的某个正数。
由于熵是凹的,所以不存在局部最大值。当你从任何方向接近全局最大熵的位置(即状态概率相等),熵都会单调增加。
文章“均匀性增加熵”最先出现在John D. Cook身上。
原文: https://www.johndcook.com/blog/2025/06/23/uniformity-increases-entropy/