在第一部分中在美国,我们看到了LHS对于一个单任务网络的真正好处。现在,我们将尝试将好处扩展到两个任务,然后是实际大小的问题。
将分层抽样推广到两个或多个维度(在SRA中意味着两个或多个任务)的真正泛化不是LHS而是正交抽样。在正交采样,每一个组合同样的可能性。在简单的例子中,有36种可能的组合如果我们用36个正交样本我们会得到每个可能结果的一个样本。假设我们关心的是得到两个1的概率。我们知道这是1/36,正交抽样每次都会得到这个答案,误差为零。
如果我们进行常规随机抽样,得到两个1的次数可以从0(很有可能)到36(最不可能)。平均值仍然是1,标准误差是根号(35/36)或大约0.986。
所以,正交抽样是可行的。(请记住,在我们为简单起见而使用的离散示例中,它根本不是真正的抽样,而是枚举。)问题是它的规模并不大。如果我们有三个任务,我们将需要216个样本。如果我们有10个任务,我们将需要6000万!真正的项目通常有成百上千的任务,所需的样本数量是天文数字。
因此LHS妥协了。每个持续时间都是分层的独立但没有人试图确保这一点所有可能的组合期间的平均代表。使用LHS重制我们的2个骰子例子,并将每个分布划分为6个层次,每个骰子将在36次中出现6次。但是这两个数一般不会重合,所以两个1的次数可以是0到6之间的任何数。不失一般性,我们可以只看第一个骰子出现1时的6次。在这一受限结果集中,其他骰子的分数分布或多或少是随机的,但又不是完全随机的,因为它受总体约束,即每个分数总共出现6次。如果考虑到这个计算相当复杂的整体限制,结果的标准误差约为.845,明显优于纯随机抽样的0.986标准误差。
然而,随着任务维度的增加,LHS的随机性增加,因此LHS相对于随机抽样的好处减少。典型的项目网络有成百上千的任务,因此有维度。广义地说,LHS将n维问题中的不确定性减少到(n-1)维。因此,对于任意给定的迭代次数,LHS处理1000个任务的网络的精度与随机抽样处理999个任务的网络的精度大致相同。这是一个微不足道的差异。
大卫·沃斯经验证明,即使只有9个维度,LHS的好处也是微乎其微的。
此外,LHS并非没有成本。在同一篇论文中,David列举了一些这样的例子。有些会影响采样速度,因此,更少的迭代所带来的明显好处可能会被每次迭代所花费的更长的时间所抵消。其他缺点包括不能正确地使用LHS建模相关。
大卫的结论是,LHS在现代蒙特卡洛模拟中没有一席之地,这意味着当计算机速度较慢时,LHS可能会很有用。在像SRA这样的高维问题中,我会进一步说它从来都不值得。