最优控制方法_人文社科

[拼音]：zuiyou kongzhi fangfa

[外文]：method of optimal control

对一个因果关系链偶合系统的运行过程施加控制以获得最优的运行效果所使用的理论和方法体系。

形成与发展

50年代以来，以控制理论为基础的自动控制技术和自动化科学得到了迅速的发展和广泛的应用，出现了现代控制理论，即最优控制理论。它在空间计划中的成就启发了经济学家采用现代控制理论来解决各种经济问题。最优控制理论在经济中的应用，最早始于60年代对经济增长问题的研究，即研究产量随时间在消费与投资之间的最优分配问题，研究各部门之间的投资分配问题。一些经济计量学家把最优控制理论用于短期的小规模的经济计量模型（见经济计量分析），企图解决宏观经济中的最优决策和计划问题。

应用

在经济领域内，最优控制方法不仅适用于解决宏观经济范围内的最优计划和管理的问题，而且也适用于解决微观经济范围内的最优计划和管理的问题。在经济政策的制订中应用最优控制方法，其基本结构和内容与最优分析相类似。首先要确定控制的目标，建立与之相应的优化指标，即使其达到最大值（或最小值）的目标泛函（目标函数），它通常表为福利函数或损失函数、费用函数等形式，以代表政策的目标。其次要建立反映一定时期内经济运行过程的经济模型（如动态投入产出模型、经济计量模型等），来描述受控系统的运行过程，这里包括满足可控性条件的状态转移方程（表为微分方程、差分方程或递推方程的形式）以及满足可观测性条件的输出方程。另外，还要建立对控制函数的约束。以上这些构成了最优控制的约束条件。最优控制方法的目的就是找出在上述约束条件下使用目标泛函达到最优值的控制函数。

在经济政策的制订中应用最优控制方法，其有效性在很大程度上取决于经济模型的质量及模型所适用的时期长短。在经济政策的制订中可以采用两种方式来运用最优控制方法。一种叫做开回路控制方法，即计算出未来一定时期内使目标泛函达到最优值的最优途径及相应的最优政策安排。在这种情况下，如果没有干扰，那么每个时期计算出来的最优途径发展的政策就可作为最优政策被适时地采用。在开回路控制方式下，状态的变化与控制之间没有反馈，当政策失效时也就不会自动进行调整，需要重新计算最优途径及相应的最优政策。为了克服这种困难，采用另一种闭回路控制方式，即将控制表为一组可改变的政策规则，通过这种规则将控制与状态变化的信息联系起来，自动地调整和计算最优的政策安排，以保证能反映状态变化的最优途径。

与静态优化问题相对应，最优控制问题实质上是动态过程的优化过程。在经济领域内，这类动态过程的优化问题主要是在时间过程中的各种分配问题。连续过程的最优控制问题的数学模型可以写成下列微分方程的形式：凧=F（x，u，t）

x是刻划受控过程状态的量，也就是确定受控过程在每一时刻t的状态的量，一般地说，x是一个向量。u是确定受控过程运行进程的控制函数，也是一个向量。t 是时间。为了使受控过程在时间的某一闭区间［t₀，t₁］上是确定的，就需要在［t₀，t₁］上给定一个以时间t为自变量的控制函数u（t）。这时，若给定x的初始值x（t₀）=x₀，即给定受控过程的一个初始状态，就唯一地确定了方程的解，也就是说，唯一地确定了状态点的一条轨线。这个受控过程的最优控制问题是根据所要达到的控制目的，列出下列积分形式的目标泛函：

在这里，控制函数u（t）对目标泛函J（u）的作用是双重的，一是直接通过被积函数I（x，u，t）作用于J（u），另外还通过微分方程而驱动受控状态x（t），从而影响被积函数I（x，u，t），进而影响J（u）。

因此，对于每一个在［t₀，t₁］上给定的控制函数u（t），唯一地确定了一个受控过程的进程，并使目标泛函取确定的数值。现假定至少存在着一个将受控过程从给定初始状态x₀ 驱动到指定终端状态 x（t₁）=x₁ 的控制函数，需要从可准控制函数集中寻找一个控制函数u_*（t），使得：

（1）受控过程从状态x₀到状态x₁的转移得以实现；

（2）目标泛函达到最小值（或最大值）。这个控制函数u_*（t）称为最优控制函数。此外，由于具体条件，控制函数本身还要受到一些限制，在寻找最优控制函数u_*（t）时，同样应对它加以考虑。

通常采用苏联数学家Л.С.庞特里亚金（1908～　）在1959年创造的“最大值原理”来求解这类连续过程最优控制问题。

另一类最优控制问题是离散过程的最优控制问题。这类问题的基本结构与连续过程最优控制问题相似，它包括状态转移方程、对控制的约束、目标函数。通常采用R.贝尔曼在1957年创造的以最优性原则为核心的动态规划方法来求解这类离散过程最优控制问题。