5个改变世界的方程
来源:新原理研究所
数学,是一个充满方程的世界。
一个方程能将大量信息浓缩成一个简单的式子。数学家的使命不仅是推导这些方程,还有解出这些方程以发现其中所包含的信息。一个常被提及的问题是:数学究竟是一项发明还是一项发现?最恰当的答案或许是——两者皆是。创建方程是一个发明的过程,而求解方程则是一个发现的过程。
如果要评选最伟大的数学方程,毕达哥拉斯定理(勾股定理)、费马大定理、欧拉恒等式等必定名列其中。
一些著名方程的例子。
方程也可以描述宇宙,比如万有引力定律,爱因斯坦场方程、质能方程等等。对于这些方程,或许你已经在许多不同文章中已经有了或多或少的了解。
因此,今天我们要讨论几个不一样的方程,它们伟大而深刻,无论是在数学领域还是我们的生活中都扮演着极为重要的角色。
01
Ax=b,或许是线性代数中最简单的等式之一。然而,就是这样一个简单的方程,却在许多方面改变了世界,它背后所蕴含的意义或许不像爱因斯坦场方程或薛定谔方程那样令人惊叹,也不像费马大定理那样难以求解,但可以说,我们生活中的每件事几乎都会受到这个方程的无限的影响。
线性矩阵方程。
在这个方程中,x是未知的,b是已知的,A则是一个将 x映射到b的已知算子。这个方程把已知的和未知的联系起来。当我们需要预测天气、做核磁共振或CAT扫描、设计飞机、训练机器学习、控制化工工厂,甚至购物时,这个线性方程就出现了。求解这个方程,让科学家发现了之前不曾知晓的秘密。
其实在这个方程中,算子A可以是很多东西,它可以是一个数字、一个方阵、一个长方阵,甚至一个微分运算……这个方程的最简单例子,就是当A、x和b都是简单的数字时。当A≠0 时,这个方程有唯一解 x=b/A.
更为复杂但非常有趣的情况发生在当A是一个矩阵,而x和b是向量时。举个简单的例子,假设你需要买x个苹果和y个香蕉,苹果2元一个,香蕉3元一个,你有17元预算;同时,从补充维生素C的角度来看,每个苹果有4个单位的维生素C,每个香蕉有3个单位,总维生素C摄入量需要25个单位。那么问题来了,x和y分别该为什么值?
按照惯有思路,我们可以通过设置方程组来轻松解开这道题:
而如果用矩阵方程Ax=b的形式,这组方程可以被写成:
求解这个比之前的简单方程会更难一点,它需要构造一个逆矩阵A⁻¹,使得
并最终得到:
在这个例子中,未知数只有两个,尚且容易解决。但求解这类矩阵方程的难度会随着未知数的增加而迅速增加。当一个矩阵中涉及到的未知数有N个时,求解它的难度会以N³的程度增加。
Ax=b的应用范围远远超出了这个购物例子,从医学成像技术到天气预报,从飞机设计到桥梁建造,不一而足。它是任何涉及到一组大量未知数的问题的中心方程,而我们要做的就是从一组已知的关系来确定这些未知数。
那么究竟应该如何求解方程Ax=b呢?主要的方法有两种。一种是以高斯消元法为例的直接方法,其目标是找到矩阵A的逆矩阵的表达式。高斯消元法是寻找逆矩阵的最优方法之一,它最初出现在公元179年的中国数学巨著《九章算术》,到了1670年被牛顿重新提出,并在1810年由高斯加以完善。高斯消元法至今仍以多种形式被使用,它是用于解决未知数的数量在100000以内的问题的最佳方法之一。
然而这种方法不那么适用于那些未知数数量更大的问题,它的计算所需时间正比于N³,非常耗时且耗费内存。因此对于这类情况,一些更新的方法会是更好的选择,其中以共轭梯度法为代表的迭代方法尤甚。这类迭代方法会先对解作出一个初步猜测,然后通过迭代依次对这个猜测进行改进,直到得到最终解。医学成像等技术就常采用这样一种方法,它的一个显著优点是当我们认为解已经足够好了,就可以在任何时候停止这个过程。因此,迭代方法现在被广泛使用。
除了这两种外,还有多重网格法,这是目前最快最优的方法,但同时也是最复杂的方法。
02
方程Ax=λx与矩阵的本征值有关。在这个方程中,A可以是一个矩阵,也可以是一个微分算子,而λ和x都是未知的。可以说,这个看似简单又奇特的方程,是所有现代技术、物理、化学和工程的核心。这个方程的一个常被用来寻找的东西就是许多系统的共振模,比如悬索桥、汽车、飞机和体育馆……
本征值方程。
这个方程表示的究竟是什么意思?现在,假设A是一个简单的2×2的矩阵:
那么x和λ分别是什么呢?经过计算,可以得出:
也就是说,λ的可能值是3和2,这两个数字就是矩阵A的本征值;而与本征值对应的向量x则被称为本征向量。
计算一个矩阵的本征值与本征向量的方法其实并不复杂,它只需让矩阵A的本征值λ满足:
这里的det(A)表示的是矩阵A的行列式,I代表单位矩阵。比如,如果A仍是一个2×2的矩阵:
那么 det(A-λI)=0 就可以写为:
求解这个方程就可以得到λ的值。一般说来,对于一个n×n的矩阵来说,与其对应的det(A-λI)=0有n个解。
那么这一切与振动膜有什么关系呢?如果求得的λ是实数,那么意味着振动会减弱并消失;如果λ是复数,就意味着系统会产生振荡。
对于一个n×n的矩阵,行列式会是一个n次多项式,精确求解n次多项式是非常困难的事。因此,即使用最快的计算机来求解矩阵的本征值方程也非易事。目前最好的算法叫QR算法,但它也有速度慢且难以使用的问题。
然而,求解矩阵本征值方程是非常有必要的,通过它我们不仅能知道一座悬索桥的共振频率,还能计算出分子的振动频率。它的应用非常多变,以量子力学中的薛定谔方程为例:
薛定谔方程。
我们知道,求解薛定谔方程能找到描述量子力学系统状态的波函数,这几乎意味着我们想知道的一切。但它非常难以求解,然而在计算机程序中,这个方程就可以变成离散的本征值方程。因此,以类似的方式,矩阵本征值方程成为了利用波的一切技术的核心,这些技术包括所有的无线电、电视、雷达、移动电话、WiFi以及音响等。
03
假如你在听一个交响乐队演奏,你能听出通过声音辨别出演奏的是什么乐吗?再假如你有一张模糊的照片,你能重新创造出原来的未模糊的照片吗?所有这些问题都可以用这组方程来解答:第一个叫傅里叶变换,第二个是傅里叶逆变换。这组成对出现的方程不仅是整个电信行业的核心,它们在数学的大部分领域,物理、化学,以及医学成像等多个领域都至关重要。
傅里叶变换(上)和傅里叶逆变换(下)。
在傅里叶变换中,f(t)是时间函数,F(ω)是频率函数;ω是波的频率,F(ω)表示波的振幅。要如何理解这组成对出现的方程呢?我们还是以交响乐队为例。在乐队演奏一曲乐章的时候,不同的乐器要演奏不同频率的音符。第一个方程可以告诉我们每种乐器演奏的声音有多大,而第二个方程能告诉我们不同的乐器如何组合在一起发出了我们听到的所有声音。
更进一步说,当不同的乐器演奏相同的音符时,听起来却非常不同。其原因在于每个乐器演奏的其实不仅是这个音符本身,还有这个音符的所有泛音。这些泛音的振幅因乐器而异,因此它们听起来也非常不同。
现在,如果我们把一件乐器所演奏的f(t)记录代入第一个方程中,那么函数F(ω)就能告诉我们不同泛音的振幅。如果我们知道一件乐器的不同泛音的振幅,就能重现它的声音。这就是合成器的工作原理。
通过傅里叶变换找到的长笛、双簧管、小提琴的不同泛音。
上面这张图显示的是长笛、双簧管和小提琴的泛音,这些都是通过傅里叶变换计算出来的。从图上可以看出,长笛的泛音较少,所以音色比较纯净;反之小提琴拥有大量泛音,因此它的音色也更加丰富。
因此,傅里叶变换就是一种将函数f(t)变换成另一个函数F(ω)的方法;为傅里叶逆变换则能将F(ω)变回f(t)。
除了声音之外,傅里叶变换在信号和图像处理中也起着非常重要的作用。比如在我们试图通过通信信道传输信息时,往往会出现信息失真的情况;又比如我们给一个物体拍照时,照片就会变得模糊。对于产生这种失真与模糊背后的过程,我们已经了解得十分详尽了。
假设f(t)是通过信道的信号,g(τ)是一个导致信号失真的“模糊”函数,这种模糊是信道的一个性质,那么信道的输出h(t)由可以通过下面这个等式得到:
函数h(t)被称为f(t)与g(τ)的卷积,通常被写作为:
卷积积分是很难直接计算的,而且直接计算需要耗费大量的计算时间。然而,傅里叶变换为这个等式提供了一个简单的表达式:
这个结果被称为卷积定理,这是一个无论你怎样强调它对现代电信的重要性都不过分的等式。它为计算h(t)提供了一个直观有效的方法:先找到f(t)和g(t)的傅里叶变换,将它们相乘,然后通过傅里叶逆变化变换,就能得到h。
此外,如果已知的是接收到的信号h(t),想要找出f(t),那么可以先对h进行傅里叶变换,然后除以g(t)的傅里叶变换,再运用傅里叶逆变换,就能找到f(t)。举例来说,你有一张模糊的照片,函数h(t)代表的是模糊照片的强度水平,那么f(t)则是原始的不模糊的照片的强度水平。因此,通过刚才提到的过程,就能将模糊的照片恢复成清晰的样子。
用傅里叶变化恢复模糊照片的示例。| 图片来源:Chris Budd
不过在实践应用中,我们考虑的因素会比这个简单的方程要多一些,因为h(t)也会受到噪声的影响。但尽管如此,傅里叶变换仍是许多用来消除信号失真的方法的核心。而能够快速地进行傅里叶变化,成为了后来的核磁共振成像、CAT扫描等现代技术发展的前提。可以说,傅里叶变换不仅改变了电信行业,还掀起了一场现代数字革命。
04
19世纪,法国机械工程师克劳德-路易·纳维(Claude-Louis Navier)和英国数学家乔治·斯托克斯(George Stokes)推导出了一组描述流体的方程,它们被称为纳维-斯托克斯方程方程(NS方程)。在某种程度上,它们被视为是牛顿运动定律的延伸。这组方程看起来或许很复杂,但它们与我们有着千丝万缕的联系,几乎无时无刻地出现在我们生活中,比如天气和气候。
纳维叶-斯托克斯方程。
天气是一个奇妙的东西,有时它可以被预测,有时又非常难以预测。从科学的角度来看,天气非常复杂,它是大气运动、海洋运动,以及大气中水分的输送的结合,它们都与大气压力以及温度的变化相关。从数学的角度来看,这一切都可以用偏微分方程来描述,其核心是描述空气自身的潜在运动。
假如我们对大气中的一个点进行观测,在这个点上空气会有一个速度u、密度ρ和压力P。此外这个点上的空气也会受到地球自转f和重力g的影响。这些量都存在于NS方程中,它描述了在这一点上速度随时间的变化是如何与速度和压力在空间上的变化相关的。
方程中的Re被称为雷诺数,当流体的粘稠度非常高(如蜂蜜)时,雷诺数就很低;当流体的粘稠度低(如空气或水),雷诺数就高。
最令人惊叹的是,无论是飓风的演化,还是洋流的行为;无论是流动在飞机周围的空气,还是在我们体内流动的血液……所有的这些流体的物理学都可以用这组方程描述。
然而,NS方程也存在一些让人头疼的问题。首当其冲的一个问题便是——这组方程极其难解,目前已知的确切解只有几个,而且它们代表的通常是没有真正的物理价值的情况。
为了寻找在某些具有真正物理意义的情况下(如管道中的水流)找到方程的有效近似解,数学家和科学家做了大量的工作。有专门用于寻找这些方程的数值解的计算机程序,比如气象局就会利用这样的程序来预测天气。这些程序也同样被用在飞机和汽车的设计、血液循环的研究、污染的影响、恒星内部的分析等方面。
另一个让人头疼的问题是,即使是使用最快的计算机,这些程序也需要耗费大量的时间来进行计算,而且这些计算机通常只能解决一些相对简单的问题。它们无法处理湍流——这种流体在小尺度上表现出的复杂行为。目前还没有任何计算机程序可以精确地对湍流进行模拟,只是粗略地近似。试想一下,在我们每一次模拟的安全临界情况时,比如火灾的影响或核电站的冷却剂泄漏,使用的都是这些误差值大约为20%的近似结果,这离理想的情况还是有很大的距离的。
湍流与混沌密切相关。如果一个系统可以用简单的数学方程描述,但它的行为却是复杂的、不可预测的,那么这是一个混沌系统。天气之所以难以预测,是因为NS方程似乎有混沌的解,这使得准确预测未来两周以上的天气非常困难。爱德华·洛伦茨(Edward Lorenz)在20世纪60年代首次提出了这种现象,当时他正在研究简化版的NS方程,即现在的洛伦茨方程。
洛伦茨方程。
洛伦茨方程是由三个常微分方程组成的方程组,虽然它们比NS方程要简单得多,但仍能对大气流动进行有效近似。在20世纪60年代,洛伦茨就利用刚出现不久的电子计算机来寻找这些方程的近似解。而结果却令他大吃一惊!因为他得到了不规律,且非常不稳定的解。如果绘制解的(x, y)图,就能看到它们的复杂性。
奇怪吸引子。
想必你一定见过这个蝴蝶状的曲线,现在它被称为“奇怪吸引子”(strange attractor)。对于这个结果,洛伦茨很高兴,因为他终于明白了为什么天气如此复杂。
值得一提的是,在许多方面,洛伦茨方程的形式都与目前正用于预测COVID-19疫情的SIR方程非常相似。在这个模型中,S代表的是易感人群,I代表感染人群,R是移出人群。这两种模型都是由3个二次非线性常微分方程构成的,然而它们的解却有着非常大的区别,最主要的是,SIR模型可以用来对疫情进行长期预测;而常被用于预测天气的洛伦茨方程则无法做出长期预测。
这些问题对于我们如何用NS方程来理解周围的物质世界非常重要。但对于数学家来说,他们思考的关于NS方程的问题要更加基本、更加困难:数学家研究的不在于我们能否解出NS方程,而在于而在于它们是否有解。这个问题至今没人能够回答。对于解的存在与否,数学家们各持己见。而可以预见的是,在未来很长一段时间内,NS方程的解的存在性问题都难以得到解决。而解决了这个问题,也就解决了千禧年大奖难题的第六个问题。
05
我们今天要讲到的最后一个方程有着非常有趣的名字——淋浴方程。这是一个不仅具有数学意义的方程,而且还控制着现实世界中的许多事情。它被应用在气候动力学、激光、厄尔尼诺现象、农业、人口动力学、一般控制理论等领域,是一个值得得到更好的理解的方程。
淋浴方程。
这个方程描述的现象其实非常简单。想象你在洗澡,发现水太冷,于是把旋钮像热水的方向调整——在调整的这一刻,什么也没有发生,因为热水需要一定的时间才能绕过水管。所以你等不及地把水的温度调得越来越高,最后,水终于流过了水管抵达花洒,落到了你的身上——烫!你马上慌忙水温调低,过了一会,冰凉的水落在了你的身上,于是你无奈地继续旋转旋钮调整水温,为了寻找合适的水温而不断调试……这是很多人都经历过的情况,淋浴方程描述的正是这种具有输出延迟的系统。
如果x(t)是淋浴时我们感受到的水温,那么调整旋钮所导致的这个温度的变化发生在时间τ之前,τ代表着一种延迟,在这里表示的是水流过管道所需的时间;λ表示淋浴对旋钮设置的变化做出响应的速度。
淋浴当然是我们生活中重要的一部分,但这个方程的应用意义远远超过了控制淋浴,其中最主要的应用之一或许是在气候动力学研究中的重要性。我们知道,许多气候现象都需要时间才能产生影响。例如,如果我们现在改变排放到大气中的二氧化碳的量,那么我们需要等待一段时间才能看到这种改变对地球温度的实际影响。这种延迟使得预测减少碳排放的影响变得很困难,并且从方程的解来看,有可能会导致不受控制的振荡。
另一个例子是在厄尔尼诺与南方涛动(ENSO)中南太平洋的温度变化,这是一种温度的不规则变化。ENSO是由洋流和大气之间的相互作用引起的,它会改变海洋的温度。这里的延迟是由洋流从南美洲西海岸流到亚洲东海岸,然后再返回所需要的时间造成的。海洋温度的变化随着洋流的流动所需时间而延迟,因此它非常适合用淋浴方程来建模。厄尔尼诺现象是一个可以对局部乃至整个世界的经济造成影响的现象,如果能更好地预测它,那么这将有助于太平洋地区的人能提前为应对作出准备。
这个方程与目前正在全球肆虐的COVID-19疫情也有关联。由于Cov-Sars-2病毒具有一定的潜伏期,在此期间患者不会出现任何症状,导致针对病毒的干预措施都必须等到这段时间之后才会产生效力。这种模型直接衍生出了淋浴方程的疫情版本,也就是常被用来帮助理解和控制流行病的SIR模型。在这个模型中,关键的组成部分是从干预的控制到能被观察到的响应之间的时间延迟,像ENSO系统一样,延迟的存在加剧了事情的不确定性,这也是我们目前所现在面临的问题。
……
数学方程的发明或许是人类作为一种智慧生命的最杰出力证之一。我们为桥梁的建设、疾病的传播、原子的运动等一切物质世界的规律寻找可以描述它们的方程。而上述5个方程的实用性在某种程度上极大地改变了我们的世界,而它们其实也只是这些数学瑰宝中的一部分。这些数学方程帮助我们更好地理解周围世界的运作,更好地感受存在于宇宙中的众多难以置信的规律。
本文节选并整理自数学家Chris Budd于2020年04月28日,在格雷沙姆学院(Gresham College)发表的演讲Equations that have changed the world,全文链接可参阅:https://www.gresham.ac.uk/lectures-and-events/world-changing-equations
(图文来自网络,仅供学习与交流,版权归原作者所有,如有侵权请联系删除)