Lesson 15 Spatial Patterns & Self-Organization

这是最后一节课,我们说一些介绍性的内容. 斑图 (pattern):有两种可能性,一种是受到外界作用,从各向同性变为具有某种空间模式的状态;另一种则是本身就具有变化为特定空间模式的性质. 果蝇的胚胎发育:有一种蛋白 Bicoid 会在整个胚胎中一维扩散. ∂[Bcd]∂t=D∂2[Bcd]∂x2−1τ[Bcd]\frac{\partial[\text{Bcd}]}{\partial t} = D\frac{\partial^2[\text{Bcd}]}{\partial x^2}-\frac{1}{\tau}[\text{Bcd}] ∂t∂[Bcd]​=D∂x2∂2[Bcd]​−τ1​[Bcd] 稳态解是 [Bcd](x)=[Bcd]0e−x/λ[\text{Bcd}](x)=[\text{Bcd}]_0e^{-x/\lambda}[Bcd](x)=[Bcd]0​e−x/λ. 其中 λ=Dτ\lambda=\sqrt{D\tau}λ=Dτ ​ 是某一种特征长度,在果蝇的例子中 ∼120 μm\sim120\,\mu m∼120μm,这正好是胚胎的大小. 上面这个模型的问题在于,λ\lambdaλ 是固定的,所以不能自适应地随着胚胎的生长而改变 Bicoid 蛋白的传输距离. Bicoid 由外部信号引入,但是其浓度差在内部产生了一些力. Turing 失稳:对于简单的扩散物理模型, dPdtt=f(P,Q)+Dμ∇2P\frac{\text{d}P}{\text{d}tt}=f(P,Q)+D_{\mu}\nabla^2P dttdP​=f(P,Q)+Dμ​∇2P 两种不同物质的方程联立,得到矩阵方程: ∂∂t(pq)=(a11+Dp∇2a12a21a22+Dq∇2)(pq)\frac{\partial}{\partial t}\begin{pmatrix} p\\q \end{pmatrix} = \begin{pmatrix} a_{11}+D_p\nabla^2&a_{12}\\ a_{21}&a_{22}+D_q\nabla^2 \end{pmatrix}\begin{pmatrix} p\\q \end{pmatrix} ∂t∂​(pq​)=(a11​+Dp​∇2a21​​a12​a22​+Dq​∇2​)(pq​) 这种线性的方程可以直接 Laplace 变换,原来的 Jacobi 矩阵变为 (a11−k2Dpa12a21a22−k2Dq)\begin{pmatrix} a_{11}-k^2D_p&a_{12}\\ a_{21}&a_{22}-k^2D_q \end{pmatrix} (a11​−k2Dp​a21​​a12​a22​−k2Dq​​) 在线性代数中,对于这个方程的非稳定解有要求,得到一个数值关系. 原来没有扩散的情况下,判定式为 Δ0=a11a22−a12a21\Delta_0=a_{11}a_{22}-a_{12}a_{21}Δ0​=a11​a22​−a12​a21​;定义 Δ(k)=Δ0−(a11Dp+a22Dq)k2−+DpDqk4\Delta(k)=\Delta_0-(a_{11}D_p+a_{22}D_q)k^2-+D_pD_qk^4Δ(k)=Δ0​−(a11​Dp​+a22​Dq​)k2−+Dp​Dq​k4 为新的判别式,那么对失稳的要求是 Δ(k)>0\Delta(k)>0Δ(k)>0. 在一维情况下,某种特征 kkk 在失稳区间内,能够使得 λ(k)=τ(k)+τ2(k)−4Δ(k)2\lambda(k) = \frac{\tau(k)+\sqrt{\tau^2(k)-4\Delta(k)}}{2} λ(k)=2τ(k)+τ2(k)−4Δ(k) ​​ 的值最大,那么从 λmax⁡\lambda_{\max}λmax​ 对应的 kkk 开始,这个模式会开始生长,产生一维的条带状斑图. 如果结合 Landau 二级相变理论,那么方程可以写为 ∂tϕ(x⃗,t)=μϕ−(∇2+qc2)ϕ+N(ϕ)\partial_t\phi(\vec{x},t) = \mu\phi-(\nabla^2+q_c^2)\phi+\mathcal{N}(\phi) ∂t​ϕ(x ,t)=μϕ−(∇2+qc2​)ϕ+N(ϕ) 其中 RHS 第二项来源于扩散效应. 实际上这个方程绝不仅仅限于 Turing 斑图的研究,在失稳态附近,有大量的相似物理现象构成了符合上述方程的普适类,比如气象学中的 Rayleigh-Bernard 对流、力学上的球壳 wrinkling 等等. 震撼事实:实际上除了大拇指之外的四根手指是来源于 Turing 斑图 —— 如果对周期做 perturbation,可能使小鼠胚胎出现多指;这也解释了为什么多指症没有多双关节手指的,而只有三关节手指的.

2026/1/2
articleCard.readMore

Lesson 15 Green 函数法

今天讲 Green 函数. Green 函数 点电荷的电荷密度分布写为 ρ(r⃗)=4πδ(0)\rho(\vec{r})=4\pi\delta(0)ρ(r )=4πδ(0). 有了点电荷的电势之后,可以利用点电荷的电势来叠加出任意带电体的电势 —— 当然仅适用于无界空间. 如果我们研究的问题是有界的,那么就要使用更加一般的 Green 函数. 对于下面一个 Poisson 方程的定解问题: ∇2u(r⃗)=−1ε0ρ(r⃗)u∣Σ=f(Σ)\begin{aligned} &\nabla^2u(\vec{r})=-\frac{1}{\varepsilon_0}\rho(\vec{r})\\ &u\big|_\Sigma=f(\Sigma) \end{aligned} ​∇2u(r )=−ε0​1​ρ(r )u ​Σ​=f(Σ)​ 这里是第一类边界条件,而不是齐次边界条件. 我们考虑把 u(r⃗)u(\vec{r})u(r ) 用 f(Σ)f(\Sigma)f(Σ)、ρ(r⃗)\rho(\vec{r})ρ(r ) 和 G(r⃗;r⃗′)G(\vec{r};\vec{r}')G(r ;r ′) 表示出来. /Theorem/ (Green 第二公式) ∭V[u∇2v−v∇2u]d3r⃗=∬Σ[u∇v−v∇u]⋅dΣ⃗\iiint_V\left[u\nabla^2v-v\nabla^2u\right]\text{d}^3\vec{r}=\iint_\Sigma\left[u\nabla v-v\nabla u\right]\cdot\text{d}\vec{\Sigma} ∭V​[u∇2v−v∇2u]d3r =∬Σ​[u∇v−v∇u]⋅dΣ 另外还有 Green 第一公式 ∭Vu∇2vd3r⃗=∬Σu∇v⋅dΣ⃗−∭V∇u⋅∇vd3r⃗\iiint_Vu\nabla^2v\text{d}^3\vec{r}=\iint_\Sigma u\nabla v\cdot\text{d}\vec{\Sigma}-\iiint_V\nabla u\cdot\nabla v\text{d}^3\vec{r} ∭V​u∇2vd3r =∬Σ​u∇v⋅dΣ −∭V​∇u⋅∇vd3r 这个公式正是分部积分在三维下的推广,不过并不常用. 把 Green 函数 G(r⃗;r⃗′)G(\vec{r};\vec{r}')G(r ;r ′) 作为 vvv 代入 Green 第二公式,其中 Green 函数是下述问题的解: ∇2G(r⃗;r⃗′)=−1ε0δ(r⃗−r⃗′)\nabla^2G(\vec{r};\vec{r}') = -\frac{1}{\varepsilon_0}\delta(\vec{r}-\vec{r}') ∇2G(r ;r ′)=−ε0​1​δ(r −r ′) 代入得: −1ε0[u(r⃗′)−∭VG(r⃗;r⃗′)ρ(r⃗)d3r⃗]=∬Σ[u(r⃗)∇G(r⃗;r⃗′)−G(r⃗;r⃗′)∇u(r⃗)]⋅dΣ⃗-\frac{1}{\varepsilon_0}\left[u(\vec{r}')-\iiint_V G(\vec{r};\vec{r}')\rho(\vec{r})\text{d}^3\vec{r}\right]=\iint_\Sigma[u(\vec{r})\nabla G(\vec{r};\vec{r}')-G(\vec{r};\vec{r}')\nabla u(\vec{r})]\cdot\text{d}\vec{\Sigma} −ε0​1​[u(r ′)−∭V​G(r ;r ′)ρ(r )d3r ]=∬Σ​[u(r )∇G(r ;r ′)−G(r ;r ′)∇u(r )]⋅dΣ 化简可以得到 u(r⃗′)u(\vec{r}')u(r ′),如下 u(r⃗′)=∭VG(r⃗;r⃗′)ρ(r⃗)d3r⃗−ε0∬Σ[u(r⃗)∇G(r⃗;r⃗′)−G(r⃗;r⃗′)∇u(r⃗)]⋅dΣ⃗\begin{aligned} u(\vec{r}')&=\iiint_VG(\vec{r};\vec{r}')\rho(\vec{r})\text{d}^3\vec{r}-\varepsilon_0\iint_\Sigma[u(\vec{r})\nabla G(\vec{r};\vec{r}')-G(\vec{r};\vec{r}')\nabla u(\vec{r})]\cdot\text{d}\vec{\Sigma} \end{aligned} u(r ′)​=∭V​G(r ;r ′)ρ(r )d3r −ε0​∬Σ​[u(r )∇G(r ;r ′)−G(r ;r ′)∇u(r )]⋅dΣ ​ 为了将积分做出来,我们需要指定 Green 函数的边界条件 (之前并未指定!). 取下述边界条件: G(r⃗;r⃗′)∣Σ=0G(\vec{r};\vec{r}')\big|_{\Sigma}=0 G(r ;r ′) ​Σ​=0 最后得到 u(r⃗′)=∭VG(r⃗;r⃗′)ρ(r⃗)d3r⃗−ε0∬Σf(Σ)∇G(r⃗;r⃗′)∣Σ⋅dΣ⃗u(\vec{r}')=\iiint_VG(\vec{r};\vec{r}')\rho(\vec{r})\text{d}^3\vec{r}-\varepsilon_0\iint_\Sigma f(\Sigma)\nabla G(\vec{r};\vec{r}')\big|_\Sigma\cdot\text{d}\vec{\Sigma} u(r ′)=∭V​G(r ;r ′)ρ(r )d3r −ε0​∬Σ​f(Σ)∇G(r ;r ′) ​Σ​⋅dΣ 交换 r⃗,r⃗′\vec{r},\vec{r}'r ,r ′: u(r⃗)=∭V′G(r⃗′;r⃗)ρ(r⃗′)d3r⃗′−ε0∬Σ′f(Σ′)∂G(r⃗′;r⃗)∂n′∣Σ′dΣ′u(\vec{r})=\iiint_{V'}G(\vec{r}';\vec{r})\rho(\vec{r}')\text{d}^3\vec{r}'-\varepsilon_0\iint_{\Sigma'}f(\Sigma')\left.\frac{\partial G(\vec{r}';\vec{r})}{\partial n'}\right|_{\Sigma'}\text{d}\Sigma' u(r )=∭V′​G(r ′;r )ρ(r ′)d3r ′−ε0​∬Σ′​f(Σ′)∂n′∂G(r ′;r )​ ​Σ′​dΣ′ 提示 实际上 G(r⃗;r⃗′)G(\vec{r};\vec{r}')G(r ;r ′) 在 r⃗=r⃗′\vec{r}=\vec{r}'r =r ′ 根本不连续,所以不能用 Green 公式;但是上面得到的结果是对的. 这是我们之前说过的「在 δ\deltaδ 函数后取极限的意义上是严格的」. 如果是第二类边界条件,那么相应地我们要取 G(r⃗;r⃗′)G(\vec{r};\vec{r}')G(r ;r ′) 的边界条件应该是: ∂G(r⃗;r⃗′)∂n∣Σ=0\left.\frac{\partial G(\vec{r};\vec{r}')}{\partial n}\right|_\Sigma = 0 ∂n∂G(r ;r ′)​ ​Σ​=0 但是如果是这样就会导致 G(r⃗;r⃗′)G(\vec{r};\vec{r}')G(r ;r ′) 不满足自身的方程 (也就是,有电荷但是电通量为零,违反 Gauss 定理). 这时候引入广义 Green 函数: {∇2G(r⃗;r⃗′)=−1ε0[δ(r⃗−r⃗′)−cu0(r⃗)]∂G(r⃗;r⃗′)∂n^∣Σ=0\left\{\begin{aligned} &\nabla^2G(\vec{r};\vec{r}') = -\frac{1}{\varepsilon_0}\left[\delta(\vec{r}-\vec{r}')-cu_0(\vec{r})\right]\\ &\left.\frac{\partial G(\vec{r};\vec{r}')}{\partial\hat{n}}\right|_\Sigma = 0 \end{aligned}\right. ⎩ ⎨ ⎧​​∇2G(r ;r ′)=−ε0​1​[δ(r −r ′)−cu0​(r )]∂n^∂G(r ;r ′)​ ​Σ​=0​ 这里有 ∭Vu0(r⃗)[δ(r⃗−r⃗′)−cu0(r⃗)]d3r⃗=0⟹c(r⃗′)=u0(r⃗′)∭Vu02(r⃗)d3r⃗\iiint_Vu_0(\vec{r})\left[\delta(\vec{r}-\vec{r}')-cu_0(\vec{r})\right]\text{d}^3\vec{r}=0\Longrightarrow c(\vec{r}')=\frac{u_0(\vec{r}')}{\displaystyle{\iiint_Vu_0^2(\vec{r})\text{d}^3\vec{r}}} ∭V​u0​(r )[δ(r −r ′)−cu0​(r )]d3r =0⟹c(r ′)=∭V​u02​(r )d3r u0​(r ′)​ 还是可以用 Green 公式算出最终解. 当然考试不考第二类边界条件的情况. 不同维度下也有 Green 函数,对于二维情况,无界区域的 Poisson 方程 Green 函数满足 [∂2∂x2+∂2∂y2]G(x,y;x′,y′)=−1ε0δ(x−x′)δ(y−y′)\left[\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}\right]G(x,y;x',y')=-\frac{1}{\varepsilon_0}\delta(x-x')\delta(y-y') [∂x2∂2​+∂y2∂2​]G(x,y;x′,y′)=−ε0​1​δ(x−x′)δ(y−y′) 解的形式是 G(x,y;x′,y′)=−12πε0ln⁡(x−x′)2+(y−y′)2+CG(x,y;x',y')=-\frac{1}{2\pi\varepsilon_0}\ln\sqrt{(x-x')^2+(y-y')^2}+C G(x,y;x′,y′)=−2πε0​1​ln(x−x′)2+(y−y′)2 ​+C 另外,Green 函数具有对称性:G(r⃗;r⃗′)=G(r⃗′;r⃗)G(\vec{r};\vec{r}')=G(\vec{r}';\vec{r})G(r ;r ′)=G(r ′;r ). 调和函数 下面讨论调和方程和调和函数. 调和方程为 ∇2u(r⃗)=0\nabla^2u(\vec{r})=0 ∇2u(r )=0 其解为调和函数. 我们已经知道 ∇2G(r⃗;r⃗′)=−δ(r⃗−r⃗′)\nabla^2G(\vec{r};\vec{r}')=-\delta(\vec{r}-\vec{r}')∇2G(r ;r ′)=−δ(r −r ′) 的解是 G(r⃗;r⃗′)=14π∣r⃗−r⃗′∣G(\vec{r};\vec{r}')=\frac{1}{4\pi|\vec{r}-\vec{r}'|} G(r ;r ′)=4π∣r −r ′∣1​ 两个方程交叉相乘再相减,再利用 Green 公式, u(r⃗′)=∬Σu(r⃗)dΣr4π∣r⃗−r⃗′∣2+∬Σ∇u⋅dΣ⃗4π∣r⃗−r⃗′∣u(\vec{r}')=\iint_\Sigma\frac{u(\vec{r})\text{d}\Sigma_r}{4\pi|\vec{r}-\vec{r}'|^2}+\iint_\Sigma\frac{\nabla u\cdot\text{d}\vec{\Sigma}}{4\pi|\vec{r}-\vec{r}'|} u(r ′)=∬Σ​4π∣r −r ′∣2u(r )dΣr​​+∬Σ​4π∣r −r ′∣∇u⋅dΣ ​ 取 Σ\SigmaΣ 是以 r⃗′\vec{r}'r ′ 为球心、半径 RRR 的球面,那么 u(r⃗′)=14πR2∬Σu(r⃗)dΣ+14πR∬∇u⋅dΣ⃗u(\vec{r}')=\frac{1}{4\pi R^2}\iint_\Sigma u(\vec{r})\text{d}\Sigma+\frac{1}{4\pi R}\iint\nabla u\cdot\text{d}\vec{\Sigma} u(r ′)=4πR21​∬Σ​u(r )dΣ+4πR1​∬∇u⋅dΣ 后一项为零 (无通量),得到调和函数在某一点的平均值公式: u(r⃗′)=14πR2∬Σu(r⃗)dΣ,Σ:∣r⃗−r⃗′∣=Ru(\vec{r}')=\frac{1}{4\pi R^2}\iint_\Sigma u(\vec{r})\text{d}\Sigma,\quad \Sigma : |\vec{r}-\vec{r}'|=R u(r ′)=4πR21​∬Σ​u(r )dΣ,Σ:∣r −r ′∣=R 三维无界 Helmholtz 方程的 Green 函数 求三维无界空间 Helmholtz 方程的 Green 函数: ∇2G(r⃗;r⃗′)+k2G(r⃗;r⃗′)=−1ε0δ(r⃗−r⃗′),k>0\nabla^2G(\vec{r};\vec{r}')+k^2G(\vec{r};\vec{r}')=-\frac{1}{\varepsilon_0}\delta(\vec{r}-\vec{r}'),\quad k>0 ∇2G(r ;r ′)+k2G(r ;r ′)=−ε0​1​δ(r −r ′),k>0 先平移原点到 r⃗′\vec{r}'r ′,之后定义 G(r⃗;r⃗′)≡g(ξ,η,ζ)G(\vec{r};\vec{r}')\equiv g(\xi,\eta,\zeta)G(r ;r ′)≡g(ξ,η,ζ): ∇ξ,η,ζ2g(ξ,η,ζ)+k2g(ξ,η,ζ)=−1ε0δ(ξ)δ(η)δ(ζ)\nabla^2_{\xi,\eta,\zeta}g(\xi,\eta,\zeta) + k^2g(\xi,\eta,\zeta) = -\frac{1}{\varepsilon_0}\delta(\xi)\delta(\eta)\delta(\zeta) ∇ξ,η,ζ2​g(ξ,η,ζ)+k2g(ξ,η,ζ)=−ε0​1​δ(ξ)δ(η)δ(ζ) 然后将这个直角坐标的方程换成球坐标的,这里有对称性,g(ξ,η,ζ)=f(R)g(\xi,\eta,\zeta)=f(R)g(ξ,η,ζ)=f(R). 方程变为零阶 Bessel 方程: 1R2ddR[R2df(R)dR]+k2f(R)=0\frac{1}{R^2}\frac{\text{d}}{\text{d}R}\left[R^2\frac{\text{d}f(R)}{\text{d}R}\right]+k^2f(R)=0 R21​dRd​[R2dRdf(R)​]+k2f(R)=0 通解为 f(R)=AeikRR+Be−ikRRf(R)=A\frac{e^{\text{i}kR}}{R}+B\frac{e^{-\text{i}kR}}{R} f(R)=AReikR​+BRe−ikR​ 仅考虑发散波,同时利用 R=0R=0R=0 邻域内的小球积分,得到 f(R)=14πε0eikRR⟹G(r⃗;r⃗′)=14πε0eik∣r⃗−r⃗′∣∣r⃗−r⃗′∣f(R)=\frac{1}{4\pi\varepsilon_0}\frac{e^{\text{i}kR}}{R}\Longrightarrow G(\vec{r};\vec{r}')=\frac{1}{4\pi\varepsilon_0}\frac{e^{\text{i}k|\vec{r}-\vec{r}'|}}{|\vec{r}-\vec{r}'|} f(R)=4πε0​1​ReikR​⟹G(r ;r ′)=4πε0​1​∣r −r ′∣eik∣r −r ′∣​ 提示 也可以用三维 Fourier 变换来做,解得 G(κ⃗)=1ε0(2π)3/2(∣κ⃗∣2−k2)G(\vec{\kappa}) = \frac{1}{\varepsilon_0(2\pi)^{3/2}(|\vec{\kappa}|^2-k^2)} G(κ )=ε0​(2π)3/2(∣κ ∣2−k2)1​ 含时的 Green 函数 讲义上的做法是错的! 对于下面问题: [∂2∂t2−a2∂2∂x2]G(x,−t;x′′,−t′′)=δ(x−x′′)δ(t−t′′)G(x,−t;x′′,−t′′)∣x=0=0,G(x,−t;x′′,−t′′)∣x=l=0G(x,−t;x′′,−t′′)∣−t<−t′′=0,∂G(x,−t;x′′,−t′′)∂t∣−t<−t′′=0\begin{aligned} &\left[\frac{\partial^2}{\partial t^2}-a^2\frac{\partial^2}{\partial x^2}\right]G(x,-t;x'',-t'')=\delta(x-x'')\delta(t-t'')\\\\ &G(x,-t;x'',-t'')\big|_{x=0}=0,\quad G(x,-t;x'',-t'')\big|_{x=l}=0\\\\ &G(x,-t;x'',-t'')\big|_{-t<-t''}=0,\quad \left.\frac{\partial G(x,-t;x'',-t'')}{\partial t}\right|_{-t<-t''}=0 \end{aligned} ​[∂t2∂2​−a2∂x2∂2​]G(x,−t;x′′,−t′′)=δ(x−x′′)δ(t−t′′)G(x,−t;x′′,−t′′) ​x=0​=0,G(x,−t;x′′,−t′′) ​x=l​=0G(x,−t;x′′,−t′′) ​−t<−t′′​=0,∂t∂G(x,−t;x′′,−t′′)​ ​−t<−t′′​=0​ 时间的流动是有方向性的,因果关系不能倒易. 因此要重新研究 Green 函数的对称性: G(x′,−t′;x′′,−t′′)−G(x′′,t′′;x′,t′)=∫0ldx∫0∞[G(x,−t;x′′,−t′′)∂2G(x,t;x′,t′)∂t2−G(x,t;x′,t′)∂2G(x,−t;x′′,−t′′)∂t2]dt=∫0l[G(x′,−t′;x′′,−t′′)∂G(x,t;x′,t′)∂t−G(x,t;x′,t′)∂G(x,−t;x′′,−t′′)∂t]0∞dx−a2∫0∞[G(x,−t;x′′,−t′′)∂G(x,t;x′,t′)∂x−G(x,t;x′,t′)\begin{aligned} &G(x',-t';x'',-t'') - G(x'',t'';x',t')\\\\ &= \int_0^l\text{d}x\int_0^\infty\Big[G(x,-t;x'',-t'')\frac{\partial^2G(x,t;x',t')}{\partial t^2}\\\\ &\quad-G(x,t;x',t')\frac{\partial^2G(x,-t;x'',-t'')}{\partial t^2}\Big]\text{d}t \\\\ &= \int_0^l\Big[G(x',-t';x'',-t'')\frac{\partial G(x,t;x',t')}{\partial t}\\\\ &\quad-G(x,t;x',t')\frac{\partial G(x,-t;x'',-t'')}{\partial t}\Big]^\infty_0\text{d}x\\\\ &\quad-a^2\int_0^\infty\Big[G(x,-t;x'',-t'')\frac{\partial G(x,t;x',t')}{\partial x}\\\\ &\quad-G(x,t;x',t') \end{aligned} ​G(x′,−t′;x′′,−t′′)−G(x′′,t′′;x′,t′)=∫0l​dx∫0∞​[G(x,−t;x′′,−t′′)∂t2∂2G(x,t;x′,t′)​−G(x,t;x′,t′)∂t2∂2G(x,−t;x′′,−t′′)​]dt=∫0l​[G(x′,−t′;x′′,−t′′)∂t∂G(x,t;x′,t′)​−G(x,t;x′,t′)∂t∂G(x,−t;x′′,−t′′)​]0∞​dx−a2∫0∞​[G(x,−t;x′′,−t′′)∂x∂G(x,t;x′,t′)​−G(x,t;x′,t′)​

2026/1/2
articleCard.readMore

Lesson 29 散射 (二)

期末考试 95%95\%95% 的内容: 全同粒子:fermion 和 boson 的无相互作用体系,波函数满足交换反对称和对称性;自由电子气和能带;变分法中全同粒子的相关内容. 氢原子:不考波函数,但是考很多重要概念 —— 角动量耦合 (CG 系数,考试会给出,但是会有冗余信息). 微扰论:Hamiltonian 有一个修正 H′H'H′,但是本身的 Hamiltonian 会是一个比较好解的 H0H_0H0​. 微扰论中包括一阶微扰、简并微扰和含时微扰,要记住的是简并微扰和一阶微扰分别是计算什么东西的,这是要记忆的. 变分法:单参数的变分法.

2026/1/2
articleCard.readMore

Lesson 14 积分变换

上节课讲的「分离变量法的总结」并不是复习的重点. 今天我们说积分变换. Laplace 变换 F(p)=L[f(t)]=∫0∞e−ptf(t)dtF(p) = \mathscr{L}[f(t)] = \int_0^\infty e^{-pt}f(t)\text{d}t F(p)=L[f(t)]=∫0∞​e−ptf(t)dt /Example/ 111 的 Laplace 变换: 1≒∫0∞e−ptdt=1p1\fallingdotseq\int_0^\infty e^{-pt}\text{d}t = \frac{1}{p} 1≒∫0∞​e−ptdt=p1​

2025/12/30
articleCard.readMore

Lesson 29 散射

自由电子对电磁波的散射: x⃗¨−e26πε0c3mx⃗...=emE⃗0e−iωt\ddot{\vec{x}}-\frac{e^2}{6\pi\varepsilon_0c^3m}\dddot{\vec{x}} = \frac{e}{m}\vec{E}_0e^{-\text{i}\omega t} x ¨−6πε0​c3me2​x ...​=me​E 0​e−iωt 把猜测解 x⃗=x⃗0e−iωt\vec{x}=\vec{x}_0e^{-\text{i}\omega t}x =x 0​e−iωt 代入上式,解得: x⃗0=eE⃗0m(−ω2−ie2ω36πε0c3m)=eE⃗0m(−ω2−iωα)\vec{x}_0 = \frac{e\vec{E}_0}{\displaystyle{m\left(-\omega^2-\frac{\text{i}e^2\omega^3}{6\pi\varepsilon_0c^3m}\right)}} = \frac{e\vec{E}_0}{m(-\omega^2-\text{i}\omega\alpha)} x 0​=m(−ω2−6πε0​c3mie2ω3​)eE 0​​=m(−ω2−iωα)eE 0​​ 这里的 α\alphaα 可以化为 α=2πλ⋅e2ω6πε0c2m=4πω3λ⋅e24πε0c2m=4πω3λ⋅re\alpha = \frac{2\pi}{\lambda}\cdot\frac{e^2\omega}{6\pi\varepsilon_0c^2m} =\frac{4\pi\omega}{3\lambda}\cdot\frac{e^2}{4\pi\varepsilon_0c^2m} = \frac{4\pi\omega}{3\lambda}\cdot r_e α=λ2π​⋅6πε0​c2me2ω​=3λ4πω​⋅4πε0​c2me2​=3λ4πω​⋅re​ 对于一般的电磁波而言,入射的波长肯定远远大于电子的经典半径,因此可以忽略阻尼项,电子运动是 x⃗=−eE⃗0mω2e−iωt\vec{x} = -\frac{e\vec{E}_0}{m\omega^2}e^{-\text{i}\omega t} x =−mω2eE 0​​e−iωt 根据加速度的辐射公式,散射波的辐射 E⃗=e4πε0c2r⋅n^×(n^×x⃗¨)\vec{E} = \frac{e}{4\pi\varepsilon_0c^2r}\cdot\hat{n}\times(\hat{n}\times\ddot{\vec{x}}) E =4πε0​c2re​⋅n^×(n^×x ¨) 定义夹角 β=⟨n^,E⃗0⟩\beta = \langle\hat{n},\vec{E}_0\rangleβ=⟨n^,E 0​⟩,那么具体的辐射电场强度为 (平均): E⃗=ex¨4πε0c2rsin⁡β=e2E04πε0mc2rsin⁡β\vec{E} = \frac{e\ddot{x}}{4\pi\varepsilon_0c^2r}\sin\beta = \frac{e^2E_0}{4\pi\varepsilon_0mc^2r}\sin\beta E =4πε0​c2rex¨​sinβ=4πε0​mc2re2E0​​sinβ 平均辐射能流为 sˉ=e4E0232π2ε0c3m2r2sin⁡2β=ε0cE0re22r2sin⁡2β\bar{s} =\frac{e^4E_0^2}{32\pi^2\varepsilon_0c^3m^2r^2}\sin^2\beta = \frac{\varepsilon_0cE_0r_e^2}{2r^2}\sin^2\beta sˉ=32π2ε0​c3m2r2e4E02​​sin2β=2r2ε0​cE0​re2​​sin2β 可以通过对立体角积分算出散射功率和散射截面. 微分散射截面为 dσdΩ=re22(1+cos⁡2θ)\frac{\text{d}\sigma}{\text{d}\Omega} = \frac{r_e^2}{2}(1+\cos^2\theta) dΩdσ​=2re2​​(1+cos2θ)

2025/12/30
articleCard.readMore

Lesson 28 散射 (一)

绝热近似:我们思考的是能级随着时间 (或者某个广义参数) 的变化,在广义参数的缓慢变化下,粒子会留在绝热能级上. 这时候粒子会多两个相位 —— 动力学相位 & 几何相位. 对于一个在磁场中运动的粒子,有 Berry 相位 ∮CA⃗⋅dR⃗∝Ω\oint_C\vec{A}\cdot\text{d}\vec{R}\propto\Omega ∮C​A ⋅dR ∝Ω 这是由粒子的运动轨迹决定的. 对于 Lamor 进动的模型,波函数为 χ+(t)=(cos⁡θ/2eiϕsin⁡θ/2)\chi_+(t)=\begin{pmatrix} \cos\theta/2\\e^{\text{i}\phi}\sin\theta/2 \end{pmatrix} χ+​(t)=(cosθ/2eiϕsinθ/2​) 这里的相位是 Berry 项.

2025/12/30
articleCard.readMore

Lesson 27 绝热近似

绝热近似:简单的例子是,一个人拿着一个箱子,箱子里有一个单摆. 如果人不动,那么单摆有一个固有的周期,这就是系统内部的某种时间尺度. 但是人在移动 (不管是在走动,还是随着地球转动),也有一个外在的时间尺度. 如果两个时间尺度相差比较大,那么可以做某些好的近似. 在量子力学的 adiabatic approximation 中,一般考虑的是内部的时间尺度远远短于外部的时间尺度. /Example/ 一个摆长变短的单摆 (摆线被某个人往上提). 单摆的周期是 ω=gL\omega = \sqrt{\frac{g}{L}} ω=Lg​ ​ 如果人拉绳比较快,那么整个运动会变成一个混沌的过程;但是如果拉绳足够慢,那每一个周期之内摆长还可以视作一个定值. 整体的频率随着时间有一个缓慢变化: ω(t)=gL(t)\omega(t)=\sqrt{\frac{g}{L(t)}} ω(t)=L(t)g​ ​ 绝热定理:如果初态在某一个本征态,并且影响系统的参数变化很慢,那么之后的演化也一直在这个本征态上. 在实践中,对于一个二能级系统,我们可以加入一个失谐 Δ=ωL−ωg\Delta = \omega_L-\omega_gΔ=ωL​−ωg​,并绝热地增大这个失谐量,下面那个能级逐渐升高,然后逐渐地经过上面那个能级的位置,之后超过这个能级 —— 此过程中,绝热能级永远是下面的那个能级,也就是粒子会留在更低的那个能级,这就实现了把布居数翻转到另一个能级上. Q:如果我一开始不小心给了一个很大的失谐,现在下面那个能级已经超过上面那个能级了,如果在这时候调小失谐量,能不能达到同样的效果? 仍然是可以的,因为向下移动的过程中,绝热能级一直是上面的那一个. 数学上的绝热条件: ∣⟨m(t)∣H˙(t)∣n(t)⟩[Em(t)−En(t)]2∣≪ℏ−1,m≠n\left|\frac{\langle m(t)|\dot{H}(t)|n(t)\rangle}{[E_m(t)-E_n(t)]^2}\right|\ll\hbar^{-1},\quad m\neq n ​[Em​(t)−En​(t)]2⟨m(t)∣H˙(t)∣n(t)⟩​ ​≪ℏ−1,m=n /Example/ 考虑突然把一个无限深势阱从 aaa 变为 2a2a2a. 那么原来的波函数还没来得及反应,会成为新的系统中很多个激发态的叠加.

2025/12/24
articleCard.readMore

Lesson 14 Dynamics of biological networks (2)

生物网络: 直接物理交互:比如核糖体附着在 DNA 上 相关性:有相关性的不同分子或者细胞器 …… 上面的这些内容整体上可以组成一个「图」,图中可以存在加权重的连接等等. 一维正反馈效应: d[x]dt=v[x]nKdn+[x]n−d⋅[x]\frac{\text{d}[x]}{\text{d}t}=v\frac{[x]^n}{K_d^n+[x]^n} - d\cdot[x] dtd[x]​=vKdn​+[x]n[x]n​−d⋅[x] 这个方程很明显难以得到解析的解,而且其解析解的实际意义也并不大. 事实上,我们更倾向于考虑分析这个方程的稳定性. 也就是对于 dx∗/dt=f(x∗)\text{d}x^*/\text{d}t=f(x^*)dx∗/dt=f(x∗) 这样的情况,分析 x=x∗+δxx = x^*+\delta xx=x∗+δx 造成的结果. 稳定态和不稳定态之间存在「分叉」. 提示 我认为,这里的一维方程分叉和理论力学混沌理论中的 Logistic 映射可能有类似的机制. 基因开关:考虑某个基因被抑制的概率为 pb(c)=cncn+Kdnp_b(c)=\frac{c^n}{c^n+K_d^n} pb​(c)=cn+Kdn​cn​ (仍然取一个 Hill 反应的形式.) 转录对应的方程为 dudt=−u+α1+vn,dvdt=−v+α1+un\frac{\text{d}u}{\text{d}t} = -u+\frac{\alpha}{1+v^n},\quad\frac{\text{d}v}{\text{d}t}=-v+\frac{\alpha}{1+u^n} dtdu​=−u+1+vnα​,dtdv​=−v+1+unα​ 一共有两个基因,这是无量纲化的方程. 我们期望先找到不动点,也就是系统长时演化之后的情况;之后在不动点附近展开. u0=α1+v0n,v0=α1+u0n⟹ddt(δuδv)=(fufvgugv)(δxδy)u_0=\frac{\alpha}{1+v_0^n},\quad v_0=\frac{\alpha}{1+u_0^n}\Longrightarrow\frac{\text{d}}{\text{d}t}\begin{pmatrix} \delta u\\\delta v \end{pmatrix}=\begin{pmatrix} f_u&f_v\\g_u&g_v \end{pmatrix}\begin{pmatrix} \delta x\\\delta y \end{pmatrix} u0​=1+v0n​α​,v0​=1+u0n​α​⟹dtd​(δuδv​)=(fu​gu​​fv​gv​​)(δxδy​) 这个系数矩阵 (Jacobi Matrix) 给出两个本征值,它们的正负表现了两个不动点的稳定性,可能出现鞍点、旋进或者旋出的不同情况. 对于一个非常复杂的大型生物网络,我们的处理哲学是「Less is More」,期望达到的效果是把不重要的成分全部丢掉. 操作中类似于统计方法中的 kkk - NN,用周围的状态给这个网格节点投票,决定其下一个步骤的演化. 这样的主干道径迹就是一种所谓的吸引子,对于生物而言,甚至可以是一个吸引盆,生物网络的稳定性是非常好的. 这种稳健的特性本质上来源于网络自身的连接方式. 遗憾的是这样的理论取得的成果并不好... 因为我们并没有通过这个理论来解答很多实际问题,这是一个悲伤的故事;不过这样的事情也是常见的.

2025/12/23
articleCard.readMore

Lesson 13 分离变量法总结

内积空间与函数空间 /Definition/ (函数空间完备性) 如果由空间内函数组成的 Cauchy 序列的极限仍保持在该空间内,那么称为该空间是完备的. 平方可积函数空间是完备的. 把完备的内积空间称为 Hilbert 空间;物理上常用可数的 Hilbert 空间. 函数内积定义的推广: (f1,f2)=∫f1(x)f2(x)ρ(x)dx(f_1,f_2) = \int f_1(x)f_2(x)\rho(x)\text{d}x (f1​,f2​)=∫f1​(x)f2​(x)ρ(x)dx Hilbert 空间的任意函数可以按照相应正交完备基展开: f(x)=∑i=1∞cifi(x)f(x) = \sum_{i=1}^\infty c_if_i(x) f(x)=i=1∑∞​ci​fi​(x) 展开系数是唯一的. /Definition/ (广义函数) 确定在某些具体函数空间上的线性连续泛函为广义函数,这些具体的函数空间叫做基本空间. 基本空间有很多具体要求,例如如果是一个函数序列 {φn(x)}\{\varphi_n(x)\}{φn​(x)} 构成基本空间,要求 φn(x)∈C∞\varphi_n(x)\in C^\inftyφn​(x)∈C∞ 以及任意阶导数构成的序列趋于零等等. /Definition/ (δ\deltaδ 函数) δ\deltaδ 函数 (Dirac δ\deltaδ 函数) 满足:对于任意 Hilbert 空间的连续函数 f(x)f(x)f(x),均有 ∫−∞∞f(x)δ(x)dx=f(0)\int_{-\infty}^\infty f(x)\delta(x)\text{d}x = f(0) ∫−∞∞​f(x)δ(x)dx=f(0) δ\deltaδ 函数是偶函数; δ′\delta'δ′ 是奇函数; ∫−∞∞δ(t)dt=θ(x)\displaystyle{\int_{-\infty}^\infty\delta(t)}\text{d}t=\theta(x)∫−∞∞​δ(t)dt=θ(x) (阶跃函数) 有关系:g(x)δ(0)=g(0)δ(x)g(x)\delta(0)=g(0)\delta(x)g(x)δ(0)=g(0)δ(x). 原则上不应该取 g(x)=0g(x)=0g(x)=0 这种,因为之后可能还要做一些操作或者其他计算,有 g(x)=0g(x)=0g(x)=0 会产生一些影响. δ[g(x)]=δ(x−x0)∣g′(x0)∣\displaystyle{\delta[g(x)] = \frac{\delta(x-x_0)}{|g'(x_0)|}}δ[g(x)]=∣g′(x0​)∣δ(x−x0​)​,其中 g(x0)=0g(x_0)=0g(x0​)=0 且 g′(x0)≠0g'(x_0)\neq0g′(x0​)=0. 一个神必小技巧是,δ(x)\delta(x)δ(x) 自身的变换非常像 (dx)−1(\text{d}x)^{-1}(dx)−1 的变换. δ\deltaδ 函数的一个重要形式: δ(x)=12π∫−∞∞eikxdk\delta(x)=\frac{1}{2\pi}\int_{-\infty}^\infty e^{\text{i}kx}\text{d}k δ(x)=2π1​∫−∞∞​eikxdk 这是一个 Fourier 变换. 一般用连续函数来取极限得到 δ\deltaδ 函数,要「后算极限」,也就是先做完别的计算之后,最后取极限;同理,用连续函数的积分来表达 δ\deltaδ 函数,应该要「后算积分」. /Example/ 求解方程: 1x2ddx(x2dydx)−l(l+1)x2y=δ(x−c)\frac{1}{x^2}\frac{\text{d}}{\text{d}x}\left(x^2\frac{\text{d}y}{\text{d}x}\right)-\frac{l(l+1)}{x^2}y = \delta(x-c) x21​dxd​(x2dxdy​)−x2l(l+1)​y=δ(x−c) 边界 y(a)=y(b)=0y(a)=y(b)=0y(a)=y(b)=0,0<a<c<b0<a<c<b0<a<c<b.

2025/12/22
articleCard.readMore

Lesson 26 变分法 (二)

变分法来源于能量是波函数的泛函: δε=⟨ψ∣H∣ψ⟩\delta\varepsilon=\langle\psi|H|\psi\rangle δε=⟨ψ∣H∣ψ⟩ 能量的近似值就是泛函的极值.

2025/12/22
articleCard.readMore

Lesson 14 Spatial Statistics

提示 Quizzes 天文学上有哪些常见的时序数据类型? 周期性;爆发性;啁啾型;随机的信号 (后一时刻信号取决于前一时刻的) 我们在处理时序数据的时候会遇到哪些比较常见的问题? 噪声、采样是不规则的、数据中存在探测极限 / 测量误差... 下面有关 Fourier 分析的表述哪些是对的? 将函数分解为三角函数的和 短时的信号表达低频信息 方便分析周期性数据 功率谱展示了每种频率的信号强度 如果数据是实数,那么变换也是实数 选 a., c., d.. 什么是 convolution theorem? 时域的卷积是频域的乘法,反之亦然. 下面有关离散 Fourier 变换的表述哪些是对的? 用在有限的数据集上 Nyquist 频率是能够探测的最低频率 Nyquist 频率的定义是采样的最高频率 如果在时域采样更密,那么能够减少我们 aliasing 的问题 FFT 是一个有效的获得 DFT 的估算算法 选 a., c.. FFT 是一个严格的算法,不是估算. 下列有关周期图的说法正确的是? 它等价于 Fourier 变换得到的功率谱 周期图可以处理有误差的数据,但是 Fourier 变换实际上并不可以. 周期图上的峰代表了一个很强的频率 选 b.. 下列有关时间频率分析的说法正确的是? 它们能够展示信号中有哪些频率 谱图能够用一个窗口来进行 Fourier 变换 小波分析是局域的 …… 选 a., b., c.. 小波功率谱告诉我们什么信息? 在给定时间内,它给出在时间、频率的二维图上的强度. 什么是随机过程?给一个例子. 它在短时间内有小的关联,但是长时间完全是随机的变化. 比如一个恒星的光度变化,短时间来看后一个时刻的光度和前一个时刻相关,但是长时无关联. 相关函数的有关表述: 关联函数是功率谱在时域上的对应 自关联函数是自身和一段时间后的自身的关联 这正是定义 …… 选 a., b.. 今天我们讲空间统计 (Spatial Statistics) —— 它和时序统计的区别在于,维数和物理含义不同. 字面上讲,空间统计描述的是空间中一个点集的分布. Point Catalogs:比如宇宙网络结构 Non-Euclidean Space:比如在偏振空间的某种分布 Non-scalar Fields:比如说速度场、电磁场等等 Gridded Fields:格点上的空间统计 这些内容主要是宇宙学的角度. Spatial Clustering Description 最 naïve 的想法就是「数数」. 我们数出每个 bins 里面点的个数,这里的参量是数密度 n≡N/Vn\equiv N/Vn≡N/V. 平均数密度: nˉ≡⟨n⟩=⟨N⟩V\bar{n} \equiv\langle n\rangle = \frac{\langle N\rangle}{V} nˉ≡⟨n⟩=V⟨N⟩​ 定义 overdensity: δ≡n−nˉnˉ=N−⟨N⟩⟨N⟩\delta\equiv\frac{n-\bar{n}}{\bar{n}} = \frac{N-\langle N\rangle}{\langle N\rangle} δ≡nˉn−nˉ​=⟨N⟩N−⟨N⟩​ δ\deltaδ 的符号就表达了某处的数量跟平均值相比是多了还是少了. CiC (Counts in Cells):数格子,方差为 σV2≡Var(δV)=Var(N)/⟨N⟩2\sigma_V^2 \equiv \text{Var}(\delta_V)=\text{Var}(N)/\langle N\rangle^2 σV2​≡Var(δV​)=Var(N)/⟨N⟩2 对于一个随机过程,符合 Poisson 分布,其方差等于均值,所以上面的方差是 σV2=⟨N⟩/⟨N⟩2=1/⟨N⟩=1/(nV)\sigma_V^2 = \langle N\rangle/\langle N\rangle^2 = 1/\langle N\rangle=1/(nV) σV2​=⟨N⟩/⟨N⟩2=1/⟨N⟩=1/(nV) 而 in general, σV2=1nV+1V2∫Vdr⃗1∫Vdr⃗2⋅ξ(∣r⃗1−r⃗2∣)\sigma_V^2 = \frac{1}{nV}+\frac{1}{V^2}\int_V\text{d}\vec{r}_1\int_V\text{d}\vec{r}_2\cdot\xi(|\vec{r}_1-\vec{r}_2|) σV2​=nV1​+V21​∫V​dr 1​∫V​dr 2​⋅ξ(∣r 1​−r 2​∣) 可以看作是格子之间的方差和格子内部的方差,ξ\xiξ 被称为两点关联函数. 两点关联函数的含义是,任意找两个在 r⃗1\vec{r}_1r 1​ 和 r⃗2\vec{r}_2r 2​ 的体积元,它们中可能有点、可能没有点,关联函数描述它们俩之间能够形成多少个点对. ξ>0\xi>0ξ>0 表示关联,ξ=0\xi=0ξ=0 表示无关联,ξ<0\xi<0ξ<0 表示负相关. 自相关函数: ξ(r⃗)=⟨δ(r⃗)δ(r⃗+Δr⃗)⟩\xi(\vec{r})=\langle\delta(\vec{r})\delta(\vec{r}+\Delta\vec{r})\rangle ξ(r )=⟨δ(r )δ(r +Δr )⟩ 为什么不同坐标的 nˉ\bar{n}nˉ 是不均匀的?因为不同方向的观测条件实际上是不同的,比如银心方向和另一方向的亮度和干扰就完全不一样,构成一种选择效应. 解决方法是,按照我们已经知道的 mask 和误差分布等等,进行随机大量撒点,因为我们的目标是研究真实的分布和一个随机分布的差别. 这里随机撒点的数量应该要大幅多于真实的 data,为了得到更加精确的结果. 有了随机分布的点 + 真实 data 之后,我们要做的事情是数点对的个数:以某个 data 点为中心,某种半径 r→r+drr\to r+\text{d}rr→r+dr 画环形区域,得到这个环形区域内有多少个 data 点,这个数是所谓的 data-data pair;同理,可以以某个 random 点为中心,得到 random-random pair;最后还有一个以 data 点为中心、环形区域内两种点的总个数 data-random pair. 这三种 pair 记为 DD^\widehat{DD}DD 、RR^\widehat{RR}RR 、DR^\widehat{DR}DR . 对它们做权重估计: DD=DD^ND(ND−1)/2,RR=RR^NR(NR−1)/2,DR=DR^NDNRDD = \frac{\widehat{DD}}{N_D(N_D-1)/2},\quad RR = \frac{\widehat{RR}}{N_R(N_R-1)/2},\quad DR=\frac{\widehat{DR}}{N_DN_R} DD=ND​(ND​−1)/2DD ​,RR=NR​(NR​−1)/2RR ​,DR=ND​NR​DR ​ 有以下几种 estimator: "Natural" Estimator (Peebles - Hauser): ξ^PH=DDRR−1\hat{\xi}_{\text{PH}} = \frac{DD}{RR}-1 ξ^​PH​=RRDD​−1 它对于边界非常敏感,但是比较简单. Landy - Szalay (LS) Estimator: ξ^LS=DD−2DR+RRRR\hat{\xi}_{\text{LS}}=\frac{DD-2DR+RR}{RR} ξ^​LS​=RRDD−2DR+RR​ 能够处理好边缘的效应,是目前最常用的手段. Hamilton Estimator: ξ^Ham=DD⋅RR(DR)2−1\hat{\xi}_{\text{Ham}} = \frac{DD\cdot RR}{(DR)^2}-1 ξ^​Ham​=(DR)2DD⋅RR​−1 下图就是我们宇宙中关联函数的样子:在小尺度和大尺度呈现出两种不同 index 的幂律,中间的尖峰正是 BAO (重子声学振荡). 角向的相关函数能够表现各种极矩的性质分布,角向的分布可以用各阶 Legendre 多项式的卷积变换为一维的一条曲线 (数据压缩),不同阶数表达不同极矩,可以在一维曲线上看到二极矩、四极矩等等分布: 很多关联函数的变种: Marked 2PCF (2 particle correlation function): M(r⃗)=1+W(r⃗)1+ξ(r⃗)\mathcal{M}(\vec{r})=\frac{1+W(\vec{r})}{1+\xi(\vec{r})} M(r )=1+ξ(r )1+W(r )​ 加入权重 W(r⃗)W(\vec{r})W(r ) 的关联函数,将权重所包含的物理信息也加入了整体的关联函数中,得到更丰富的信息. 星系的速度场关联函数 / 星系的形变关联函数: 前者是矢量场的关联、后者是张量场的关联,这些数据并不是点,但是其关联函数也有非常好的信息. 另外类似的还有 Lyman-α\alphaα forest 关联等等. 代码工具: 老师自己写的 (全世界数 pair 最快的代码!): Fast Correlation Function Calculator (FCFC): Zhao et al. (2023) Corrfunc: Sinha & Garrison (2020) TreeCorr Clustering Models 下面我们来说我们到底从关联函数的空间统计中得到了什么内涵. 一百年前,人们提出了分层的宇宙结构模型 —— 这个模型到现在仍然不过时,我们确实在宇宙中观察到了超星系团 - 星系团 - 星系 - 卫星星系 - …… 的结构. Neyman-Scott processes (1953): Galaxy clusters:呈现 Poisson 分布的形式 Galaxies:在 clusters 中间以 Gaussian 分布. 在上述模型基础上,提出了 Halo Model:ξ2halo+ξ1halo\xi_{\text{2halo}}+\xi_{\text{1halo}}ξ2halo​+ξ1halo​. 模拟步骤是,先随机撒 clusters,然后在 clusters 中间随机撒 galaxies. 因为是完全随机撒 clusters,那么 halo 的关联函数 ξ2halo=0\xi_{\text{2halo}} = 0ξ2halo​=0. 而 ξ1halo\xi_{\text{1halo}}ξ1halo​ 应该取决于我们在 halo 中怎样分布星系, ξ1halo(r)∝∫ρ(x⃗)ρ(x⃗+r⃗)d3x⃗\xi_{\text{1halo}}(r)\propto\int\rho(\vec{x})\rho(\vec{x}+\vec{r})\text{d}^3\vec{x} ξ1halo​(r)∝∫ρ(x )ρ(x +r )d3x 得到的结果应该是:小尺度上关联为幂律 ∝r−1\propto r^{-1}∝r−1,大尺度上关联为 000. 当然实测的数据和模拟数据不同,实际上 2 halo term 是对暗物质分布的一种「采样」,也就是用星系的分布来表现暗物质的分布. 所以我们在上面模拟的 toy model 中得到的结果部分正确 —— 最大尺度上 2 halo term 为零;但是在中等尺度上 (超过 BAO 之后) 并不是完全正确,这个尺度上还有暗物质的一些有特征的分布. 在早期宇宙中我们可以通过 CMB 的温度分布来找到暗物质分布,这正是我们要在现在找到中等尺度暗物质 2 halo 关联函数的原因. 对于一个 Gaussian 随机场,协方差矩阵在某种程度上就是关联函数: M=⟨δ(x⃗i)δ(x⃗j)⟩\bold{M} = \langle\delta(\vec{x}_i)\delta(\vec{x}_j)\rangle M=⟨δ(x i​)δ(x j​)⟩ 定义功率谱为关联函数的 Fourier 变换, P(k⃗)=∫ξ(r⃗)eik⃗⋅r⃗d3r⃗,ξ(r⃗)=∫d3k⃗(2π)3P(k⃗)e−ik⃗⋅r⃗P(\vec{k}) = \int\xi(\vec{r})e^{\text{i}\vec{k}\cdot\vec{r}}\text{d}^3\vec{r},\quad\xi(\vec{r})=\int\frac{\text{d}^3\vec{k}}{(2\pi)^3}P(\vec{k})e^{-\text{i}\vec{k}\cdot\vec{r}} P(k )=∫ξ(r )eik ⋅r d3r ,ξ(r )=∫(2π)3d3k ​P(k )e−ik ⋅r 这样的角度看,协方差矩阵: Mij^=∫d3x⃗⋅ei(k⃗i−k⃗j)⋅x⃗⋅P(k⃗j)\hat{\bold{M}_{ij}} = \int\text{d}^3\vec{x}\cdot e^{\text{i}(\vec{k}_i-\vec{k}_j)\cdot\vec{x}}\cdot P(\vec{k}_j) Mij​^​=∫d3x ⋅ei(k i​−k j​)⋅x ⋅P(k j​) 这是对角化的一个协方差矩阵. Gaussian Random Fields:给出一个 power law 的功率谱,可以对应地画出相应的随机场,实际上 CMB 非常接近于一个 P(k)∝k−1P(k)\propto k^{-1}P(k)∝k−1 的随机场. 代码实现: def generate_grf(power_spectrum, Lbox=100, Ngrid=128, seed=42): """Generate a Gaussian random field given a power spectrum""" rng = np.random.default_rng(seed) # Generate the white noise field noise = rng.normal(size=(Ngrid, Ngrid, Ngrid)) noise_k = np.fft.fftn(noise) kx = np.fft.fftfreq(Ngrid, d=Lbox/Ngrid) * 2 * np.pi k = np.sqrt(np.add.outer(np.add.outer(kx**2, kx**2), kx**2)) # Apply power spectrum Pk = np.zeros_like(k) mask = k > 0 Pk[mask] = power_spectrum(k[mask]) delta_k = np.sqrt(Pk) * noise_k # Inverse FFT to get real-space field delta = np.fft.ifftn(delta_k).real return delta grf = generate_grf(lambda k: k**-3) # Example: power-law P(k)

2025/12/19
articleCard.readMore

Lesson 27 带电粒子和电磁场的相互作用

需要提前说明的是,这些理论仍然是「经典」的 (相对于量子力学而言),在这些理论中带电粒子服从的是质点运动的相关运动学和动力学,不表现出任何波动性;电磁场 (光波) 服从的是经典的波动力学,不表现出任何粒子性. 因此这是在经典近似下成立的理论. 近似的条件:粒子必须做宏观的运动,比如加速器中的电子运动,而不能是原子中的电子这样小的尺度. 一个任意运动的带电粒子产生的电磁场: φ(x⃗,t)=14πε0∫Vρ(x⃗′,t−rc)rdτ′,A⃗(x⃗,t)=μ04π∫Vj⃗(x⃗′,t−rc)rdτ′\varphi(\vec{x},t)=\frac{1}{4\pi\varepsilon_0}\int_V\frac{\displaystyle{\rho\left(\vec{x}',t-\frac{r}{c}\right)}}{r}\text{d}\tau',\quad\vec{A}(\vec{x},t)=\frac{\mu_0}{4\pi}\int_V\frac{\displaystyle{\vec{j}\left(\vec{x} ',t-\frac{r}{c}\right)}}{r}\text{d}\tau' φ(x ,t)=4πε0​1​∫V​rρ(x ′,t−cr​)​dτ′,A (x ,t)=4πμ0​​∫V​rj ​(x ′,t−cr​)​dτ′ 实验室系中做变换,得到 A⃗=μ0ev⃗4π(r−v⃗c⋅r⃗),φ=e4πε0(r−v⃗c⋅r⃗)\vec{A} = \frac{\mu_0e\vec{v}}{\displaystyle{4\pi\left(r-\frac{\vec{v}}{c}\cdot\vec{r}\right)}},\quad \varphi = \frac{e}{4\pi\varepsilon_0\displaystyle{\left(r-\frac{\vec{v}}{c}\cdot\vec{r}\right)}} A =4π(r−cv ​⋅r )μ0​ev ​,φ=4πε0​(r−cv ​⋅r )e​ 这是运动带电粒子的 Lienard - Wiechert 势. 两个变换引起的导数: ∂t′∂t=11−v⃗⋅r⃗cr,∇t′=−n^c(1−v⃗⋅n^c)\frac{\partial t'}{\partial t}=\frac{1}{\displaystyle{1-\frac{\vec{v}\cdot\vec{r}}{cr}}},\quad \nabla t' = -\frac{\hat{n}}{\displaystyle{c\left(1-\frac{\vec{v}\cdot\hat{n}}{c}\right)}} ∂t∂t′​=1−crv ⋅r ​1​,∇t′=−c(1−cv ⋅n^​)n^​ (其中 n^=r⃗/r\hat{n}=\vec{r}/rn^=r /r.) 低速近似下 (近似到最低阶),在本征系中, B⃗=ev⃗×r⃗4πε0c2r3+ev⃗˙×r⃗4πε0c2r2E⃗=er⃗4πε0r3+e4πε0c2r3r⃗×(r⃗×v⃗˙)\begin{aligned} \vec{B} &= \frac{e\vec{v}\times\vec{r}}{4\pi\varepsilon_0c^2r^3}+\frac{e\dot{\vec{v}}\times\vec{r}}{4\pi\varepsilon_0c^2r^2}\\\\ \vec{E} &= \frac{e\vec{r}}{4\pi\varepsilon_0r^3}+\frac{e}{4\pi\varepsilon_0c^2r^3}\vec{r}\times(\vec{r}\times\dot{\vec{v}}) \end{aligned} B E ​=4πε0​c2r3ev ×r ​+4πε0​c2r2ev ˙×r ​=4πε0​r3er ​+4πε0​c2r3e​r ×(r ×v ˙)​ 其中前面一项是电磁场项,后面一项是辐射项. 换系之后,辐射场为: E⃗=e4πε0rn^×[(n^−v⃗/c)×v⃗˙](1−v⃗⋅n^/c)3,B⃗=n^c×E⃗\vec{E} = \frac{e}{4\pi\varepsilon_0r}\frac{\hat{n}\times[(\hat{n}-\vec{v}/c)\times\dot{\vec{v}}]}{(1-\vec{v}\cdot\hat{n}/c)^3},\quad\vec{B}=\frac{\hat{n}}{c}\times\vec{E} E =4πε0​re​(1−v ⋅n^/c)3n^×[(n^−v /c)×v ˙]​,B =cn^​×E

2025/12/19
articleCard.readMore

Lesson 13 磁性材料 & 拓扑绝缘体

磁性物理概论 —— Wanjun JIANG 2024 年的 Nobel Prize 实际上是一个来自于「自旋玻璃」的神经网络理论. 自旋玻璃指的是在非磁性原子中掺杂少量的磁性原子,那么磁性原子因为量很少,无法形成长程序,只能存在随机的短程相互作用. 在这个基础上,Hopfield 发展了神经网络. 磁学的研究手段:离子注入、电荷流、电场、温度场、应力、自旋流、磁场、光场…… 传统的磁性材料的 Hamiltonian 是 H=∑⟨ij⟩−JSi⋅Sj−∑lB⋅SlH = \sum_{\langle ij\rangle}-J\bold{S}_i\cdot\bold{S}_j - \sum_l\bold{B}\cdot\bold{S}_l H=⟨ij⟩∑​−JSi​⋅Sj​−l∑​B⋅Sl​ 前一项是相互作用能 (Heisenberg 给出),后一项是 Zeeman 能. 现在人们研究的材料还多了一项 Dij⋅(Si×Sj)\bold{D}_{ij}\cdot(\bold{S}_i\times\bold{S}_j) Dij​⋅(Si​×Sj​) 这一项给出手性的磁相互作用. 磁性斯格明子在空间不均匀的电流下,在磁性多层膜中能够不断产生,类似于液滴,每一个斯格明子想要达成最小的表面能,所以表现出分离的粒子特性. 斯格明子在磁性薄膜中运动,会受到类似马格努斯力的作用,产生非对称的偏转. 拓扑绝缘体简介 —— Tian LIANG 注意 英语授课. 经典半导体的出现,让原来的大型计算机的晶体管被缩小为现在非常小体积的 CPU,现在的芯片大小已经越来越小. 但是拓扑绝缘体作为量子材料,能够 10 亿倍地提升计算能力. 考虑理想情况下一个无穷大的材料,那么可以计算出二维的 Bulk state;但是如果做一个截断,也就是给一个边缘,那么整体的电荷守恒不能被满足,这是 bulk state 给出的计算结果. 为了 restore 电荷守恒,要引入边缘态 edge state,两者的电荷变化率相等. 电荷变化率相等的条件给出了一个特定的数量关系,这被称为拓扑保护 —— 在扰动情况下,这些数值条件仍然要被满足,因此某些能带结构中的交点是不会改变的.

2025/12/18
articleCard.readMore

Lesson 25 变分法

微扰论的方程: c˙a(t)=−iℏHab′(t)e−iω0tcb(t),c˙b(t)=−iℏHba′(t)e+iω0tca(t)\dot{c}_a(t)=-\frac{\text{i}}{\hbar}H'_{ab}(t)e^{-\text{i}\omega_0t}c_b(t),\quad \dot{c}_b(t)=-\frac{\text{i}}{\hbar}H'_{ba}(t)e^{+\text{i}\omega_0t}c_a(t) c˙a​(t)=−ℏi​Hab′​(t)e−iω0​tcb​(t),c˙b​(t)=−ℏi​Hba′​(t)e+iω0​tca​(t) 这实际上是一种半经典的近似,因为对于量子态的描写是量子的,但是对于外界作用的描写使用 Hamiltonian,这是经典的描述. 假设驱动是共振的,ωL=ω0\omega_L=\omega_0ωL​=ω0​,Hab′∝cos⁡(ωLt)H'_{ab}\propto\cos(\omega_Lt)Hab′​∝cos(ωL​t). 这时候可以把 c˙a(t)\dot{c}_a(t)c˙a​(t) 写为 c˙a(t)≡iΩ2cb(t)\dot{c}_a(t)\equiv\text{i}\frac{\Omega}{2}c_b(t) c˙a​(t)≡i2Ω​cb​(t) (Ω\OmegaΩ 称为 Rabi 频率.) 同理, c˙b(t)=−iΩ2ca(t)\dot{c}_b(t) = -\text{i}\frac{\Omega}{2}c_a(t) c˙b​(t)=−i2Ω​ca​(t) 当 ωL−ω0≠0\omega_L-\omega_0\neq0ωL​−ω0​=0,出现失谐, c˙a(t)=iΩ2cb(t)ei(ωL−ω0)t,c˙b(t)=−iΩ2ca(t)e−i(ωL−ω0)t\dot{c}_a(t)=\text{i}\frac{\Omega}{2}c_b(t)e^{\text{i}(\omega_L-\omega_0)t},\quad \dot{c}_b(t)=-\text{i}\frac{\Omega}{2}c_a(t)e^{-\text{i}(\omega_L-\omega_0)t} c˙a​(t)=i2Ω​cb​(t)ei(ωL​−ω0​)t,c˙b​(t)=−i2Ω​ca​(t)e−i(ωL​−ω0​)t 在完全共振时的解是 ca(t)=ca(0)cos⁡∣Ω∣t2+icb(0)sin⁡∣Ω∣t2cb(t)=cb(0)cos⁡∣Ω∣t2−ica(0)sin⁡∣Ω∣t2\begin{aligned} &c_a(t) = c_a(0)\cos\frac{|\Omega|t}{2}+\text{i}c_b(0)\sin\frac{|\Omega|t}{2}\\\\ &c_b(t) = c_b(0)\cos\frac{|\Omega|t}{2}-\text{i}c_a(0)\sin\frac{|\Omega|t}{2} \end{aligned} ​ca​(t)=ca​(0)cos2∣Ω∣t​+icb​(0)sin2∣Ω∣t​cb​(t)=cb​(0)cos2∣Ω∣t​−ica​(0)sin2∣Ω∣t​​ 表现为一种旋转.

2025/12/18
articleCard.readMore

Lesson 13 Fast Radio Burst

—— Dongzi LI 我们如何看天? 大气层仅在可见光和射电波段有两个窗口,其他波段的吸收极强,所以射电天文学家不需要发射卫星 (像 X-ray 波段的学者一样),只需要在地面建设观测设施. 射电领域的机会就是所谓的致密星,也是我们今天的主题. 射电的优势是什么? 最大的光学望远镜的口径大概是 10.4 m10.4\text{ m}10.4 m,但是最大的射电望远镜是中国的 FAST,有 500 m500\text{ m}500 m 口径. 口径越大,我们的灵敏度和巡天深度就越大,现在射电天文学家探测到的信号能量甚至没有翻过一页书本的能量大. 射电技术的技术发展主要是在二战之后. 脉冲星发现之后,人们觉得它的自传速度太快了,如果按照 Newton 力学的离心力来计算,那么太阳质量的一颗恒星应该只有 15 km15\text{ km}15 km 的半径才能防止自己被撕碎,在这样的密度下,一个苹果大小的物质相当于一整座珠峰. 中子星的强磁场和高密度可以作为广义相对论和电磁理论的「试验场」,我们要做的是找到更多的双中子星系统. 但是实际上这是非常困难的,因为对于一个双星系统,其加速度会一直变化,所以我们需要的探测时间会更长、判断更加困难.

2025/12/16
articleCard.readMore

Lesson 13 Dynamics of biological networks

甲基化在放大效应中的作用:调整下式的 KdK_dKd​, X∗Xmax⁡=11+(S/Kd)n(1)\frac{X^*}{X_{\max}} = \frac{1}{1+(S/K_d)^n}\tag{1} Xmax​X∗​=1+(S/Kd​)n1​(1) 也就是接收到的信号和最终放大到的信号之间的比值是一个 Hill 函数. 甲基化使得 Hill 函数图像的快变区域变化,也就是根据测量结果来改变系统的状态,使得响应适应外界环境的变化,始终保持灵敏. 如果有 mmm 个甲基,那么根据 Boltzmann 分布律大概可以估算 Kd∝e−βΔF(m)∼eγmK_d\propto e^{-\beta\Delta F(m)}\sim e^{\gamma m} Kd​∝e−βΔF(m)∼eγm 甲基化的方程为 dmdt=VRR−VBBX∗(2)\frac{\text{d}m}{\text{d}t}=V_RR-V_BBX^*\tag{2} dtdm​=VR​R−VB​BX∗(2) (mmm 是甲基个数,VRV_RVR​ 和 VBV_BVB​ 分别是甲基化和去甲基化的作用效率.) 上述两个方程合在一起,得到每次环境发生变化时,甲基化的个数会改变到一个稳定值. 注意 也就是,甲基化是一种「memory」,表征了外界当前的背景信号是多少. 这和 Maxwell's Demon 不谋而合,记忆由外界而改变,产生熵. 甲基化的「记忆」取决于外部背景信息的倍数关系 (而不是绝对值),有 dK~dt=cK~(ass−a)\frac{\text{d}\tilde K}{\text{d}t} = c\tilde K(a_{ss}-a) dtdK~​=cK~(ass​−a) 普遍地总结是所谓的 Weber-Fechner law,也就是生物的感知系统都是感知相对变化,比如声音的单位就是分贝,这是一个对数单位.

2025/12/16
articleCard.readMore

Lesson 26 相对论中的能量和动量守恒

四维力和四维速度有关系: Fμ=ddτ(m0Uμ)F_\mu = \frac{\text{d}}{\text{d}\tau}(m_0U_\mu) Fμ​=dτd​(m0​Uμ​) 这里 τ\tauτ 是固有时间. 三维形式是, γF⃗=ddτ(γm0v⃗),γP=ddτ(γm0c2)\gamma\vec{F} = \frac{\text{d}}{\text{d}\tau}(\gamma m_0\vec{v}),\quad \gamma P = \frac{\text{d}}{\text{d}\tau}(\gamma m_0c^2) γF =dτd​(γm0​v ),γP=dτd​(γm0​c2) 从这里可以看出,无法通过动力学的方式使得某个有质量物体达到光速. 同时观察后面一个式子,我们应该可以把 γm0c2\gamma m_0c^2γm0​c2 这样一个量称为「能量」,物体的总能量正是 E=γm0c2=mc2E=\gamma m_0c^2 =mc^2 E=γm0​c2=mc2 物体的动能是其总能量减去静能量,为 K=(γ−1)m0c2K=(\gamma-1)m_0c^2K=(γ−1)m0​c2;在低速近似下,动能表达式回归到 Newton 力学的表达式,也就是 K≈12m0v2K\approx\displaystyle{\frac{1}{2}m_0v^2}K≈21​m0​v2. 但是 m0c2m_0c^2m0​c2 这一部分能量的含义是什么? 如果我们能够在实验上看到质量变化导致的能量释放,那么我们才能说这一部分静能具有物理含义,否则只是一个叠加常数罢了. 质点的四维动量及其守恒: pμ=(p⃗,iEc)p_\mu = \left(\vec{p},\frac{\text{i}E}{c}\right) pμ​=(p ​,ciE​) 四维动量的模方是一个四维标量,也就是有守恒: p2−E2c2=const.=−m02c4⟹E2=p2c2+m02c4p^2-\frac{E^2}{c^2} = \text{const.} = -m_0^2c^4\Longrightarrow E^2 = p^2c^2+m_0^2c^4 p2−c2E2​=const.=−m02​c4⟹E2=p2c2+m02​c4 (可以换到粒子的静止系中来导出后面的关系.) 对于二体衰变问题 A→B+CA\to B+CA→B+C,可以完全定解: mAc2=mB2c4+pB2c2+mC2c4+pC2c20=pB+pC\begin{aligned} m_Ac^2 &= \sqrt{m_B^2c^4+p_B^2c^2}+\sqrt{m_C^2c^4+p_C^2c^2}\\\\ 0&= p_B+p_C \end{aligned} mA​c20​=mB2​c4+pB2​c2 ​+mC2​c4+pC2​c2 ​=pB​+pC​​ 上述表达式是在 AAA 静止系中讨论的. 只要是没有自旋的标量粒子 AAA,静止系中末态的动量分布是均匀的.

2025/12/16
articleCard.readMore

Lesson 24 含时微扰

这时候的 Hamiltonian 是 H(t)=H0+H′(t)H(t)=H_0+H'(t)H(t)=H0​+H′(t). 我们只做比较简单的问题,考虑一个二能级系统的含时微扰问题. 总的波函数是 Ψ(t)=ca(t)ψae−iEat/ℏ+cb(t)ψbe−iEbt/ℏ\Psi(t)=c_a(t)\psi_ae^{-\text{i}E_at/\hbar}+c_b(t)\psi_be^{-\text{i}E_bt/\hbar} Ψ(t)=ca​(t)ψa​e−iEa​t/ℏ+cb​(t)ψb​e−iEb​t/ℏ (类似于常数变易法.) 代入 Schrödinger 方程,得到 c˙a(t)=−iℏ(Haa′ca+Hab′ei(Ea−Eb)t/ℏcb)c˙b(t)=−iℏ(Hbb′cb+Hba′e−i(Ea−Eb)t/ℏca)\begin{aligned} &\dot{c}_a(t)=-\frac{\text{i}}{\hbar}(H'_{aa}c_a+H'_{ab}e^{\text{i}(E_a-E_b)t/\hbar}c_b)\\\\ &\dot{c}_b(t)=-\frac{\text{i}}{\hbar}(H'_{bb}c_b+H'_{ba}e^{-\text{i}(E_a-E_b)t/\hbar}c_a) \end{aligned} ​c˙a​(t)=−ℏi​(Haa′​ca​+Hab′​ei(Ea​−Eb​)t/ℏcb​)c˙b​(t)=−ℏi​(Hbb′​cb​+Hba′​e−i(Ea​−Eb​)t/ℏca​)​ 令 ω≡(Eb−Ea)/ℏ\omega \equiv (E_b-E_a)/\hbarω≡(Eb​−Ea​)/ℏ. 对于大多数物理上有价值的问题,对角元都是零,所以方程化为 c˙a=−iℏHab′e−iωtcbc˙b=−iℏHba′eiωtca\begin{aligned} &\dot{c}_a = -\frac{\text{i}}{\hbar}H'_{ab}e^{-\text{i}\omega t}c_b\\\\ &\dot{c}_b = -\frac{\text{i}}{\hbar}H'_{ba}e^{\text{i}\omega t}c_a \end{aligned} ​c˙a​=−ℏi​Hab′​e−iωtcb​c˙b​=−ℏi​Hba′​eiωtca​​ 因为是微扰,所以解法是用展开的方式:我们知道 ca(0)=1c_a^{(0)}=1ca(0)​=1,cb(0)=0c_b^{(0)}=0cb(0)​=0 (最低阶情况下就在 aaa 能级上),然后 cb(1)c_b^{(1)}cb(1)​ 由 ca(0)c_a^{(0)}ca(0)​ 给出、ca(1)c_a^{(1)}ca(1)​ 由 cb(0)c_b^{(0)}cb(0)​ 给出…… 由这里可以计算 a→ba\to ba→b 跃迁的一个概率: Pa→b(t)=∣cb(1)(t)∣2=1ℏ2∣∫0tHab′(t′)eiωt′dt′∣2P_{a\to b}(t)=|c_b^{(1)}(t)|^2 = \frac{1}{\hbar^2}\left|\int_0^tH'_{ab}(t')e^{\text{i}\omega t'}\text{d}t'\right|^2 Pa→b​(t)=∣cb(1)​(t)∣2=ℏ21​ ​∫0t​Hab′​(t′)eiωt′dt′ ​2 在 t→∞t\to\inftyt→∞ 的长时近似下,实际上是一个 Fourier 变换,不为零的条件是 Hab′H'_{ab}Hab′​ 中含有和 ω\omegaω 共振的频率成分.

2025/12/16
articleCard.readMore

Lesson 13 On the Intersection between Astronomy and AI

—— Qiufan LIN (深圳鹏城实验室) 注意 本节课是一期邀请报告. 本节课的内容大量借鉴了 Yuan-Sun Ting 老师的一篇综述文章「Deep Learning in Astrophysics」. Where Have We Been So Farr? AI 这个概念最开始提出的时候并不是深度学习,而是想要创造一个系统来延展生物智能,做「人可以做的事情」. 当然现在讲的 AI 和以前讲的 AI 也是不一样的. 类别: 连结主义:模仿神经网络结构,结构决定功能 符号主义:用抽象的符号来完成逻辑规则和知识的推理 行为主义:模仿人类和环境的交互 两种学习的模式:Data-Driven (由数据驱动),也就是我们不需要加入已有的知识,而是用 AI 来学习数据、预测数据;Knowledge-Driven (知识驱动),先喂给 AI 人类已有的规则,但是问题在于知识不一定准确. ANI (Narrow)⟶AGI (General)⟶ASI (super)\text{ANI (Narrow)}\longrightarrow\text{AGI (General)}\longrightarrow\text{ASI (super)} ANI (Narrow)⟶AGI (General)⟶ASI (super) 深度学习:很深的神经网络构建. 回到天文领域,我们的理论横跨了很多个尺度,观测手段有射电波段也有光学波段,这是一个量非常大的数据集. 这恰好适于用深度学习.

2025/12/13
articleCard.readMore

Lesson 25 电磁场变换

固有时间: dτ=−1c2dxμdxμ\text{d}\tau = -\frac{1}{c^2}\text{d}x_\mu\text{d}x^\mu dτ=−c21​dxμ​dxμ 四维微商算符: ∂μ≡(∇,1ic∂∂t)\partial_\mu\equiv\left(\nabla,\frac{1}{\text{i}c}\frac{\partial}{\partial t}\right) ∂μ​≡(∇,ic1​∂t∂​) 四维速度定义为 Uμ≡γ(v⃗,ic)U_\mu\equiv\gamma\left(\vec{v},\text{i}c\right) Uμ​≡γ(v ,ic) 由四维的微商算符,可以定义 d'Alembert 算符, □2≡∂μ∂μ=∇2−1c2∂2∂t2\Box^2\equiv\partial_\mu\partial^\mu = \nabla^2-\frac{1}{c^2}\frac{\partial^2}{\partial t^2} □2≡∂μ​∂μ=∇2−c21​∂t2∂2​ 引入四维电流和四维磁矢势, jμ≡(j⃗,icρ),Aμ≡(A⃗,iφc)j_\mu\equiv(\vec{j},\text{i}c\rho),\quad A_\mu\equiv\left(\vec{A},\frac{\text{i}\varphi}{c}\right) jμ​≡(j ​,icρ),Aμ​≡(A ,ciφ​) 则电荷守恒和 Lorentz 规范分别写为 ∂μjμ=0,∂μAμ=0\partial^\mu j_\mu=0,\quad\partial^\mu A_\mu=0 ∂μjμ​=0,∂μAμ​=0 电磁学基本规律可以合并: ∇2φ−1c2∂2φ∂t2=−ρε0,∇2A⃗−1c2∂2A⃗∂t2=−μ0j⃗⟹□2Aμ=−μ0jμ\nabla^2\varphi-\frac{1}{c^2}\frac{\partial^2\varphi}{\partial t^2}=-\frac{\rho}{\varepsilon_0},\quad\nabla^2\vec{A}-\frac{1}{c^2}\frac{\partial^2\vec{A}}{\partial t^2}=-\mu_0\vec{j}\Longrightarrow \Box^2A_\mu = -\mu_0j_\mu ∇2φ−c21​∂t2∂2φ​=−ε0​ρ​,∇2A −c21​∂t2∂2A ​=−μ0​j ​⟹□2Aμ​=−μ0​jμ​ 因为电磁场场量和势之间满足关系 E⃗=−∇φ−∂A⃗∂t,B⃗=∇×A⃗\vec{E} = -\nabla\varphi-\frac{\partial\vec{A}}{\partial t},\quad \vec{B}=\nabla\times\vec{A} E =−∇φ−∂t∂A ​,B =∇×A 引入一个反对称二阶张量 Fμν=∂μAν−∂νAμF_{\mu\nu}=\partial_\mu A_\nu-\partial_\nu A_\muFμν​=∂μ​Aν​−∂ν​Aμ​,可以很好地描述电磁场场量: Fμν=(0Bz−By−iEx/c−Bz0Bx−iEy/cBy−Bx0−iEz/ciEx/ciEy/ciEz/c0)F_{\mu\nu}=\begin{pmatrix} 0&B_z&-B_y&-\text{i}E_x/c\\ -B_z&0&B_x&-\text{i}E_y/c\\ B_y&-B_x&0&-\text{i}E_z/c\\ \text{i}E_x/c&\text{i}E_y/c&\text{i}E_z/c&0 \end{pmatrix} Fμν​= ​0−Bz​By​iEx​/c​Bz​0−Bx​iEy​/c​−By​Bx​0iEz​/c​−iEx​/c−iEy​/c−iEz​/c0​ ​ 电磁场张量的变换为 Fαβ′=L  αμL  βνFμνF'_{\alpha\beta} = L^{\mu}_{\,\,\alpha}L^{\nu}_{\,\,\beta}F_{\mu\nu} Fαβ′​=Lαμ​Lβν​Fμν​ 在三维形式下,我们可以写成: {Ex′=ExEy′=γ(Ey−vBz)Ez′=γ(Ez+vBy),{Bx′=BxBy′=γ(By+vc2Ez)Bz′=γ(Bz−vc2Ey)\left\{\begin{aligned} &E_x'=E_x\\\\ &E_y'=\gamma(E_y-vB_z)\\\\ &E_z'=\gamma(E_z+vB_y) \end{aligned}\right.,\quad \left\{\begin{aligned} &B_x'=B_x\\\\ &B_y'=\gamma\left(B_y+\frac{v}{c^2}E_z\right)\\\\ &B_z'=\gamma\left(B_z-\frac{v}{c^2}E_y\right) \end{aligned}\right. ⎩ ⎨ ⎧​​Ex′​=Ex​Ey′​=γ(Ey​−vBz​)Ez′​=γ(Ez​+vBy​)​,⎩ ⎨ ⎧​​Bx′​=Bx​By′​=γ(By​+c2v​Ez​)Bz′​=γ(Bz​−c2v​Ey​)​ 矢量形式写成 E⃗′=γ(E⃗+v⃗×B⃗)−γ2γ+1v⃗c(v⃗c⋅E⃗)B⃗′=γ(B⃗−v⃗×E⃗c2)−γ2γ+1v⃗c(v⃗c⋅B⃗)\begin{aligned} &\vec{E}' = \gamma(\vec{E}+\vec{v}\times\vec{B})-\frac{\gamma^2}{\gamma+1}\frac{\vec{v}}{c}\left(\frac{\vec{v}}{c}\cdot\vec{E}\right)\\\\ &\vec{B}' = \gamma\left(\vec{B}-\frac{\vec{v}\times\vec{E}}{c^2}\right)-\frac{\gamma^2}{\gamma+1}\frac{\vec{v}}{c}\left(\frac{\vec{v}}{c}\cdot\vec{B}\right) \end{aligned} ​E ′=γ(E +v ×B )−γ+1γ2​cv ​(cv ​⋅E )B ′=γ(B −c2v ×E ​)−γ+1γ2​cv ​(cv ​⋅B )​ 由此,利用 Lorentz 公式可以引入四维力密度: fμ=(ρE⃗+j⃗×B⃗,icW)f_\mu = \left(\rho\vec{E}+\vec{j}\times\vec{B},\frac{\text{i}}{c}W\right) fμ​=(ρE +j ​×B ,ci​W)

2025/12/11
articleCard.readMore

Lesson 12 超导

高温超导铁磁体 —— Ding ZHANG 超导电性 BCS 理论的直观解释是,一个电子在前进过程中,会把周围的晶格拉动,周围产生一个正电荷云,使得可以和另一个电子成对,这就是 Cooper 对. 它们的波函数写为 ψ(r1,r2)=∑gk⃗cos⁡[k⃗(r1−r2)]\psi(r_1,r_2)=\sum g_{\vec{k}}\cos\left[\vec{k}(r_1-r_2)\right] ψ(r1​,r2​)=∑gk ​cos[k (r1​−r2​)] 为什么要配对?因为配对会使得能量降低,原本所有电子都要填在各自的能量态上,一直到 Fermi 能,但是配对之后可以作为一个整体填在某一个态上,使得总的能量降低. 在这样的配对中,要求两个电子必须处于 singlet,也就是 12(↑↓−↓↑)\displaystyle{\frac{1}{2}(\uparrow\downarrow-\downarrow\uparrow)}21​(↑↓−↓↑). 但是现在的研究中,我们发现了一些高温超导铁磁体. 原本如果处于自旋单态就不可能有磁性,所以这里的电子对自旋应该是三重态的状态,这是新的物理. Landau 提出超导体整体的波函数概念,ψ=neiϕ\psi=\sqrt{n}e^{\text{i}\phi}ψ=n ​eiϕ,这里 nnn 取决于电子数. 隧穿效应:Josephson 利用 BCS 理论推算出,在没有电压 (不给初始能量) 的情况下,Cooper 对电子能够直接隧穿,产生一个不为零的电流. Feynman 用二能级系统来解释: iℏddt(ψ1ψ2)=(μ1tsμ2)(ψ1ψ2)\text{i}\hbar\frac{\text{d}}{\text{d}t}\begin{pmatrix} \psi_1\\\psi_2 \end{pmatrix}=\begin{pmatrix} \mu_1&t\\s&\mu_2 \end{pmatrix}\begin{pmatrix} \psi_1\\\psi_2 \end{pmatrix} iℏdtd​(ψ1​ψ2​​)=(μ1​s​tμ2​​)(ψ1​ψ2​​) 在超导系统中「拍电影」 —— Lexian YANG 考虑单晶材料中的电子,我们可以研究:超导材料、拓扑物态、拓扑超导材料、关联电子材料等等. 利用的是角分辨光电子能谱. 类似 STM (扫描隧道显微镜),可以用角分辨光电子能谱的光斑在样品上扫描,实现整个表面的建模;另外,可以在扫描之前注入泵浦光,研究光致反应. 能带结构:理论上我们画出的能带结构是条状的,但是实验上的材料呈现的能带结构是线状. 如果 Fermi 能穿过了某个能带,就把两个带导通,这个材料就是导体;反之为绝缘体,如果两个带相近就是半导体. 在超导体中,原本完好的能带可能分裂,产生能隙的结构. 拓扑材料的研究理念是,不管能带的形状是什么样,只要具有能隙,就认为这两个材料之间的结构是相似的. 对于 Bi4Br4\text{Bi}_4\text{Br}_4Bi4​Br4​ 这类表面系统,测量不同方向的表面性质,发现不同方向测量到的表面性质能带结构完全不同,二维表面态是绝缘的,但是边界的态是导通的.

2025/12/10
articleCard.readMore

Lesson 23 Zeeman Effect

「二十年前我认识了一个在 Coca Cola 公司做光谱的化学家,他们做质量检测的方式就是用光谱来做,这样能够不消耗样品.」 加一个均匀的磁场,造成一个额外的 Hamiltonian HZ′=−(μ⃗1+μ⃗2)⋅B⃗extH'_Z=-(\vec{\mu}_1+\vec{\mu}_2)\cdot\vec{B}_{\text{ext}}HZ′​=−(μ ​1​+μ ​2​)⋅B ext​ (分别是轨道角动量和自旋角动量产生的磁矩). HZ′=e2m(L⃗+2S⃗)⋅B⃗extH_Z'=\frac{e}{2m}(\vec{L}+2\vec{S})\cdot\vec{B}_{\text{ext}} HZ′​=2me​(L +2S )⋅B ext​ 轨道角动量和自旋角动量的旋磁比相差两倍,e/2me/2me/2m 记为 μB\mu_BμB​ (Bohr 磁子). 对于 B⃗ext\vec{B}_{\text{ext}}B ext​ 沿着 zzz 方向的情况,写成 HZ′=μB(Lz+2Sz)BextH_Z'=\mu_B(L_z+2S_z)B_{\text{ext}}HZ′​=μB​(Lz​+2Sz​)Bext​. EZ′=⟨nljmj∣(L+2S)⋅Bext∣nljmj⟩E_Z' = \langle nljm_j|(L+2S)\cdot B_{\text{ext}}|nljm_j\rangle EZ′​=⟨nljmj​∣(L+2S)⋅Bext​∣nljmj​⟩ 总角动量 J=L+SJ=L+SJ=L+S,用 JJJ 和 SSS 表示 LLL 为 L2=J2+S2−2J⋅S⟹(L+2S)z=(1+S⋅JJ2)JL^2=J^2+S^2-2J\cdot S\Longrightarrow (L+2S)_z=\left(1+\frac{S\cdot J}{J^2}\right)J L2=J2+S2−2J⋅S⟹(L+2S)z​=(1+J2S⋅J​)J 这个系数 1+S⋅J/J2≡gJ1+S\cdot J/J^2\equiv g_J1+S⋅J/J2≡gJ​ 称为 Landé ggg-factor, gJ=1+j(j+1)+s(s+1)−l(l+1)2j(j+1)g_J=1+\frac{j(j+1)+s(s+1)-l(l+1)}{2j(j+1)} gJ​=1+2j(j+1)j(j+1)+s(s+1)−l(l+1)​

2025/12/10
articleCard.readMore

Lesson 12 absorbing

有必要跟大家讲一讲 Maxwell's Demon. 实际上是在一个盒子里面放一块挡板,然后一个小妖精来控制这个挡板,当分子向这个挡板撞过来的时候,会推动挡板做功. 每做一次功,小妖就抽出挡板再重新放回去一次,使得挡板永远受到分子的碰撞做正功. 这样就实现了「从单一热源吸热做功,而不对外界造成任何影响.」问题出在「不对外界造成任何影响」上,小妖的记忆并没有在每一次操作之后回到初态.

2025/12/9
articleCard.readMore

Lesson 12 China Jingping Labs and Related Physics

—— Haipeng AN CJPL 在四川西昌. 为什么要在锦屏?因为那里有一条江,人们修建了一个水道穿过锦屏山,在这一段水域中放发电机来发电. 同时还有两条交通隧道. 物理学家们认为这恰好可以作为一个地下实验室的场所. CJPL 一期有三个实验,上海交大的 PandaX 实验、清华的 CDEX 实验和后面工物系加入的中微子探测实验. 二期工程的体积远远大于前面的一期工程,容纳了很多实验. CDEX 实验:是一个暗物质探测实验. 用晶体来探测暗物质粒子穿过物质时产生的相互作用信号. PandaX 实验:上海交大的暗物质探测实验,用氙来作为探测物质,记录暗物质和氙碰撞之后产生的光电效应. 实际上 CJPL-II 在 2025 年才修建完成,PandaX 在 2020 年就事先搬进了二期工程的工地里,在修建过程中一直在收集数据,直到 2024 年 PandaX 那一块区域开始装修. 二期工程预期的实验:CUPID、深地内源地质时变信息探测中心能 (这是地学实验,测量山体内部压力等等地学参数)、⋯\cdots⋯

2025/12/9
articleCard.readMore

Lesson 24 狭义相对论的速度变换

之前的推导中,「时钟」只是测量时间间隔的一种工具,实际上所有物理过程的时间尺度都会发生变化. 同时在狭义相对论的语境下,「速度」不能够很好地描述运动,取而代之的是 γ\gammaγ 因子. /Example/ 实验室中产生的 π\piπ 介子寿命是 2.56×10−8 s2.56\times10^{-8}\text{ s}2.56×10−8 s (自己的固有系中),γ=71\gamma=71γ=71. 在实验室系中飞行 6 m6\text{ m}6 m 之后,剩下来的粒子数是 NN0=exp⁡(−tγτ)≈99%\frac{N}{N_0}=\exp\left(-\frac{t}{\gamma\tau}\right)\approx99\% N0​N​=exp(−γτt​)≈99% 相较于没有 γ\gammaγ (非相对论理论) 的 ≈40%\approx40\%≈40% 的结果,可以验证相对论的正确性.

2025/12/9
articleCard.readMore

Lesson 22 微扰论

接着上节课来说非简并微扰. 实际上非简并是一种非常特殊的情况,在实际的固体中大多数系统都是简并的,能级的分布反映出这个系统的很多内禀力学 (或者电磁学) 特性. 一阶波函数 ∣n⟩≈∣n(0)⟩+λ∑m≠n⟨m(0)∣H′∣n(0)⟩En0−Em0∣m(0)⟩|n\rangle \approx |n^{(0)}\rangle+\lambda\sum_{m\neq n}\frac{\langle m^{(0)}|H'|n^{(0)}\rangle}{E_n^0-E_m^0}|m^{(0)}\rangle ∣n⟩≈∣n(0)⟩+λm=n∑​En0​−Em0​⟨m(0)∣H′∣n(0)⟩​∣m(0)⟩ 波函数只有一阶准确的时候,可观测量的准确程度可以达到二阶,因为要取模方. 上述波函数修正中,只有相邻的几个能级才有可观的效应,否则分母太大,效果变得微弱. /Example/ 加入一个微弱电场的谐振子.

2025/12/8
articleCard.readMore

Lesson 11 Bessel 函数

Bessel 函数的递推关系满足 Jν−1+Jν+1=2νxJνJ_{\nu-1}+J_{\nu+1}=\frac{2\nu}{x}J_\nu Jν−1​+Jν+1​=x2ν​Jν​ 计算积分: ∫xmJndx=xmJm,m∈Z\int x^mJ_n\text{d}x = x^mJ_m,\quad m\in\mathbb{Z} ∫xmJn​dx=xmJm​,m∈Z 仅仅在 m−n∈m-n\inm−n∈ 正奇数时整个定积分才可做,所以说之后齐次化方程的边界条件时,构造的函数要注意是不是可积. 原理在于,每一次做分部积分的时候,出来的第一项必须要是零,不然一直往下递推出现无穷求和就无法计算了. /Example/ 计算定积分: ∫01(1−x2)J0(μx)xdx\int_0^1(1-x^2)J_0(\mu x)x\text{d}x ∫01​(1−x2)J0​(μx)xdx 其中 J0(μ)=0J_0(\mu)=0J0​(μ)=0.

2025/12/5
articleCard.readMore

Lesson 12 Time Series Analysis

提示 Quizzes 什么是 truncated data?举个例子. 截断的数据,比如探测器只能探测流量在某个阈值之上的源. 实际上我们不知道阈值之下到底丢了哪些数据、丢了什么数据. 什么是 censored data?举个例子. 模糊的数据,比如探测器在某一个波段看到了某个源,但是另一个波段看不到这一个源. 实际上我们知道那里有一个源,而且我们知道它在某个波段高于阈值. 下面关于 flux-limited 样本的表述,正确的是: 更亮的源所占比例被高估了 总有一个表观的趋势 —— 更大的距离对应着更大的光度 表观的趋势一定是 biased. 如果两个本征的量是相互独立的,那么表观的量也相互独立. 选择 a., b.. 如果不考虑测量误差,密度均匀分布,那么 flux function 和光度分布完全无关,我们的阈值只是在这个 function 上做截断,不会影响 flux function 的具体形式,因此 c. 是对的. 什么是 flux-limited samples 的 Eddington bias? 有几个条件: 暗的源比亮的源多很多 测量误差存在,而且是随机分布的 这种情况下暗的源可能因为误差而被测成亮的源,反之亦然,我们会高估暗源数量. 什么是 volume-limited data? …… …… 倒数第二节课了. 时间序列指的是,我们测量一个数据随着时间的变化, (t1,y1),(t2,y2),(t3,y3),⋯(t_1,y_1),\quad(t_2,y_2),\quad(t_3,y_3),\quad \cdots (t1​,y1​),(t2​,y2​),(t3​,y3​),⋯ 测量时间序列的目的就是找到某个变量随着时间的变化,想要了解这个变化关系;同时来预测后面的可能值和可能事件. 比如恒星的光变曲线,可以预测后面的某个时间的恒星的光度是什么样的;或者统计 γ\gammaγ 射线暴在全宇宙的分布,预测这种事件出现的频率. 而且实际上时间序列并不一定要有「时间」,只要是一种二维的、两者呈现函数关系的统计分布,都可以叫做时序分析. 有几种很典型的时序数据 (狭义上的): Periodic:天鹅座 RR 变星,周期性的光变曲线 Burst:行星对后面的恒星产生微引力透镜,光稍微变亮一点点;或者是某种爆发事件. Chirp (啁啾):频率会变化的周期性结构,比如双黑洞合并的引力波事件,两者越靠近频率越高. 但是宇宙并没有上面这些数据一样 nice,比如这样的数据: 实际上这一坨是非常好的数据,虽然误差很大、被阈值所限制,但是我们经过一些分析会得到一颗极好的变星. Fourier Analysis 「Let frequencies tell the story of time.」 先来看公式: H(f)=∫−∞∞h(t)e−2πiftdt,h(t)=∫−∞∞H(f)e2πiftdfH(f)=\int_{-\infty}^\infty h(t)e^{-2\pi\text{i}ft}\text{d}t,\quad h(t)=\int_{-\infty}^\infty H(f)e^{2\pi\text{i}ft}\text{d}f H(f)=∫−∞∞​h(t)e−2πiftdt,h(t)=∫−∞∞​H(f)e2πiftdf 和我们在 中遇到的类似,用一组基函数来组合出未知的某个函数,这里的基函数恰好是三角函数. 几种常见的 Fourier 变换: 三角函数的变换是 δ\deltaδ 函数 Gauss 函数的变换是另一个 Gauss 函数 方波变换为 sin⁡x/x\sin x/xsinx/x 形式的函数 脉冲变换为新的脉冲 /Example/ 分析 2sin⁡t+sin⁡3t2\sin t+\sin 3t 2sint+sin3t

2025/12/4
articleCard.readMore

Lesson 23 狭义相对论

警告 上节课的前一天晚上北京有一颗火流星坠落,晚上查各种数据导致睡得很晚然后翘课了 qwq. 我们上节课说到,Maxwell 方程组给出了电磁波的速度,但是这意味着宇宙中存在一个绝对参考系,仅仅在这个参考系中光速是光速,其他参考系的光速是相对这个参考系的速度. Michaelson 实验表明,如果 Galileo 变换成立,那么地球参考系就是那个特殊的参考系 —— 这是地心说的残余. 所以我们要抛弃的必须是 Galileo 变换,这就是狭义相对论的产生背景. 我们认为新的变换应该是线性的: t′=αt+βxx′=γx+δt\begin{aligned} t'&=\alpha t+\beta x\\\\ x'&=\gamma x+\delta t \end{aligned} t′x′​=αt+βx=γx+δt​ (因为两个参考系的 xxx 轴重合,并沿着 xxx 方向运动,所以只有 xxx 和 ttt 存在变换关系,这来源于时空的均匀性.) 接下来利用相对速度 vvv 实现简化,对于 S′S'S′ 系中的一个静止点,在 SSS 系中我们看到它沿着 xxx 轴以 vvv 运动,得到 dxdt=v,dx′dt′=−v\frac{\text{d}x}{\text{d}t}=v,\quad \frac{\text{d}x'}{\text{d}t'}=-v dtdx​=v,dt′dx′​=−v 上述变换化简为 t′=γ(t−ηx),x′=γ(x−vt)t'=\gamma(t-\eta x),\quad x'=\gamma(x-vt) t′=γ(t−ηx),x′=γ(x−vt) 如果在这时认为时间和空间无关,那么就立即得到 Galileo 变换 —— 这在 Galileo 之后的几百年内一直被视为常识,但是现在我们需要抛弃这个前提,换成「光速不变原理」. 对于一个闪光,在 SSS 系中我们看到的是 x2+y2+z2−c2t2=0x^2+y^2+z^2-c^2t^2=0 x2+y2+z2−c2t2=0 S′S'S′ 系中光速不变,也是 x′2+y′2+z′2−c2t′2=0x'^2+y'^2+z'^2-c^2t'^2=0x′2+y′2+z′2−c2t′2=0. 考虑在 x′x'x′ 轴上发生的那一个事件,得到 t′=t−vx/c21−v2/c2,x′=x−vt1−v2/c2t'=\frac{t-vx/c^2}{\sqrt{1-v^2/c^2}},\quad x'=\frac{x-vt}{\sqrt{1-v^2/c^2}} t′=1−v2/c2 ​t−vx/c2​,x′=1−v2/c2 ​x−vt​ 正是 Lorentz 变换.

2025/12/4
articleCard.readMore

Lesson 11 量子多体系统

解码复杂性:量子多体系统与张量网络 —— 杨硕 张量网络态是多体量子态的一种简化表示,在解析上可以刻画系统内部的纠缠结构和关联性质,数值上相比传统的 Monte-Carlo,能够规避一些符号问题. 参考论文: F. Verstraete, J.I. Cirac, and V. Murg, arXiv: 0907.2796. U. Schollwoeck, arXiv: 1008.3477. R. Orus, arXiv: 1306.2164. N. Schuch, arXiv: 1306.5551. J. C. Bridgeman and C. T. Chubb, arXiv: 1603.03039. J. Biamonte and V. Bergholm, arXiv: 1708.00006. J. Hauschild, F. Pollmann, arXiv: 1805.00055. R. Orus, arXiv: 1812.04011. J.I. Cirac, D. Perez-Garcia, N. Schuch, F. Verstraete, arXiv:2011.12127. New progress (update daily) http://quattro.phys.sci.kobe-u.ac.jp/dmrg/condmat.html 这是一个日本的教授,每天读这个领域的文章然后更新这个网站. Graduate course: Selected Topics in Computational Quantum Physics 研究生课:量子物理计算方法选讲 一个张量 MijM_{ij}Mij​ 视为一个有 iii 和 jjj 两个连接头的元件,张量之间、张量与矢量之间连接,就是把它们的对应指标缩并. 奇异值分解 M=NDV+M=NDV^+M=NDV+ 表现为把一个双头元件分解为三个元件;求 trace 表现为把张量的两个头接在一起,所以 tr(MNP)\text{tr}(MNP)tr(MNP) 对应一根线上串着三个珠子,不管怎么换顺序都得到相同结果,所以张量网络直观地可以做数学计算. 同时还有张量的变形,比如我们可以用 numpy.reshape 把一个三阶张量的两个线头「捏」在一起. 在量子多体系统中,一个多体的波函数 ↑↓↓↑↑⋯\uparrow\downarrow\downarrow\uparrow\uparrow\cdots↑↓↓↑↑⋯ 可以被写成一个张量. 一个量子态可以奇异值分解为 C=USVC=USVC=USV. 其中左右的 UUU 和 VVV 都是幺正的,可以被缩并成一个 identity,整个系统被拆开,实际上所有的纠缠态信息都包含在 SSS 上. 两边的密度矩阵可以由缩并计算,最后能够算出纠缠熵: S=−tr[ρAln⁡ρA]=tr[ρBln⁡ρB]=−∑αsα2ln⁡sα2S=-\text{tr}[\rho_A\ln\rho_A]=\text{tr}[\rho_B\ln\rho_B]=-\sum_{\alpha}s_\alpha^2\ln s_\alpha^2 S=−tr[ρA​lnρA​]=tr[ρB​lnρB​]=−α∑​sα2​lnsα2​ 比如 ρ=12(1001)\rho=\frac{1}{2}\begin{pmatrix} 1&0\\0&1 \end{pmatrix} ρ=21​(10​01​) 是两个 1/21/21/2 自旋的完全纠缠态,纠缠熵为 S=−12ln⁡12−12ln⁡12=ln⁡2S=-\frac{1}{2}\ln\frac{1}{2}-\frac{1}{2}\ln\frac{1}{2}=\ln 2 S=−21​ln21​−21​ln21​=ln2 如果是 DDD 个可取的态,最大的纠缠熵是 ln⁡D\ln DlnD. 举一个例子讲奇异值分解的作用: 一张图片的像素是 A×BA\times BA×B,按照每个像素的颜色 (假设是一张黑白照片) 可以写出一个矩阵. 做奇异值分解之后,取截断,只保留最大的那些奇异值 (可以取一个截断范围),最后乘回来之后,我们得到的图片更加模糊,但是最重要的信息被保留. 面积定律:把多体量子系统中的一块区域框出来,计算里面和外面的纠缠,发现在没有能隙的系统中里面和外面的纠缠强度正比于「框」的周长. 张量网络的构建基于这个面积定律,我们先画出很多纠缠对,然后用「框」来框住我们要化为张量的单元,用投影算符把几个单元并到一起,作为一个张量. 对于一个量子多体系统,我们也用截断来处理整体的维度,按照维度奇异值分解之后,只保留最重要的 DDD 个维度,整体的波函数性质和真实的波函数应该是非常相似的,但是可变化的参数从原来的指数增长 (2D2^D2D) 变为了线性增长 (n⋅Dn\cdot Dn⋅D). 量子多体系统的非平衡物理 —— 孙志远 我们从三体运动出发 ⟹\Longrightarrow⟹ 模拟一个多体系统是不可能的. 因此在凝聚态中我们利用统计方法来研究,而且主要研究非平衡态的系统. 放大等离基元:光脉冲在其中不衰减而是放大,因为存在增益介质. 扭转激子绝缘体:有一类特殊的半导体在基态就有很多激子,我们可以实现激子的扭转,从序参量的一个态跳到另一个态. 光致超导:实验上还没有复现,但是理论上可以说明. 我们知道有电荷密度波和超导两种状态相互竞争,电荷密度波可以视为一种晶体,当超快激光加热电子时,这种「晶体」会融化,在之后的冷却过程中,电子可能形成超导态或者回到电荷密度波. 电荷密度波的能量更低,但是形成更慢,所以在高速冷却下会在体系中生长出很多小的超导态,同时因为竞争,后续的电荷密度波难以形成.

2025/12/3
articleCard.readMore

Lesson 21 能带理论

Bloch 定理:周期性波函数满足 ψ(x+a)=eiKaψ(x)\psi(x+a)=e^{\text{i}Ka}\psi(x) ψ(x+a)=eiKaψ(x) 其中这里的 KKK 并不对应动能,而是晶格所代表的空间周期的体现. 证明是考虑 Df(x)=f(x+a)Df(x)=f(x+a)Df(x)=f(x+a),利用势能的周期性 V(x)=V(x+a)V(x)=V(x+a)V(x)=V(x+a) 来计算. 如果移动了 nnn 个单元,那么 ψ(x+Na)=eiK⋅Naψ(x)\psi(x+Na)=e^{\text{i}K\cdot Na}\psi(x)ψ(x+Na)=eiK⋅Naψ(x),周期性边界条件要求 K⋅Na=2πK\cdot Na=2\piK⋅Na=2π,就能确定 K=2πnNa,n∈ZK=\frac{2\pi n}{Na},\quad n\in\mathbb{Z} K=Na2πn​,n∈Z 在经典的极限下,N→∞N\to\inftyN→∞,整个固体是连续的.

2025/12/3
articleCard.readMore

Lesson 11 Molecular Motor (3)

马达的运动,实际上动力来源于膜两侧的电化学势差, U=qV+kBTln⁡c⟹ΔU=qΔV+kBTln⁡coutcinU=qV+k_BT\ln c\Longrightarrow\Delta U=q\Delta V+k_BT\ln\frac{c_{\text{out}}}{c_{\text{in}}} U=qV+kB​Tlnc⟹ΔU=qΔV+kB​Tlncin​cout​​ 另一个与之平衡的力是 pH 值,也就是两侧的氢离子浓度差. 在两个力调节产生推动马达的力矩. 鞭毛马达:两种转动模式 —— CW 和 CCW. CCW 运动状态的时候,所有的鞭毛绕在一起,鞭毛朝同向推动细菌运动;反之,在 CW 状态,鞭毛打散,整个细菌呈现出原地打转的运动模式. 鞭毛的动力结构是一个五聚物 (应该说是鞭毛根部有很多个固定的五聚物,绕成一圈),可以看作一圈小齿轮 (也就是定子),按照同方向旋转带动中间很大的转子旋转. 当需要「换挡」的时候,中间的转子可以收缩 / 舒张,与那一圈定子内切或者外切,这样定子的转动方向不变,转子的转动方向可以改变. 同时这个系统是极为智能的,实际上固定存在的结构只有转子部分,定子仅仅在需要转动的情况下结合上去提供动力;在外界阻力大的时候,结合更多定子,输出更大的力矩. 下一种马达是 polymerization motor,它的作用是延长真核细胞的细胞骨架结构,类似于「在火车往前开的时候往前铺铁轨」,使得真核细胞呈现出一种「前推后拉」的运动模式. 生长方程: dPndt=konPn−1P1+koffPn+1−(konP1+koff)Pn\frac{\text{d}P_n}{\text{d}t}=k_{\text{on}}P_{n-1}P_1+k_{\text{off}}P_{n+1}-(k_{\text{on}}P_1+k_{\text{off}})P_n dtdPn​​=kon​Pn−1​P1​+koff​Pn+1​−(kon​P1​+koff​)Pn​ 其中 konk_{\text{on}}kon​ 和 koffk_{\text{off}}koff​ 分别是链的两端结合新的单元和解离旧的单元的速率常数. 平均长度是 ⟨L⟩=∑n=1∞naPn\langle L\rangle=\sum_{n=1}^\infty naP_n ⟨L⟩=n=1∑∞​naPn​ 我们可以计算出整体的生长速率是如何分布的. 但是我们知道一根长杆在两端受压的情况下会出现弯折,所以实际的过程中并不是一整根杆在往前推,而是把后端的杆拆掉、前端的杆生长出来,这个过程的判据来源于每个单元固有的极性和解离 / 结合的化学能差,化学能差能够推动这样的过程持续发生. 下一个单元要等到骨架端点和膜之间相隔一个单元的长度时才能挤进来结合. 骨架两端的空间涨落比较快、骨架的生长比较慢,我们在物理上处理这种系统时一般将快变变量做时间平均,这就是一种重整化群 (当然在空间上做这样的变换是一般的重整化群,但是时间上的概念实际上是一样的). 在这样的时间比较下,我们发现限速的步骤是留空间的这个步骤,也就是说下一个单元一直在等待,只要留出空间就能补上. 最后再简单说一个马达,translocation motors:这是噬菌体在将遗传物质注入细胞内部时,起主要作用的马达 (噬菌体利用的是宿主细胞自身的这种马达). 为什么细菌会把这段 DNA 拉进来? 因为结合 DNA 有很多种蛋白,它们并不会在乎结合的是什么 DNA. 本身细菌也发展出了很多免疫机制,比如我们熟知的 CHRISPER 实际上就是细菌的免疫机制之一,它会切除外来 DNA 的特定片段;在人类改进之后变为了基因编辑的一种技术. 另外一个能量来源是弹性势能:噬菌体内部的 DNA 盘旋得非常紧密,所以可以被弹出到细菌的内部.

2025/12/2
articleCard.readMore

Tianwen:The Beauty of the Cosmos

—— Di LI The Universe is governed by laws These laws are knowable to humanity Human know these laws through observation 从 Hertz 在实验上验证了电磁波的存在开始,人们逐渐开始利用更长波长的光来探测宇宙中更暗弱的事件. 以手机摄像头为例,我们用 CCD 等等传感器来探测光子,但是一旦探测到光子,光子所含有的相位信息就丢失了;取而代之的是,我们可以做 Fourier 变换,得到了更多频率信息. GBT (绿岸望远镜):100 m100\text{ m}100 m 口径的大型射电望远镜,冬天的时候上面会有很多雪,望远镜本体能够旋转过来把雪倒出来. Arecibo:300 m300\text{ m}300 m 口径 —— 这实际上是一个小小的错误,一开始 Gardan 计算出来只需要 30 m30\text{ m}30 m 就能完成他的科学目的,但是 ARPA (美国政府的科研经费部门) 认为在冷战期间应该要制造更加强大的望远镜以体现权威性,最终在一个月之内通过了 300 m300\text{ m}300 m 口径的望远镜计划. Arecibo 的里程碑事件是发现双中子星并合事件. 另一个重大发现是第一个 exoplanet system. 2020.12.01 时,Arecibo 的主结构坍塌了,「She is Gone.」

2025/12/2
articleCard.readMore

Lesson 10 连带 Legendre 函数

连带 Legendre 函数 连带 Legendre 方程: 1sin⁡θddθ[sin⁡θ⋅dΘdθ]+(λ−m2sin⁡2θ)Θ=0\frac{1}{\sin\theta}\frac{\text{d}}{\text{d}\theta}\left[\sin\theta\cdot \frac{\text{d}\varTheta}{\text{d}\theta}\right]+\left(\lambda-\frac{m^2}{\sin^2\theta}\right)\varTheta=0 sinθ1​dθd​[sinθ⋅dθdΘ​]+(λ−sin2θm2​)Θ=0 我们化为标准形式 ddz[(1−z2)dwdz]+[ν(ν+1)−m21−z2]w=0\frac{\text{d}}{\text{d}z}\left[(1-z^2)\frac{\text{d}w}{\text{d}z}\right]+\left[\nu(\nu+1)-\frac{m^2}{1-z^2}\right]w=0 dzd​[(1−z2)dzdw​]+[ν(ν+1)−1−z2m2​]w=0 上节课我们猜了一个解的形式 w(z)=(1−z2)m/2v(z)w(z) = (1-z^2)^{m/2}v(z)w(z)=(1−z2)m/2v(z). 代入之后得到了超球微分方程 (1−z2)v′′−2(m+1)zv′+[λ−m(m+1)]v=0(1-z^2)v''-2(m+1)zv'+[\lambda-m(m+1)]v=0 (1−z2)v′′−2(m+1)zv′+[λ−m(m+1)]v=0 Legendre 方程微商 mmm 次也是超球微分方程,这个结论的证明如下: 用数学归纳法,首先可以确认 m=0m=0m=0 时结论正确. 假设 m=km=km=k 时成立, (1−z2)(v(k))′′−2(k+1)z(v(k))′+[λ−k(k+1)]v(k)=0(1-z^2)(v^{(k)})''-2(k+1)z(v^{(k)})'+[\lambda-k(k+1)]v^{(k)}=0 (1−z2)(v(k))′′−2(k+1)z(v(k))′+[λ−k(k+1)]v(k)=0 再微商一次,就可以证明结论. 因此连带 Legendre 方程的解是 w(z)=c1w1(z)+c2w2(z){w1(z)=(1−z2)m/2Pν(m)(z)w2(z)=(1−z2)m/2Qν(m)(z)\begin{aligned} &w(z)=c_1w_1(z)+c_2w_2(z)\\\\ &\left\{\begin{aligned} w_1(z) &= (1-z^2)^{m/2}P_\nu^{(m)}(z)\\\\ w_2(z) &= (1-z^2)^{m/2}Q_\nu^{(m)}(z) \end{aligned}\right. \end{aligned} ​w(z)=c1​w1​(z)+c2​w2​(z)⎩ ⎨ ⎧​w1​(z)w2​(z)​=(1−z2)m/2Pν(m)​(z)=(1−z2)m/2Qν(m)​(z)​​ 注意这里要求了 l>ml>ml>m,否则求完导之后的结果是零. 现在我们得到了一个新的函数,mmm 阶 lll 次连带 Legendre 函数: Plm(x)=(−1)m(1−x2)m/2Pl(m)(x)P_l^m(x)=(-1)^m(1-x^2)^{m/2}P_l^{(m)}(x) Plm​(x)=(−1)m(1−x2)m/2Pl(m)​(x) 警告 这里不能再叫「多项式」了,因为在 mmm 为奇数时这不是一个多项式,只能叫函数. 下面研究连带 Legendre 函数的正交性: ∫−11Plm(x)Pkm(x)dx=0,k≠l\int_{-1}^1P_l^m(x)P_k^m(x)\text{d}x=0,\quad k\neq l ∫−11​Plm​(x)Pkm​(x)dx=0,k=l 证明方法和之前对于 Legendre 函数的证明几乎一样. 模方为 ∫−11Plm(x)Plm(x)dx=(l+m)!(l−m)!22l+1\int_{-1}^1P_l^m(x)P_l^m(x)\text{d}x=\frac{(l+m)!}{(l-m)!}\frac{2}{2l+1} ∫−11​Plm​(x)Plm​(x)dx=(l−m)!(l+m)!​2l+12​ 比 Legendre 函数的模方多了一个系数. 理论上这个公式不要记忆,但是写在这里: ∫−11xkPl(x)dx={2l+1(l+2n)!(l+n)!n!(2l+2n+1)!,k=l+2n,n∈N0,other\int_{-1}^1x^kP_l(x)\text{d}x = \left\{\begin{aligned} &2^{l+1}\frac{(l+2n)!(l+n)!}{n!(2l+2n+1)!},& k=l+2n, n\in\mathbb{N}\\\\ &0,&\text{other} \end{aligned}\right. ∫−11​xkPl​(x)dx=⎩ ⎨ ⎧​​2l+1n!(2l+2n+1)!(l+2n)!(l+n)!​,0,​k=l+2n,n∈Nother​ 连带 Legendre 方程存在另外的一个解,Pl−m(x)P_l^{-m}(x)Pl−m​(x),这个解并不独立,求解的关键在于确认 dl+mdxl+m(x2−1)l\frac{\text{d}^{l+m}}{\text{d}x^{l+m}}(x^2-1)^l dxl+mdl+m​(x2−1)l 最终关系为 Pl−m(x)=(−1)m(l−m)!(l+m)!Plm(x)P_l^{-m}(x)=(-1)^m\frac{(l-m)!}{(l+m)!}P_l^m(x) Pl−m​(x)=(−1)m(l+m)!(l−m)!​Plm​(x) 利用这个可以把正交关系改写为一个更加优雅的形式 (但是非常不建议使用): ∫−11Plm(x)Pl′−m(x)dx=2(−1)m2l+1δll′\int_{-1}^1P_l^m(x)P_{l'}^{-m}(x)\text{d}x=\frac{2(-1)^m}{2l+1}\delta_{ll'} ∫−11​Plm​(x)Pl′−m​(x)dx=2l+12(−1)m​δll′​ 当两个连带 Legendre 方程交叉相乘再相减时,可以得到一个新的正交关系: ∫−11PlmPlm′dx1−x2=1m(l+m)!(l−m)!δmm′\int_{-1}^1P_l^mP_l^{m'}\frac{\text{d}x}{1-x^2}=\frac{1}{m}\frac{(l+m)!}{(l-m)!}\delta_{mm'} ∫−11​Plm​Plm′​1−x2dx​=m1​(l−m)!(l+m)!​δmm′​

2025/12/1
articleCard.readMore

Lesson 20 多电子原子 & 固体

我们来讲原子. 原子中有很多电子,所以波函数应该满足交换任意两个电子都改变一个符号, Ψtotal(r⃗1,⋯ ,r⃗Z;s1,⋯ ,sZ)=ψ(r⃗1,⋯ ,r⃗Z)χ(s1,⋯ ,sZ)Ψtotal(⋯i↔j⋯ )=−Ψtotal\begin{aligned} &\Psi_{\text{total}}(\vec{r}_1,\cdots,\vec{r}_Z;s_1,\cdots,s_Z)=\psi(\vec{r}_1,\cdots,\vec{r}_Z)\chi(s_1,\cdots,s_Z)\\\\ &\Psi_{\text{total}}(\cdots i\leftrightarrow j\cdots) = -\Psi_{\text{total}} \end{aligned} ​Ψtotal​(r 1​,⋯,r Z​;s1​,⋯,sZ​)=ψ(r 1​,⋯,r Z​)χ(s1​,⋯,sZ​)Ψtotal​(⋯i↔j⋯)=−Ψtotal​​ Hamiltonian:(这是做了近似,认为核是一个没有自旋、质量无限大的正点电荷) H=∑j=1Z[−ℏ22m∇j2−(14πε0)Ze2rj]+12(14πε0)∑j<ke2∣r⃗j−r⃗k∣H=\sum_{j=1}^Z\left[-\frac{\hbar^2}{2m}\nabla_j^2-\left(\frac{1}{4\pi\varepsilon_0}\right)\frac{Ze^2}{r_j}\right]+\frac{1}{2}\left(\frac{1}{4\pi\varepsilon_0}\right)\sum_{j<k}\frac{e^2}{|\vec{r}_j-\vec{r}_k|} H=j=1∑Z​[−2mℏ2​∇j2​−(4πε0​1​)rj​Ze2​]+21​(4πε0​1​)j<k∑​∣r j​−r k​∣e2​ 后面有交叉项,表征电子之间的相互排斥. 实际上只要 Z=2Z=2Z=2 以上,就没办法得到严格解,换句话说这是一个原子核和两个电子的三体问题. 为了能够得到一个近似的解,我们强行拆开最后那一项,做平均场近似. 以 Helium 为例,在两体相互作用前面加上一个系数 α∈(0,1)\alpha\in(0,1)α∈(0,1),考察 α→0\alpha\to0α→0 的渐近行为 —— 这实际上就是求一个 Z=2Z=2Z=2 的氢原子. 在这种近似下, ψ0(r⃗1,r⃗2)=ψ100(Z=2)(r⃗1)ψ100(Z=2)(r⃗2)=Z3πa3e−Z(r1+r2)/a\psi_0(\vec{r}_1,\vec{r}_2)=\psi_{100}^{(Z=2)}(\vec{r}_1)\psi_{100}^{(Z=2)}(\vec{r}_2)=\frac{Z^3}{\pi a^3}e^{-Z(r_1+r_2)/a} ψ0​(r 1​,r 2​)=ψ100(Z=2)​(r 1​)ψ100(Z=2)​(r 2​)=πa3Z3​e−Z(r1​+r2​)/a 这种「类氢原子基态」近似,得到的能量是 −109 eV-109\text{ eV}−109 eV,误差大概是 20%20\%20%,实际上还是挺接近真实值的. 继续做激发态,考虑某一个电子到了 nlmnlmnlm 的激发态,有两种不同的波函数. 如果两个电子是 singlet (自旋单态),则波函数是反对称的, ψpara=12(↑↓−↓↑)\psi_{\text{para}} = \frac{1}{2}(\uparrow\downarrow-\downarrow\uparrow) ψpara​=21​(↑↓−↓↑) 称为 parallel Helium;反之为对称波函数,orthonogonal Helium.

2025/12/1
articleCard.readMore

Lesson 11 Truncated & Censored Data

提示 Quizzes 什么是 clustering?举一个例子. 根据某种性质来分类,比如分类恒星. 什么是 classification?举一个例子. 根据某种性质来归类新的一个数据,比如一个超新星的归类. Clustering 和 Classification 的最大区别? 前者是 unsupervising 后者是 supervising. 判断下述例子是 clustering 还是 classification: 根据巡天数据里面的红移来分类星系 clustering 按照星和星系的亮度和颜色来确定种类 classification …… …… 描述分类是否好的指标: Completeness Contamination 如果把 classification 的要求变得更严格,那么: Completeness ↑\uparrow↑,Contamination ↑\uparrow↑ Completeness ↑\uparrow↑,Contamination ↓\downarrow↓ Completeness ↓\downarrow↓,Contamination ↑\uparrow↑ Completeness ↓\downarrow↓,Contamination ↓\downarrow↓ 更严格的话应该都下降. …… 降维算法的效果? 帮助减少不重要的 features 能够减少 noise 能够提升 clustering 和 classification 算法的表现 一定会造成重要信息的减少 选择 a., b., c.. 今天讲的内容是数据被截断 (truncated) 或者被模糊 (censored). 一个简单的例子是,我们望向夜空,一定有很多星星根本看不到,但是我们完全不知道哪些看到了哪些没看到,比例是多少,我们只能看到我们看到的,这就是截断;如果我们用射电望远镜或者光学望远镜观察,可能后者可以看到一个源,但是前者什么都看不到,这时候我们可以确定有什么在那里,但是不知道信号到底有多强,这就是模糊. 先看一个文章:arXiv:1502.02201. 能够看到不同的 gamma 射线源之间能够形成一个近乎完美的直线,但是其来源从太阳到宇宙的远古背景、尺度跨越极大,这真的对吗? 「Absence of evidence is not evidence of absence.」 Selection Effects and Biases 我们的数据有很多人为的成分,比如「一定要 3σ3\sigma3σ 才是一个真的信号」,或者是望远镜没有能力看到太暗弱的星体. 但是「没有看到」这件事本身也是一个事实,也能提供信息 (比如这一块区域前景有遮挡,或者这个区域的物质密度较低),也能被用来做统计. 没有看到的话,我们不能对这个区域的单个物体做出确认,但是我们可以对这个区域做整体的统计推断. 天文上,最常见的一种「看不到」的东西是「距离」. /Example/ (Toy Universe) 在一个平直时空的球形宇宙中撒 10610^6106 个点,均匀分布,光度按照分布函数 p(L)∝L−3p(L)\propto L^{-3}p(L)∝L−3 来分配,Lmin⁡=1L_{\min}=1Lmin​=1. 那么流量是 F=L4πD2F=\frac{L}{4\pi D^2} F=4πD2L​ 探测器能够看到的是流量,要求流量 >10>10>10 才能被看见. 现在来做模拟, import numpy as np import matplotlib.pyplot as plt rng = np.random.default_rng(seed=42) N = int(1e6) # Generate uniform distribution in volume D = rng.uniform(0, 1, N)**(1/3) # Generate power-law luminosities L_min = 1 L = L_min * rng.uniform(0, 1, N)**(-0.5) # Plot Hubble diagram plt.scatter(np.log10(D), np.log10(L), s=0.5, c='gray', alpha=0.5) 对模拟结果画 Hubble 图 (log⁡L\log LlogL - log⁡D\log DlogD 图),理应是右下角的星比较多;但是如果加上观测极限,那么会在图上切割出一个 L∝D2L\propto D^2L∝D2 的直线,那么我们会得到错误结果 —— 距离越远,光度越大. 这是因为,流量 FFF 完全是三维时空的几何效应,那么最后得到的东西完全不会和光度分布函数有任何联系.

2025/11/27
articleCard.readMore

Lesson 21 偶极辐射 (二)

电偶极辐射: A⃗0(θ,ϕ)=μ04π∫j⃗0(x⃗′)dτ′\vec{A}_0(\theta,\phi) = \frac{\mu_0}{4\pi}\int\vec{j}_0(\vec{x}')\text{d}\tau' A 0​(θ,ϕ)=4πμ0​​∫j ​0​(x ′)dτ′ 我们知道利用 Gauss 定理有 0=∫∇⋅(j⃗0(x⃗′)x⃗′)dτ′=∫(∇⋅j⃗0(x⃗′))x⃗′dτ′+∫j⃗0(x⃗′)dτ′0=\int\nabla\cdot(\vec{j}_0(\vec{x}')\vec{x}')\text{d}\tau'=\int(\nabla\cdot\vec{j}_0(\vec{x}'))\vec{x}'\text{d}\tau' + \int\vec{j}_0(\vec{x}')\text{d}\tau' 0=∫∇⋅(j ​0​(x ′)x ′)dτ′=∫(∇⋅j ​0​(x ′))x ′dτ′+∫j ​0​(x ′)dτ′ 而在谐变的电磁场中, ∇⋅j⃗0(x⃗′)=−∂ρ(x⃗′)∂t=iωρ(x⃗′)\nabla\cdot\vec{j}_0(\vec{x}') = -\frac{\partial\rho(\vec{x}')}{\partial t}=\text{i}\omega\rho(\vec{x}') ∇⋅j ​0​(x ′)=−∂t∂ρ(x ′)​=iωρ(x ′) 也就有 A⃗0(θ,ϕ)=−μ04π∫(∇⋅j⃗0(x⃗′))x⃗′dτ′=−iω⋅μ04π∫ρ(x⃗′)x⃗′dτ′\vec{A}_0(\theta,\phi) = -\frac{\mu_0}{4\pi}\int(\nabla\cdot\vec{j}_0(\vec{x}'))\vec{x}'\text{d}\tau' = -\text{i}\omega\cdot\frac{\mu_0}{4\pi}\int\rho(\vec{x}')\vec{x}'\text{d}\tau' A 0​(θ,ϕ)=−4πμ0​​∫(∇⋅j ​0​(x ′))x ′dτ′=−iω⋅4πμ0​​∫ρ(x ′)x ′dτ′ 后面正是电偶极子的计算式,化为 A⃗0=μ0eikR4πRP⃗˙\vec{A}_0 = \frac{\mu_0e^{\text{i}kR}}{4\pi R}\dot{\vec{P}} A 0​=4πRμ0​eikR​P ˙ 在 P⃗=P⃗0e−iωt\vec{P} = \vec{P}_0 e^{-\text{i}\omega t}P =P 0​e−iωt 的电偶极子振荡下,磁场是 B⃗0=ik⃗×A⃗0=μ0ω24πcP0sin⁡θe^ϕ\vec{B}_0 =\text{i}\vec{k}\times\vec{A}_0 = \frac{\mu_0\omega^2}{4\pi c}P_0\sin\theta\hat{e}_\phi B 0​=ik ×A 0​=4πcμ0​ω2​P0​sinθe^ϕ​ 磁场的平方表征功率的角分布: dPdΩ∝sin⁡2θ,dPdΩ=μ0P02ω432π2csin⁡2θ\frac{\text{d}P}{\text{d}\Omega} \propto \sin^2\theta,\quad \frac{\text{d}P}{\text{d}\Omega} = \frac{\mu_0P_0^2\omega^4}{32\pi^2c}\sin^2\theta dΩdP​∝sin2θ,dΩdP​=32π2cμ0​P02​ω4​sin2θ

2025/11/27
articleCard.readMore

Lesson 10 Molecular Motor (2)

接着上节课的分子马达来说. 我们从物理的角度更加关心「马达」运转起来之后是什么样子, p(n,t+Δt)=k+p(n−1,t)Δt+k−p(n+1,t)Δt+[1−(k−+k+)Δt]p(n,t)Δtp(n,t+\Delta t) = k_+p(n-1,t)\Delta t+k_-p(n+1,t)\Delta t+[1-(k_-+k_+)\Delta t]p(n,t)\Delta t p(n,t+Δt)=k+​p(n−1,t)Δt+k−​p(n+1,t)Δt+[1−(k−​+k+​)Δt]p(n,t)Δt 这里的 k+k_+k+​ 和 k−k_-k−​ 都是向前或向后跳的概率. 两边的跳变会和二态系统一样有一个关系: k+k−=e−β(ΔG0+Fa)\frac{k_+}{k_-}=e^{-\beta(\Delta G_0+Fa)} k−​k+​​=e−β(ΔG0​+Fa) 这里的 FFF 是马达所要克服的外力. 同时,我们知道这个跳变耦合了一个 ATP 反应,所以应该拓宽为一个广义的细致平衡条件: k+k−=e−β(ΔG0−ΔGATP+Fa)\frac{k_+}{k_-}=e^{-\beta(\Delta G_0-\Delta G_{\text{ATP}}+Fa)} k−​k+​​=e−β(ΔG0​−ΔGATP​+Fa) 注意 这个细致平衡实际上并不显然!马达在运动的过程中肯定已经远离了平衡态,但是我们还在用平衡态的结论. 简单理解,这是因为我们假设热库的反应速度远远大于马达的运动速度,也就是慢变量只有马达. 每走过一步,就在已经走过的地方插上一个标记,这样就像 Feynman 棘轮一样使得马达只能朝一个方向运动. 如果我们假设一步反应,那么反应的等待时间应该满足 f(T)∝e−αTf(T)\propto e^{-\alpha T}f(T)∝e−αT;但是实验上我们观察到了一个峰,这意味着反应可能存在一个中间状态,也就是 f(T)=1τe−t/τ⟹f(T)=1τB−τA(e−t/τB−e−t/τA)f(T)=\frac{1}{\tau}e^{-t/\tau}\Longrightarrow f(T)=\frac{1}{\tau_B-\tau_A}(e^{-t/\tau_B}-e^{-t/\tau_A}) f(T)=τ1​e−t/τ⟹f(T)=τB​−τA​1​(e−t/τB​−e−t/τA​) 这个「内部步骤」很好理解,我们知道 ATP 水解驱动这个反应,那么中间一定有一个态 ATP 变成了 ADP,这就是中间态,下一步应该是把 ADP 扔掉换成一个 ATP. 这和之前讲的四态模型并没有很大差别, M - ATP⇌exchangehydrolysisM - ADPM\text{ - ATP}\stackrel{\text{hydrolysis}}{\underset{\text{exchange}}{\rightleftharpoons}}M\text{ - ADP} M - ATPexchange⇌​hydrolysis​M - ADP (甚至是一个二态系统,比四态更简单) 物理上的扩散是 ∂tPc=∂∂x[−V(c)Pc+D(c)∂Pc∂x]\partial_tP_c=\frac{\partial}{\partial x}\left[-V(c)P_c+D(c)\frac{\partial P_c}{\partial x}\right] ∂t​Pc​=∂x∂​[−V(c)Pc​+D(c)∂x∂Pc​​] 化学上,有反应方程 ∂tPc=∑kiPc+⋯\partial_tP_c = \sum k_iP_c+\cdots ∂t​Pc​=∑ki​Pc​+⋯ 两个部分结合在一起就是总的变化率.

2025/11/26
articleCard.readMore

Lesson 10 离子阱量子计算 & 超快分子摄影

离子阱量子计算 —— 金奇奂 警告 老师似乎是韩国人,所以这个讲座是英语讲座. 先来说一下量子计算机的前景:一般认为量子计算机在更加复杂的运算上以指数形式的速度远超经典计算机,并且具有更加好的保密性、更大的带宽等等性质. 什么是离子阱?Paul 发展了一种离子阱叫做 Paul Trap,Dehmelt 发展了一种阱叫做 Penning Trap. Penning Trap 的简单思路是用三个方向的谐振子势来约束中间的离子,但是这是并不合理的,因为整个场为静态,我们需要额外的能量去维持这个场;Paul 的离子阱在 Penning Trap 的基础上做了改进,考虑两个方向是变化的电磁场. 我们做离子阱量子计算,要了解离子阱相对于其他实现方式的优势:首先就是相干时间长,一般叠加态的相干时间能够达到约 37800 s37800\text{ s}37800 s,相当于十个小时,这个结果远强于原子量子计算. 另外,我们描述量子计算的性能有一个参数「量子体积」,由量子比特数量、错误率和量子比特之间的关联性等参数决定. 虽然离子阱量子计算的量子比特数非常少,但是其量子比特关联性表现出极好的性质.

2025/11/26
articleCard.readMore

Lesson 19 多粒子系统

假设有 mmm 个 fermion,那么波函数应该怎么写? 女科学家 Slater 想出一个行列式来描述这个波函数: ∣ψ1(r⃗1)ψ2(r⃗1)⋯ψm(r⃗1)ψ1(r⃗2)ψ2(r⃗2)⋯ψm(r⃗2)⋮⋮⋱⋮ψ1(r⃗m)ψ2(r⃗m)⋯ψm(r⃗m)∣\begin{vmatrix} \psi_1(\vec{r}_1)&\psi_2(\vec{r}_1)&\cdots&\psi_m(\vec{r}_1)\\ \psi_1(\vec{r}_2)&\psi_2(\vec{r}_2)&\cdots&\psi_m(\vec{r}_2)\\ \vdots&\vdots&\ddots&\vdots\\ \psi_1(\vec{r}_m)&\psi_2(\vec{r}_m)&\cdots&\psi_m(\vec{r}_m) \end{vmatrix} ​ψ1​(r 1​)ψ1​(r 2​)⋮ψ1​(r m​)​ψ2​(r 1​)ψ2​(r 2​)⋮ψ2​(r m​)​⋯⋯⋱⋯​ψm​(r 1​)ψm​(r 2​)⋮ψm​(r m​)​ ​ 这个行列式巧妙地利用了一个性质:假如说第 iii 个粒子占据了第 jjj 个轨道 —— ψi(r⃗j)\psi_i(\vec{r}_j)ψi​(r j​),那么和这一个乘在一起的那一项的其他所有粒子都不能占据这个轨道了,这正是 Pauli 不相容原理. 注意 老师开始夹带私货了,讲他在做的东西. 考虑用「硬核 Boson」构成的一个系统,统计行为类似于 fermion,也就是把很多个自旋排列在一个圆环上,然后因为相邻的自旋不能在同一个态,所以它们是 ↑↓↑↓⋯\uparrow\downarrow\uparrow\downarrow\cdots↑↓↑↓⋯ 或者是 ↓↑↓↑⋯\downarrow\uparrow\downarrow\uparrow\cdots↓↑↓↑⋯ 这两个简并的基态,这叫做 Neel 态. 但是我们现在每隔一个自旋加一个不为零的磁场 (整体来看是一个锯齿状的磁场),那么上面两个态就不是简并的了,有一个态的能量更低. 更高能量的态会在很多自由度上发生隧穿,掉到这个能量更低的态上面来.

2025/11/26
articleCard.readMore

Neutron Stars

—— Xinyu LI 什么是 star? 一个由等离子体构成的发光球体. 恒星的发光是由氢的燃烧造成的. 具体而言,有两个不同的反应链:pp - 反应链 & CNO 循环. 我们知道太阳的质量并不是无限的,当 H 烧完之后会坍缩一点,开始燃烧 He;这些过程也不是无止境的,因为更重的元素 (Fe 以上的元素) 倾向于裂变而不是聚变. 在这个点,没有辐射能和引力相互抗衡. 因为电子是 fermion,所以在引力坍缩的过程中会产生电子简并压,这是一种可以和引力相互抗衡的力,最终形成白矮星. 这里说一下 Ia\text{I}aIa 型超新星,这种超新星的形成来源于一颗白矮星吸收其伴星的物质,然后逐渐超过 Chandrasekhar 极限,并发生超新星爆炸. 在 Chandrasekhar 极限之上,中子简并压起主要作用,中子星的密度会达到 4×1011∼1015 g/cm34\times10^{11}\sim10^{15}\text{ g/cm}^34×1011∼1015 g/cm3 的量级,这是一个非常恐怖的数字. 1965 年中子星最先被 radio 探测器发现,一开始人们认为这种极为规律的信号来源于 Little Green Man,但是后来确认为中子星. 中子星的压强方程: dPdr=−Gmr2ρ(1+Pρc2)(1+4πr3Pmc2)(1−2Gmrc2)−1\frac{\text{d}P}{\text{d}r}=-\frac{Gm}{r^2}\rho\left(1+\frac{P}{\rho c^2}\right)\left(1+\frac{4\pi r^3P}{mc^2}\right)\left(1-\frac{2Gm}{rc^2}\right)^{-1} drdP​=−r2Gm​ρ(1+ρc2P​)(1+mc24πr3P​)(1−rc22Gm​)−1 虽然我们是通过周期性的脉冲发现的第一颗已知中子星,但是我们到目前为止仍然不了解中子星产生周期性脉冲的完整机制. 一个思路是中子星的磁轴和中子星的自转轴不同,就像灯塔一样扫过星际中的空间.

2025/11/25
articleCard.readMore

Lesson 20 偶极辐射

辐射研究中最重要的并不是球面波因子这些量,而是功率的角分布. 先来计算能流密度: S⃗=1μ0E⃗×B⃗\vec{S}=\frac{1}{\mu_0}\vec{E}\times\vec{B} S =μ0​1​E ×B 但是我们之前已经用了复数写法,这里遇到了复数物理量的二次项,应该先取实部再求乘积,为 S⃗=cμ0(ℜB⃗⋅ℜB⃗)R^,⟨S⃗⟩=c2μ0∣B⃗∣2R^=c2μ0∣B⃗0∣2R2R^\vec{S}=\frac{c}{\mu_0}(\Re\vec{B}\cdot\Re\vec{B})\hat{R},\quad \langle\vec{S}\rangle=\frac{c}{2\mu_0}|\vec{B}|^2\hat{R}=\frac{c}{2\mu_0}\frac{|\vec{B}_0|^2}{R^2}\hat{R} S =μ0​c​(ℜB ⋅ℜB )R^,⟨S ⟩=2μ0​c​∣B ∣2R^=2μ0​c​R2∣B 0​∣2​R^ 考虑在一个微元立体角上的功率: dP=⟨S⃗⟩⋅4πR2dΩ=c2μ0∣B⃗0∣2dΩ\text{d}P=\langle\vec{S}\rangle\cdot4\pi R^2\text{d}\Omega=\frac{c}{2\mu_0}|\vec{B}_0|^2\text{d}\Omega dP=⟨S ⟩⋅4πR2dΩ=2μ0​c​∣B 0​∣2dΩ 辐射功率的角分布实际上就是 B⃗0\vec{B}_0B 0​ 的角分布, dPdΩ=c2μ0∣B⃗(θ,φ)∣2\frac{\text{d}P}{\text{d}\Omega}=\frac{c}{2\mu_0}|\vec{B}(\theta,\varphi)|^2 dΩdP​=2μ0​c​∣B (θ,φ)∣2

2025/11/25
articleCard.readMore

Lesson 9 Legendre 多项式 (二)

讲几个作业题先: 用 Pl(x)P_l(x)Pl​(x) 展开 f(x)=1−2xt+t2f(x)=\sqrt{1-2xt+t^2}f(x)=1−2xt+t2 ​.

2025/11/25
articleCard.readMore

Lesson 18 双粒子系统

手算 CG 系数: 首先我们考虑 ∣j1,m1⟩\ket{j_1,m_1}∣j1​,m1​⟩ 和 ∣j2,m2⟩\ket{j_2,m_2}∣j2​,m2​⟩ 的叠加,一共应该是 (2j1+1)(2j2+1)(2j_1+1)(2j_2+1)(2j1​+1)(2j2​+1) 个维度. 角动量升降算符: j±∣j,m⟩=j(j+1)−m(m±1)∣j,m±1⟩j_{\pm}\ket{j,m} = \sqrt{j(j+1)-m(m\pm 1)}\ket{j,m\pm 1} j±​∣j,m⟩=j(j+1)−m(m±1) ​∣j,m±1⟩ 定义 j⃗=j⃗1+j⃗2\vec{j}=\vec{j}_1+\vec{j}_2j ​=j ​1​+j ​2​,则 j=j1+j2,j1+j2−1,⋯ ,∣j1−j2∣j=j_1+j_2,j_1+j_2-1,\cdots,|j_1-j_2| j=j1​+j2​,j1​+j2​−1,⋯,∣j1​−j2​∣ 能够合成的最大角动量是 ∣j=j1+j2,m=j1+j2⟩=∣j1,j1⟩∣j2,j2⟩\ket{j=j_1+j_2,m=j_1+j_2}=\ket{j_1,j_1}\ket{j_2,j_2} ∣j=j1​+j2​,m=j1​+j2​⟩=∣j1​,j1​⟩∣j2​,j2​⟩ 算 m=j1+j2−1m=j_1+j_2-1m=j1​+j2​−1 的那一个,就在左边作用一个 j−j_-j−​,右边作用一个 j1−+j2−j_{1-}+j_{2-}j1−​+j2−​,得到 (j1+j2)(j1+j2+1)−(j1+j2)(j1+j2−1)∣j1+j2,j1+j2−1⟩=j1(j1+1)−j1(j1−1)∣j1,j1−1⟩∣j2,j2⟩+j2(j2+1)−j2(j2−1)∣j1,j1⟩∣j2,j2−1⟩\begin{aligned} &\sqrt{(j_1+j_2)(j_1+j_2+1)-(j_1+j_2)(j_1+j_2-1)}\ket{j_1+j_2,j_1+j_2-1}=\\\\ &\sqrt{j_1(j_1+1)-j_1(j_1-1)}\ket{j_1,j_1-1}\ket{j_2,j_2}\\\\ &\quad+\sqrt{j_2(j_2+1)-j_2(j_2-1)}\ket{j_1,j_1}\ket{j_2,j_2-1} \end{aligned} ​(j1​+j2​)(j1​+j2​+1)−(j1​+j2​)(j1​+j2​−1) ​∣j1​+j2​,j1​+j2​−1⟩=j1​(j1​+1)−j1​(j1​−1) ​∣j1​,j1​−1⟩∣j2​,j2​⟩+j2​(j2​+1)−j2​(j2​−1) ​∣j1​,j1​⟩∣j2​,j2​−1⟩​ 左边的系数除过来就是 CG 系数. 再下一阶,应该是 j1−2∣j1,j1−2⟩∣j2,j2⟩+(j1−j2−+j2−j1−)∣j1,j1−1⟩∣j2,j2−1⟩+j2−2∣j1,j2⟩∣j2,j2−2⟩\begin{aligned} &j_{1-}^2\ket{j_1,j_1-2}\ket{j_2,j_2}+(j_{1-}j_{2-}+j_{2-}j_{1-})\ket{j_1,j_1-1}\ket{j_2,j_2-1}\\\\ &\quad+j_{2-}^2\ket{j_1,j_2}\ket{j_2,j_2-2} \end{aligned} ​j1−2​∣j1​,j1​−2⟩∣j2​,j2​⟩+(j1−​j2−​+j2−​j1−​)∣j1​,j1​−1⟩∣j2​,j2​−1⟩+j2−2​∣j1​,j2​⟩∣j2​,j2​−2⟩​ 依此类推.

2025/11/25
articleCard.readMore

Lesson 10 Clustering & Classification

提示 Quizzes 选出可以被定性为 density estimation 的问题: 为 Hubble 常数拟合一个直线 估计 gamma 射线暴的持续时间分布 在巡天数据中估计变星的比例 这实际上是一个「参数估计」. 确定观测到的星系在体积中的计数是更加符合 Poisson 分布还是负二项分布 这实际上是一个「模型选择」. 估计巡天数据中的星系颜色分布 估计一串模拟数据中粒子的密度分布 选择 b., e., f.. 关于直方图的说法正确的是? 改变直方图第一个 bin 的起点,直方图的形状会变 用更多的 bin 总是能够获得更好的估计 bin 更多,对噪声更加敏感,不利于提取有效信息. 用等宽的直方图,可能会错过一些 feature,也可能会在数据少的地方浪费 bin. Bayesian Blocks 是一个自适应取 bin 宽度的方法. 选择 a., c., d.. 简单描述一下什么是 KDE (Kernel Density Estimation),并简述其工作原理. 就是在每个数据点上面放一个 kernel 函数,整体加起来形成一个连续的分布. 注意 每个 kernel 的宽度称为「带宽」,这是一个关键的量. 关于 KDE 的说法正确的是? Kernel 的形状比带宽更加关键 (对于结果的影响更大) 带宽控制密度估计的平滑程度 简单地用极限思想来思考,如果带宽无限,最后会变成一个 uniform;反之,如果是一个 δ\deltaδ 函数形状的 kernel,最后会极为不连续. Cross-validation 能够用来选择一个合适的带宽 我们只要知道有这个方法就行了……这门课的后半主要是讲概念,大家了解一个「搜索用的关键词」就算是有收获. 数据有噪声时,KDE 不能工作 噪声污染数据的过程和 KDE 处理数据的过程,都是一个卷积,因此如果我们知道了噪声的生成方式,可以把这样的分布并入到 kernel 里面,最后能够得到极为真实的数据,反而在有噪声的情况下 KDE 工作得很好. 选择 b., c.. 关于 kkk - NN 的说法正确的是? kkk - NN 估计的是每个点处 kkk 个邻居的密度 kkk 的作用类似 KDE 中的带宽 可以用 cross - validation 确定一个合适的 kkk 相较于 KDE,好处在于 kkk - NN 的「带宽」取决于当地的邻居分布,是自适应的,而不是固定的带宽 选择 a., b., c., d.. 关于神经网络的说法正确的是? 是用神经网络学习复杂的概率分布函数 这个方法在高维下优于 KDE 可以处理任意维度 …… 选择 a., b.. Clustering (聚类):将相近的数据分组,使得组内数据接近,组间数据相差较远. 这是一种 unsupervised learning,我们暂时还什么都不知道. Classification (分类):我们已经有了 clusters,获得新的数据之后要把它们归类到某一类中去. 和上面相比,这是 supervised learning,我们已经预先有了对 clusters 有哪些的知识,进行下一步的工作. 这两个概念看起来非常简单,但是是科学研究的基本方法;而且因为天文观测数据相对来说非常少,所以显得尤为重要. 一个例子是恒星分类,最早的天文学家们用英文字母来分类不同光谱类型的恒星,但是后来发现光谱表征了恒星的温度,按照温度排序由高到低是 Q, B, A, F, G, K, M... 但是这个序列和原来的顺序完全不一样了,很多历史的因素导致我们难以记住这些分类规则. 提示 实际上还是有个规则的:Oh Be A Fine Girl Kiss Me (这是一个顺口溜) 另一个例子是按照形态分类不同星系,有所谓的 Hubble's Galaxy Classification Scheme,它们实际上和星系的演化过程有关系. 分类的好处是,我们可以只具体研究一类,同时可以认为相似的类之间具有相近的起源或者演化过程、或者找到类之间的演化过程;另外,我们可以容易地发现异常的个体,或者预测新发现的个体应该具有何种和之前一样的共性,指导未来的观测. Clustering K - means 最简单的方法叫做 KKK - means 方法: 把数据分成 KKK 个类,类的均值序列为 {μk}k=1K\{\mu_k\}_{k=1}^K{μk​}k=1K​,要求列内部的方差尽可能小: min⁡{Ck}∑k=1K∑x∈Ck∥x−μk∥2\min_{\{C_k\}}\sum_{k=1}^K\sum_{x\in C_k}\|x-\mu_k\|^2 {Ck​}min​k=1∑K​x∈Ck​∑​∥x−μk​∥2 具体过程是,先确定 KKK,然后扔 KKK 个重心在图上,把每一个点归类到离它最近的那个重心的类别去. 归类一次之后,把两类的重心算出来,然后用两个新的重心再进行一次演化,之后不断迭代,等重心位置都不再变化,就能确定最后的分类. 最后的结果有一个专有的名字 —— Voronoi Diagram,它是一种划分全空间的方法,能够保证全空间的每一个区域的任何一个点都距离该区域的重心最近,而不可能离其他区域的重心更近. 这种方法的缺点: 对重心初值敏感. 对 outlier 敏感. 对于坐标的 scale 敏感. 举个例子,如果 yyy 坐标的标度很大,那么 ∑∥x−μk∥2\sum\|x-\mu_k\|^2∑∥x−μk​∥2 里面就全是这个坐标轴的数据. Hierarchical Clustering 更好的方法是 Hierarchical Clustering. 最开始我们认为每一个数据都是一个类,然后 merge 最相近的两个点,是否 merge 的判据有很多种,比如: Single linkage: dmin⁡(Ck,Ck′)=min⁡x∈Ck,x∈Ck′∥x−x′∥d_{\min}(C_k,C_{k'}) = \underset{x\in C_k,x\in C_{k'}}\min\|x-x'\|dmin​(Ck​,Ck′​)=x∈Ck​,x∈Ck′​min​∥x−x′∥. Complete linkage: dmax⁡(Ck,Ck′)=max⁡x∈Ck,x∈Ck′∥x−x′∥d_{\max}(C_k,C_{k'}) = \underset{x\in C_k,x\in C_{k'}}\max\|x-x'\|dmax​(Ck​,Ck′​)=x∈Ck​,x∈Ck′​max​∥x−x′∥. …… 一个一个生长上去,clusters 会变得越来越少,把每一次的高度画在这样的图中: 那么只要找到落差最大的两次生长,把这个「树」切断,就得到了最佳的分类. 如果是 single linkage,那么我们叫它「朋友的朋友」算法;同时我们在图中会连接所有的点,这种图在计算几何中被称为最小生成树,它是连接各点的最短路径. 如果用 complete linkage,那么会得到非常 compact clusters. /Example/ 这个方法可以在 SDSS 巡天数据中找到星系团;另外,在 1998 年的一篇文章中,人们分析 γ\gammaγ 射线暴,找到了除了短暴和长暴之外的另外两种射线暴. DBSCAN 第三种方法:DBSCAN (Density - Based Spatial Clustering of Applications with Noise). 两个参数: ε\varepsilonε:两个点成为邻居的最大距离 mmm:成为一个 core 的最小点数 (包含自身) 对于一个点,先找到其所有邻居,如果少于 mmm 那么标记为噪声;反之定义一个 cluster,将这个点作为一个 core. 然后检查邻居,找到「朋友的朋友」. 如果是在 core 的邻域内的噪声,被标记为 border (边缘点). 这个方法的灵活度更大,取决于局域的密度,自适应地划分 clusters. /Example/ 一个例子是 Gaia 卫星的银河系观测数据,找到星团. 因为星团可能被潮汐力撕碎,相距很远的星体可能属于同一个星团,所以要引入光谱等额外参数,而且还无法在一开始确定有几个 clusters. 这时候非常适合用 DBSCAN. 所有上面讲到的方法都可以用简短的代码来实现: from sklearn.datasets import make_blobs from sklearn.cluster import KMeans, AgglomerativeClustering, DBSCAN # Create test data centers = [[1, 1], [-1, -1], [1, -1]] X, labels_true = make_blobs(300, centers=centers, cluster_std=0.4) # K-Means clustering kmeans = KMeans(n_clusters=3) label_kmeans = kmeans.fit_predict(X) # Hierarchical clustering hie_model = AgglomerativeClustering(linkage='single') hie_model.fit(X) label_hie = hie_model.labels_ # DBSCAN clustering db = DBSCAN(eps=0.3, min_samples=10).fit(X) label_db = db.labels_ Classification 已经分好 clusters,现在我们要把新的数据归类了. 考虑 {x}\{x\}{x} 中有 nnn 个点,每个有 mmm 个 feature,第 iii 个点的第 jjj 个 feature 表达为 xijx^j_ixij​. 标签序列为 {yi}\{y_i\}{yi​},Bayes Theorem: p(yk∣x⃗i)=p(x⃗i∣yk)p(yk)∑j=1lp(x⃗i∣yj)p(yj)p(y_k|\vec{x}_i)=\frac{p(\vec{x}_i|y_k)p(y_k)}{\displaystyle{\sum_{j=1}^lp(\vec{x}_i|y_j)p(y_j)}} p(yk​∣x i​)=j=1∑l​p(x i​∣yj​)p(yj​)p(x i​∣yk​)p(yk​)​ 用下面两个量来考察我们的分类是否好: Completeness: completeness=true positivestrue positives+false negatives\text{completeness} = \frac{\text{true positives}}{\text{true positives} + \text{false negatives}} completeness=true positives+false negativestrue positives​ Contamination (被噪声的污染程度): Contamination=false positivestrue positives+false positives\text{Contamination} = \frac{\text{false positives}}{\text{true positives} + \text{false positives}} Contamination=true positives+false positivesfalse positives​ Naïve Bayes p(x1,x2,⋯ ,xm∣yk)=∏j=1mp(xj∣yk)p(x^1,x^2,\cdots,x^m|y_k)=\prod_{j=1}^m p(x^j|y_k) p(x1,x2,⋯,xm∣yk​)=j=1∏m​p(xj∣yk​) 于是, p(yk∣x1,x2,⋯ ,xm)∝p(yk)∏j=1mp(xj∣yk)p(y_k|x^1,x^2,\cdots,x^m) \propto p(y_k)\prod_{j=1}^mp(x^j|y_k) p(yk​∣x1,x2,⋯,xm)∝p(yk​)j=1∏m​p(xj∣yk​) 这个方法是最小化下面的量: y^=arg⁡max⁡ykp(yk)∏j=1mp(xj∣yk)\hat{y}=\arg\max_{y_k}p(y_k)\prod_{j=1}^mp(x^j|y_k) y^​=argyk​max​p(yk​)j=1∏m​p(xj∣yk​) /Example/ 天鹅座 RR 变星:光变曲线的周期和绝对亮度有关系,所以观测到周期就能确定其绝对亮度,再和相对亮度对比就可以测距. 我们要找出哪些是这样的变星. 但是结果的范围并不是很好. 一个更优化的思路是引入联合 Gauss 分布. 但是问题在于,这里的自由参数太多了,整个协方差矩阵都是自由的. k - NN Classifier 通过「邻居投票」的方式来归类,同时按照邻居的距离来算投票的权重. 特征是:没有训练集、对 outliers 和不同 feature 的 scale 敏感... SVM 画一条直线边界,让两个 clusters 距离这歌边界尽可能远 (所谓「最大二乘法」) 扩展是多核 SVM (KSVM, Kernel SVM),把数据点升维,边界变为高维平面,投影回来就不再是直线,而是一个复杂的曲线边界. 这种方法的 completeness 极高,但是引入了很多噪声污染. Decision Tree 决策树,用熵来算应该如何「切割」数据,计算切割之后的 information gain: IG(x,y)=H(x)−∑∣xv∣∣x∣H(xv)\text{IG}(x,y)=H(x)-\sum\frac{|x_v|}{|x|}H(x_v) IG(x,y)=H(x)−∑∣x∣∣xv​∣​H(xv​) 这种方式的参数实际上只有「切几刀」. Dimension Reduction 有时候我们不希望有很多维度,因为维度之间可能存在相关性,没必要引入太多维度;同时会增大计算难度. 我们希望在不破坏重要结构的情况下降低数据集的维度. PCA Principle Component Analysis. 找到各个维度之间的重要性排序,去寻找一个平面平行于「最重要的方向」,把所有数据投影到这个平面上面. SOM Self - Organizing Map (自组织映射):比上面那个方法更加现代,利用神经网络,把任意维度降低到二维. 这其中的映射非常复杂 (毕竟基于神经网络). Exercise: Iris Classification 做鸢尾花的分类,这是一个经典的验证分类方法好坏的数据集. 有三种鸢尾花,四个 feature:萼片长度、萼片宽度、花瓣长度、花瓣宽度. 这个数据集是在 python 库里面自带的 (因为太经典了). 选择自己喜欢的分类方式来做分类. 利用 nearest neighbour 的例子: from sklearn import datasets import matplotlib.pyplot as plt iris = datasets.load_iris() # Take the first two features (sepal length and width) X = iris.data[:, :2] y = iris.target plt.scatter(X[:, 0], X[:, 1], c=y, cmap='jet', s=20); from sklearn.neighbors import NearestCentroid import numpy as np clf = NearestCentroid() clf.fit(X, y) y_pred = clf.predict(X) plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='jet', s=20);

2025/11/20
articleCard.readMore

Lesson 19 辐射 (二)

球面波方程 1r2∂∂r(r2∂φ∂r)−1c2∂2φ∂t2=0\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial\varphi}{\partial r}\right)-\frac{1}{c^2}\frac{\partial^2\varphi}{\partial t^2}=0 r21​∂r∂​(r2∂r∂φ​)−c21​∂t2∂2φ​=0 它的通解为 φ(r,t)=1r[f(t−rc)+g(t+rc)]\varphi(r,t)=\frac{1}{r}\left[f\left(t-\frac{r}{c}\right)+g\left(t+\frac{r}{c}\right)\right] φ(r,t)=r1​[f(t−cr​)+g(t+cr​)] 这里的 ggg 表现为汇聚的波形,不符合物理实际,我们只考虑 fff 的部分. 对于场源 Q(t−r/c)Q(t-r/c)Q(t−r/c) 来说,我们猜测 φ(r,t)=14πε0rQ(t−rc)\varphi(r,t)=\frac{1}{4\pi\varepsilon_0r}Q\left(t-\frac{r}{c}\right) φ(r,t)=4πε0​r1​Q(t−cr​) 因为现在没有唯一性定理了 (电磁场是动态的),所以要来验证这个解确实是 d'Alembert 方程的特解: ∇2φ=f∇21r+2∇1r⋅∇f+1r∇2f1c2∂2φ∂t2=1c21r∂2f∂t2\begin{aligned} \nabla^2\varphi&=f\nabla^2\frac{1}{r}+2\nabla\frac{1}{r}\cdot\nabla f+\frac{1}{r}\nabla^2f\\\\ \frac{1}{c^2}\frac{\partial^2\varphi}{\partial t^2}&=\frac{1}{c^2}\frac{1}{r}\frac{\partial^2f}{\partial t^2} \end{aligned} ∇2φc21​∂t2∂2φ​​=f∇2r1​+2∇r1​⋅∇f+r1​∇2f=c21​r1​∂t2∂2f​​ 在 x⃗′\vec{x}'x ′ 处的电荷在场点 x⃗\vec{x}x 的势是 φ(x⃗,t)=Q(x⃗′,t−rc)4πε0r\varphi(\vec{x},t)=\frac{\displaystyle{Q\left(\vec{x}',t-\frac{r}{c}\right)}}{4\pi\varepsilon_0r} φ(x ,t)=4πε0​rQ(x ′,t−cr​)​ 这就是所谓推迟势. 利用叠加原理推广, φ(x⃗,t)=14πε0∫V′ρ(x⃗′,t−rc)rdτ′\varphi(\vec{x},t)=\frac{1}{4\pi\varepsilon_0}\int_{V'}\frac{\displaystyle{\rho\left(\vec{x}',t-\frac{r}{c}\right)}}{r}\text{d}\tau' φ(x ,t)=4πε0​1​∫V′​rρ(x ′,t−cr​)​dτ′ 同理,磁矢势 A⃗(x⃗,t)=μ04π∫V′j⃗(x⃗′,t−rc)rdτ′\vec{A}(\vec{x},t)=\frac{\mu_0}{4\pi}\int_{V'}\frac{\displaystyle{\vec{j}\left(\vec{x}',t-\frac{r}{c}\right)}}{r}\text{d}\tau' A (x ,t)=4πμ0​​∫V′​rj ​(x ′,t−cr​)​dτ′ 这两者恰好是符合 Lorentz 规范条件. 下面考虑简谐的电流变化,取 j⃗(x⃗′,t′)=j⃗(x⃗′)e−iωt′\vec{j}(\vec{x}',t')=\vec{j}(\vec{x}')e^{-\text{i}\omega t'}j ​(x ′,t′)=j ​(x ′)e−iωt′,ρ(x⃗′,t′)=ρ(x⃗′)e−iωt′\rho(\vec{x}',t')=\rho(\vec{x}')e^{-\text{i}\omega t'}ρ(x ′,t′)=ρ(x ′)e−iωt′,其中 t′=t−r/ct'=t-r/ct′=t−r/c. 有: A⃗=μ04π∫V′j⃗(x⃗′)e−i(kr−ωt)rdτ′\vec{A}=\frac{\mu_0}{4\pi}\int_{V'}\frac{\vec{j}(\vec{x}')e^{-\text{i}(kr-\omega t)}}{r}\text{d}\tau' A =4πμ0​​∫V′​rj ​(x ′)e−i(kr−ωt)​dτ′ 之后我们开始近似:有三个区域, 近区 (似稳区):r≪λr\ll\lambdar≪λ,但是满足 r≫lr\gg lr≫l (线度),有 kr≪1kr\ll1kr≪1,推迟因子 ≪1\ll1≪1,几乎是即时响应. 过渡区:r≫λr\gg\lambdar≫λ,这里没办法具体做近似. 远区 (辐射区):r≫l2/λr\gg l^2/\lambdar≫l2/λ,有显著的推迟效应. 远区可以展开整个推迟势, A⃗(x⃗)=μ0eikR4πR∫V′j⃗(x⃗′)[1−ikn^⋅x⃗′+12(ikn^⋅x⃗′)2+⋯ ]dτ′\vec{A}(\vec{x}) = \frac{\mu_0e^{\text{i}kR}}{4\pi R}\int_{V'}\vec{j}(\vec{x}')\left[1-\text{i}k\hat{n}\cdot\vec{x}'+\frac{1}{2}(\text{i}k\hat{n}\cdot\vec{x}')^2+\cdots\right]\text{d}\tau' A (x )=4πRμ0​eikR​∫V′​j ​(x ′)[1−ikn^⋅x ′+21​(ikn^⋅x ′)2+⋯]dτ′ 远场下,也存在关系 ∇→ik⃗\nabla\to\text{i}\vec{k}∇→ik ,和平面波的情况类似.

2025/11/20
articleCard.readMore

Lesson 9 引力波探测 & 原子量子计算

引力波探测 —— Haixin Miao 加速运动的物体以光速辐射引力波. 我们用无量纲的时空应变 h∼G/c4⋅h\sim G/c^4\cdoth∼G/c4⋅ (能量 / 距离) 来描述引力波产生的作用,即使能量达到了 1020 J10^{20}\text{ J}1020 J,也就是人类的全年用电总量,这个值还是只有 10−2410^{-24}10−24. 因此我们观测的是宇宙量级的能量释放,一般而言能够探测到 10−2210^{-22}10−22 量级的应变. 从 1915 年 Einstein 用广义相对论算出引力波开始,他就认为这个改变量太低,根本不可能探测到;直到 2016 年 LIGO 才真正观测到一个引力波事件. 引力波探测的噪声: 地面震动噪声:海浪拍击海滩、车辆的行驶等等都会对 LIGO 这种精度的干涉仪造成影响. 我们知道,当高频力驱动单摆时,单摆反而不动,所以 LIGO 利用一个四级悬挂装置做了被动隔震,降低 10 个数量级的震动. 同时还有主动隔震措施:用六个地震仪来测量镜面平台的震动,然后主动做出调整实现隔震,在 1 Hz1\text{ Hz}1 Hz 频率达到 102∼10310^2\sim10^3102∼103 倍隔震. 在 THU,我们也在搭建类似 LIGO 的主动隔震平台,利用磁悬浮、倒摆实现隔震. 上面是经典噪声中最大的一种,实际上探测器内部还有很多微小的经典噪声,这里不展开. 下面讲引力波探测装置的量子噪声: 公里级探测器的应变灵敏度为 ΔLL∼10−22⟹ΔL∼10−19 m\frac{\Delta L}{L}\sim10^{-22}\Longrightarrow\Delta L\sim10^{-19}\text{ m} LΔL​∼10−22⟹ΔL∼10−19 m 真空涨落会造成激光相位随机改变,这大致是一个散粒噪声,是白的,随频率的改变比较小. 振幅涨落来源于辐射压力对镜面的移动. 也就是说,如果调大光功率,光子数量提升,散粒噪声减少、辐射压力噪声增大;反之散粒噪声增大、辐射压力噪声减小. 这个误差随着光功率变化的曲线会给出一个无量纲参数,这被称为所谓的 标准量子极限,一开始人们认为这个极限无法超越,但是后来发现并非如此: 也提到了所谓压缩态,可以让泵浦光通过非线性晶体,驱动真空态的振幅或者相位压缩,实际上类似我们荡秋千用倍频做参数共振,通过倍频泵浦光的调制来放大振幅或者相位信号. 具体来说在干涉仪输出位置加一个分束镜,在光路中引入一个基于光力系统的量子放大器. 原子量子计算 —— Wenlan Chen 我们知道量子力学和经典力学的差异在于: 存在叠加态 存在纠缠态 存在隧穿效应 因为这些效应的存在,一个量子比特代表的信息是 α∣0⟩+βeiθ∣1⟩\alpha\ket{0}+\beta e^{\text{i}\theta}\ket{1}α∣0⟩+βeiθ∣1⟩,相当于一个复平面上的信息. 但是从实验角度来说,要实现量子计算,我们需要精确控制一个单粒子或者微电流. 原子量子计算相对于其他方法的优势: 易于扩展:物理比特资源丰富 铷原子天然就是全同的,容易制备量子态. 全连通性:从定居者到旅行者 高度并行:一次经典操作同时实现大量量子门

2025/11/20
articleCard.readMore

Lesson 17 CG 系数

自旋是一个矢量算符,作用在自旋空间. SyS_ySy​ 的期望值: ⟨Sy⟩=χ†(t)Syχ(t)=−ℏ2sin⁡αsin⁡(γB0t)\braket{S_y}=\chi^\dagger(t)S_y\chi(t)=-\frac{\hbar}{2}\sin\alpha\sin(\gamma B_0t) ⟨Sy​⟩=χ†(t)Sy​χ(t)=−2ℏ​sinαsin(γB0​t) 在磁场中自旋会进动. 如果考虑非均匀的磁场: B⃗=−αxi^+(B0+αz)k^\vec{B}=-\alpha x\hat{i}+(B_0+\alpha z)\hat{k} B =−αxi^+(B0​+αz)k^ 自旋磁矩的受力为 F⃗=∇(μ⃗⋅B⃗)\vec{F}=\nabla(\vec\mu\cdot\vec{B})F =∇(μ ​⋅B ),利用旋磁比,F⃗=γ∇(S⃗⋅B⃗)\vec{F}=\gamma\nabla(\vec{S}\cdot\vec{B})F =γ∇(S ⋅B ). 受力为 Fz=γαSz,Fx=−γαSxF_z=\gamma\alpha S_z,\quad F_x=-\gamma\alpha S_x Fz​=γαSz​,Fx​=−γαSx​ 但是自旋本身在绕着 zzz 轴旋转,SxS_xSx​ 的时间平均是 000,最后的运动取决于 SzS_zSz​ 的正负,向上自旋就会向上漂移,向下自旋就会向下漂移,这就是 Stern - Gerlach 效应. 经典的结论认为,因为没有量子化,所以在整个屏幕上观察到的不应该是两点,而应该是一个均匀的角分布.

2025/11/20
articleCard.readMore

Lesson 9 Molecular Motor

在外加一个场 (比如说,电场) 的情况下,新的平衡态不再用原来的平衡量来描述,这种情况下要引入一些别的平衡量,一个例子是「电化学势」, F=qϕ+kBTln⁡cF=q\phi+k_BT\ln c F=qϕ+kB​Tlnc 其实就是单粒子势能加上化学势,F=0F=0F=0 被称为 Nerst 关系. 对于一个跳转的 toy model,方程为 ∂p(x,t)∂t=−∂∂x(vp−D∂p∂x)\frac{\partial p(x,t)}{\partial t}=-\frac{\partial}{\partial x}\left(vp-D\frac{\partial p}{\partial x}\right) ∂t∂p(x,t)​=−∂x∂​(vp−D∂x∂p​) RHS 第一项代表了输运,第二项代表了扩散. 其解为一个不断扩展、向右运动的 Gauss 波包, p(x,t)=12πDte−(x−vt)24Dtp(x,t)=\frac{1}{\sqrt{2\pi Dt}}e^{\displaystyle{-\frac{(x-vt)^2}{4Dt}}} p(x,t)=2πDt ​1​e−4Dt(x−vt)2​ 这个形式和量子力学中的自由粒子很相似. 更加普遍的 Fokker - Planck 方程为 ∂p(x,t)∂t=−∂∂x[A(x)p−12B(x)∂p∂x]\frac{\partial p(x,t)}{\partial t}=-\frac{\partial}{\partial x}\left[A(x)p-\frac{1}{2}B(x)\frac{\partial p}{\partial x}\right] ∂t∂p(x,t)​=−∂x∂​[A(x)p−21​B(x)∂x∂p​] 这描述一个用 A(x)A(x)A(x) 的力牵制住的 Brown 粒子,如果 A(x)=−γxA(x)=-\gamma xA(x)=−γx (线性回复力),B(x)=DB(x)=DB(x)=D,那么 p(x,t)=12πσ2te−(x−x0e−γt)22σ2(t)p(x,t)=\frac{1}{\sqrt{2\pi\sigma^2t}}e^{\displaystyle{-\frac{(x-x_0e^{-\gamma t})^2}{2\sigma^2(t)}}} p(x,t)=2πσ2t ​1​e−2σ2(t)(x−x0​e−γt)2​

2025/11/18
articleCard.readMore

「三次量子化」:宏观量子能级及其相干叠加态 —— 解读今年的 Nobel Prize

有很多问题:我们之前已经给过 Josephson 效应、BE 凝聚等等宏观量子效应,为什么今年还要给量子隧穿效应?在原理和实验上如何区分之前的宏观量子效应和这一次的宏观量子效应? 先说一个答案:「三次量子化」= 序参量量子化 (宏观能级 + 宏观态叠加). 单态凝聚形成了量子系统 先从 BEC 开始,我们知道在低温临界下,不同的原子的 λD\lambda_DλD​ 会相干重叠在一起,形成一个所谓的「宏观原子」. 在空间上,我们发现即使热涨落已经超过原子的相干长度,还是能够看到大量原子聚集在同一个状态上. 数学上, ∣BEC⟩=⊗i=1N∣ψ(xi)eiφi⟩\ket{\text{BEC}} = \overset{N}{\underset{i=1}{\otimes}}\ket{\psi(x_i)e^{\text{i}\varphi_i}} ∣BEC⟩=i=1⊗​N​∣ψ(xi​)eiφi​⟩ 每个准粒子都处于振幅为 ψ(x)\psi(x)ψ(x),位相为 φj\varphi_jφj​ 的态上面. 这样的现象不仅可以出现在原子上,还可以出现在超导声子上,即所谓的超导 BCS 态,这种 BEC 是 kkk 空间的凝聚,而不是实际空间中的凝聚. 如果我们把两块超导体连在一起,中间连接一个绝缘层,那么电流满足: IJ=⟨S(ϕ)∣[HT,NL]∣S(ϕ)⟩I_J=\braket{S(\phi)|[H_T,N_L]|S(\phi)} IJ​=⟨S(ϕ)∣[HT​,NL​]∣S(ϕ)⟩ 简单来说,在一个普通的金属中,电子运动的阻力比较大,因为相互作用;但是如果形成了 Cooper 对,它们能够协同克服阻力,越过势垒形成一个更大的整体. 但是整体来看,这种量子效应仍然是 单个 Cooper 对 的效应,而不是真正的「宏观效应」. 今年的 Nobel Prize 做的事情是,能不能把所有的 Cooper 对变成一个整体,产生大量粒子的真正宏观量子态. 这件事情涉及到序参量量子化的概念. 序参量的量子化:三次量子化 1980 年,A.Leggett 提出之前的所谓宏观量子效应不足以证明量子力学在宏观层面有效,因为讨论量子效应的累计并不代表真正的宏观量子效应. 因此他想到的是在一个超导量子电路中对序参量做量子化,如果能够看到序参量像其他量一样能够存在叠加态,那么才可以真正说是看到了宏观量子效应. 宏观量子化的基本对易关系 (在热力学极限下适用): [ϕ^,N^]=−2i[\hat{\phi},\hat{N}]=-2\text{i} [ϕ^​,N^]=−2i 为了判断是否出现量子化,Leggett 模仿 Bell 不等式提出了 Legget - Garg 不等式,要找到一个宏观的可区分量 (比如说电荷或者磁通),每一个时刻在经典观点下应该有确定、事先存在的值,但如果出现了量子效应,那么在三个时刻下测量到的具体值之间的关联应该强于经典预言下的关联. Leggett 观察到,小型的 Josephson 结可能观测到这种效应. 在 Josephson 结中,电流偏置序参量 —— 位相 ϕ\phiϕ 满足: ϕ¨=−γϕ−I0ICsin⁡ϕ+IIC\ddot{\phi} = -\gamma\phi-\frac{I_0}{I_C}\sin\phi+\frac{I}{I_C} ϕ¨​=−γϕ−IC​I0​​sinϕ+IC​I​ 这表现出一个「向下偏的搓衣板」型的势能特征. 当「搓衣板」倾斜到一定角度,粒子就无法被卡在「搓衣板」的缝隙里面,而是会逃出来,实现隧穿. 因而左右两个 BEC 的态之间就发生了隧穿,我们得以观察. 同时为了保证「序参量」这样的抽象量可以被描述,这个结应该是一个 SQUID,利用超导磁通量子化将位相和磁通量联系在一起. 2025 年 Nobel Prize:宏观量子效应实验 对比经典的热逃逸率和量子隧穿的逃逸速率,前者由温度决定、后者由等离子体频率来决定,观察到底是哪一种效应占据主导就能判断是否产生了宏观量子效应. 实验发现,降温到一定值时,逃逸率不再取决于温度,曲线出现了一个弯折. 为了证明这不是白噪音,还造了一个更大的结来重复实验,出现了同样的结果. 第二个实验是改变偏置电流以控制 U(ϕ)U(\phi)U(ϕ) 的形式,假设存在量子化所计算的能级差,那么在图像上表现为一个共振. 这里的干扰在于,这样的共振峰可能由所谓 Landau 非线性共振来解释,不过这样的效应只能够解释其中一个峰,所以还是可以确定量子效应. 应用:超导量子计算 拉长隧穿时间,可以把这种现象用于超导量子计算. 新一代超导量子比特:游建强老师考虑,电荷噪音在超导量子比特中起到了主导作用,因此用小 Josephson 结并联大电容,压低电荷噪音对比特相干性的影响. 量子编码:用多个物理比特来编码一个逻辑比特,但是现在还没有到实际的应用阶段. 展望 还有没有其他的系统能够做宏观量子效应? 实际上 BEC 的 GP 方程和小 Josephson 结的方程类似,但是多了一个非线性项. 另外一种模型是,在二维运动的电子不符合 Fermi 或者 Bose 统计,而是像电子头上「长了一个磁通」,在相对运动中会因为这个磁通的作用产生一个额外的相因子,既不是 000 也不是 π\piπ,而是任意的一个值,这种「任意子」可以用来做量子计算. 提问 白矮星、中子星这类天体能不能说是「宏观量子效应」? 区分「量子宏观」和「宏观量子」:前者是很多量子效应的叠加. 白矮星这一类由于量子简并压形成的天体应该归类于前一种.

2025/11/18
articleCard.readMore

Exoplanet

—— Sharon 我们已经发现了多少系外行星? 最近刚刚突破 6000 颗 假设是在 10 pc10\text{ pc}10 pc 远处的一颗恒星,相当于地球轨道的一个行星在望远镜中应该距离这个恒星 0.1′′0.1''0.1′′;如果是木星轨道,那么距离大概是 0.5′′0.5''0.5′′,实际上这对于当前的空间望远镜已经不是什么难事. 问题在于这些行星是不发光的. 如果直接观测,那么非常难观测到行星. 间接观测手段是「凌星」和「恒星位移」,凌星是通过行星对恒星光度曲线的遮挡观测到的,恒星位移来源于对恒星受到行星引力影响的移位 (可以通过恒星的红移和蓝移来测量,也可以用恒星在星空中的相对位置来测量). 一个更加特殊的方法是 Microlensing (上面讲过),通过恒星和行星对于背景恒星的光线偏折来观测行星. 哪一种方法找到了最多的系外行星? Transit (凌星). 因为我们可以同时测量全天的大量光度曲线. 考虑分析行星的大气层成分:首先观测主恒星的光谱,当凌星发生时,光线会穿过行星的大气层,这让我们有机会看到行星大气层的吸收谱;另外,当行星转到恒星后面时,行星的发射谱被遮住,对比凌星和这时的光谱也可以计算出发射谱. 如果光谱在不同时间出现了显著的差异,我们有理由说,这个行星大气层中有「云」. Can We Find Life beyond Earth? Cosmic Shoreline:在 Escape velocity (逃逸速度) - Insolation (日照) 图中,画出所有系外行星的散点图,有一条类似正比例函数的「海岸线」,在海岸线左侧的行星日照更强、逃逸速度比较低,它们难以形成大气层,但是更加明亮、容易被观察. K2-18b:超级地球. 我们认为它的温度支持液态水的存在. 另外,JWST 团队观测到了很多在地球上只有生物才能产生的分子的光谱,所以认为这是生物存在的强证据. 当然,大多数天文学家并不认为这个证据足够强,因为 errorbar 实在是太大了. 如果 K2-18b 有表面海洋,那么其海洋温度应该相比地球海洋温度怎样? K2-18b 是一个更大的行星,内部产生的地热更强,所以海洋温度会高于地球海洋温度. 同时,它也会有更厚重的大气层. Formation & Evolution 我们观测到的行星大多数是类地行星和更大质量的那些行星,中间质量的行星的观测数据极少 —— 多数观点认为,这是因为这类行星很容易被光所穿过,所以难以被观测到. 也有观点认为这是因为在形成过程中就是如此. 观测发现,大多数行星都分布在所处星系的同一个平面上. 大多数天文学家认为行星如何形成? Bottom - up,而不是 Top - down. 明显的问题,因为我们见过从小到大的各种行星. 另外,不同的恒星系有很不同的角动量结构,有些恒星的自转方向和行星公转方向反向、甚至有的存在「极轨道」(躺着转). 理论预测行星的轨道可能 decay,导致行星落入恒星,但是我们在实际观测中只看见了一颗这样的实例.

2025/11/18
articleCard.readMore

Lesson 18 辐射

在波导中的电磁波: Ex=A1cos⁡kxxsin⁡kyy⋅ei(kzz−ωt)Ey=A2cos⁡kyysin⁡kxx⋅ei(kzz−ωt)Ez=A3sin⁡kxxsin⁡kyy⋅ei(kzz−ωt)\begin{aligned} &E_x=A_1\cos k_xx\sin k_yy\cdot e^{\text{i}(k_zz-\omega t)}\\\\ &E_y=A_2\cos k_yy\sin k_xx\cdot e^{\text{i}(k_zz-\omega t)}\\\\ &E_z=A_3\sin k_xx\sin k_yy\cdot e^{\text{i}(k_zz-\omega t)} \end{aligned} ​Ex​=A1​coskx​xsinky​y⋅ei(kz​z−ωt)Ey​=A2​cosky​ysinkx​x⋅ei(kz​z−ωt)Ez​=A3​sinkx​xsinky​y⋅ei(kz​z−ωt)​ Bx=−1ω[A2kz+iA3ky]sin⁡kxxcos⁡kyy⋅ei(kzz−ωt)By=−1ω[A1kz+iA3kx]cos⁡kxxsin⁡kyy⋅ei(kzz−ωt)Bz=−1ω[A2kx−A1ky]cos⁡kxxcos⁡kyy⋅ei(kzz−ωt)\begin{aligned} &B_x=-\frac{1}{\omega}[A_2k_z+\text{i}A_3k_y]\sin k_xx\cos k_yy\cdot e^{\text{i}(k_zz-\omega t)}\\\\ &B_y=-\frac{1}{\omega}[A_1k_z+\text{i}A_3k_x]\cos k_xx\sin k_yy\cdot e^{\text{i}(k_zz-\omega t)}\\\\ &B_z=-\frac{1}{\omega}[A_2k_x-A_1k_y]\cos k_xx\cos k_yy\cdot e^{\text{i}(k_zz-\omega t)} \end{aligned} ​Bx​=−ω1​[A2​kz​+iA3​ky​]sinkx​xcosky​y⋅ei(kz​z−ωt)By​=−ω1​[A1​kz​+iA3​kx​]coskx​xsinky​y⋅ei(kz​z−ωt)Bz​=−ω1​[A2​kx​−A1​ky​]coskx​xcosky​y⋅ei(kz​z−ωt)​ 可以定出横电波和横磁波的条件. 在波导管中选择尽量简单的模式,可以保证在我们开孔检测内部电磁场的情况下不影响波的传播 (不会阻断其中的电流,因为电流只会沿着某个方向传递). 辐射 把 Faraday 定律改写成 ∇×E⃗=−∇×∂A⃗∂t\nabla\times\vec{E} = -\nabla\times\frac{\partial\vec{A}}{\partial t} ∇×E =−∇×∂t∂A ​ 移项,发现可以构造一个矢量 E⃗+∂A⃗/∂t\vec{E}+\partial\vec{A}/\partial tE +∂A /∂t,为一个无旋场. 这意味着这个矢量能够被表达为某个标量场的梯度,我们说这个标量场也叫做 φ\varphiφ,那么 E⃗=−∇φ−∂A⃗∂t\vec{E}=-\nabla\varphi-\frac{\partial\vec{A}}{\partial t} E =−∇φ−∂t∂A ​ 注意,这里的 φ\varphiφ 不能和原来静电场中的那个电势等同,这是用来做电磁波辐射计算时引入的「电势」. 规范变换: {A⃗→A⃗′=A⃗+∇ψψ→ψ′=ψ−∂ψ∂t\left\{\begin{aligned} &\vec{A}\to\vec{A}'=\vec{A}+\nabla\psi\\\\ &\psi\to\psi'=\psi-\frac{\partial\psi}{\partial t} \end{aligned}\right. ⎩ ⎨ ⎧​​A →A ′=A +∇ψψ→ψ′=ψ−∂t∂ψ​​ 因此,物理上可测量的量是在规范变换下不变的,但是为了保证我们能够唯一地确定两个数学辅助量电势、磁矢势的值,必须要引入规范条件. Coulomb 规范: ∇⋅A⃗=0\nabla\cdot\vec{A}=0 ∇⋅A =0 Lorentz 规范: ∇⋅A⃗+1c2∂φ∂t=0\nabla\cdot\vec{A}+\frac{1}{c^2}\frac{\partial\varphi}{\partial t}=0 ∇⋅A +c21​∂t∂φ​=0 这个规范能够把方程化为对称形式. 在 Lorentz 规范下,势和源的依赖关系是 ∇2φ−1c2∂2φ∂t2=−ρε0,∇2A⃗−1c2∂2A⃗∂t2=−μ0j⃗\nabla^2\varphi-\frac{1}{c^2}\frac{\partial^2\varphi}{\partial t^2}=-\frac{\rho}{\varepsilon_0},\quad \nabla^2\vec{A}-\frac{1}{c^2}\frac{\partial^2\vec{A}}{\partial t^2}=-\mu_0\vec{j} ∇2φ−c21​∂t2∂2φ​=−ε0​ρ​,∇2A −c21​∂t2∂2A ​=−μ0​j ​ LHS 均为 d'Alembert 算符作用,所以势也存在波动解. 考虑一个随时间变化的点电荷 Q(t)Q(t)Q(t),那么方程为 ∇2φ−1c2∂2φ∂t2=−1ε0Q(t)δ(x⃗)\nabla^2\varphi-\frac{1}{c^2}\frac{\partial^2\varphi}{\partial t^2}=-\frac{1}{\varepsilon_0}Q(t)\delta(\vec{x}) ∇2φ−c21​∂t2∂2φ​=−ε0​1​Q(t)δ(x ) 在非 x⃗=0\vec{x}=0x =0 的位置就是波动方程.

2025/11/18
articleCard.readMore

Lesson 16 自旋 (二)

Pauli 矩阵: σx=(0110),σy=(0−ii0),σz=(100−1)\sigma_x=\begin{pmatrix} 0&1\\1&0 \end{pmatrix},\quad\sigma_y=\begin{pmatrix} 0&-\text{i}\\\text{i}&0 \end{pmatrix},\quad\sigma_z=\begin{pmatrix} 1&0\\0&-1 \end{pmatrix} σx​=(01​10​),σy​=(0i​−i0​),σz​=(10​0−1​) 自旋是 Si=ℏ2σiS_i=\frac{\hbar}{2}\sigma_iSi​=2ℏ​σi​. 它们的性质是, [σj,σk]=2iεjkiσi[\sigma_j,\sigma_k]=2\text{i}\varepsilon_{jki}\sigma_i[σj​,σk​]=2iεjki​σi​,也就是自旋 [Sj,Sk]=iℏεjkiSi[S_j,S_k]=\text{i}\hbar\varepsilon_{jki}S_i[Sj​,Sk​]=iℏεjki​Si​. {σj,σk}=2δjkI\{\sigma_j,\sigma_k\}=2\delta_{jk}I{σj​,σk​}=2δjk​I,也就是自旋 Si2+Sj2+Sk2=34ℏ2IS_i^2+S_j^2+S_k^2=\frac{3}{4}\hbar^2ISi2​+Sj2​+Sk2​=43​ℏ2I. σi†=σi\sigma_i^\dagger=\sigma_iσi†​=σi​,本征值是 111. ⟨Sx2⟩+⟨Sy2⟩+⟨Sz2⟩=ℏ24⋅(I+I+I)=34ℏ2I\Braket{S_x^2}+\Braket{S_y^2}+\Braket{S_z^2}=\frac{\hbar^2}{4}\cdot(I+I+I)=\frac{3}{4}\hbar^2I ⟨Sx2​⟩+⟨Sy2​⟩+⟨Sz2​⟩=4ℏ2​⋅(I+I+I)=43​ℏ2I 其中用到了 σi2={σi,σi}/2=I\sigma_i^2=\{\sigma_i,\sigma_i\}/2=Iσi2​={σi​,σi​}/2=I,这个结果符合角动量量子化: S2=s(s+1)ℏ2=12(12+1)ℏ2=34ℏ2S^2=s(s+1)\hbar^2=\frac{1}{2}\left(\frac{1}{2}+1\right)\hbar^2=\frac{3}{4}\hbar^2 S2=s(s+1)ℏ2=21​(21​+1)ℏ2=43​ℏ2 自旋磁矩:比轨道角动量的旋磁比要大一倍,旋磁比定义为 μ⃗=γB⃗\vec{\mu}=\gamma\vec{B}μ ​=γB 中的 γ\gammaγ. Lamor 进动:在一个恒定的磁场 B⃗0\vec{B}_0B 0​ 中的自旋进动, ⟨S⃗(t)⟩=ℏ2[sin⁡αcos⁡(γB0t)x^−sin⁡αsin⁡(γB0t)y^+cos⁡αz^]\Braket{\vec{S}(t)}=\frac{\hbar}{2}[\sin\alpha\cos(\gamma B_0t)\hat{x}-\sin\alpha\sin(\gamma B_0t)\hat{y}+\cos\alpha\hat{z}] ⟨S (t)⟩=2ℏ​[sinαcos(γB0​t)x^−sinαsin(γB0​t)y^​+cosαz^]

2025/11/18
articleCard.readMore

Lesson 8 Legendre 多项式

在球坐标下, 1sin⁡θddθ(sin⁡θdΘ(θ)dθ)+λΘ(θ)=0\frac{1}{\sin\theta}\frac{\text{d}}{\text{d}\theta}\left(\sin\theta\frac{\text{d}\varTheta(\theta)}{\text{d}\theta}\right)+\lambda\varTheta(\theta)=0 sinθ1​dθd​(sinθdθdΘ(θ)​)+λΘ(θ)=0 如果换元 x=cos⁡θx=\cos\thetax=cosθ,y=Θ(θ)y=\varTheta(\theta)y=Θ(θ),并把 λ\lambdaλ 写成 ν(ν+1)\nu(\nu+1)ν(ν+1),本征值问题变为 ddx[(1−x2)dydx]+ν(ν+1)y=0\frac{\text{d}}{\text{d}x}\left[(1-x^2)\frac{\text{d}y}{\text{d}x}\right]+\nu(\nu+1)y=0 dxd​[(1−x2)dxdy​]+ν(ν+1)y=0

2025/11/14
articleCard.readMore

Lesson 9 Density Estimation

提示 Quizzes 在不同情况下应该怎么做推断? 我们已经了解得很深入. 参数推断 有一定了解. 模型选择 完全不了解. 非参数统计 比如,用基函数展开可能的函数形式. 在参数推断时,最关键的是哪一个量? 后验,也就是: P(θ∣DMI)=P(D∣θMI)P(θ∣MI)P(D∣MI)P(\theta|DMI) = \frac{P(D|\theta MI)P(\theta|MI)}{P(D|MI)} P(θ∣DMI)=P(D∣MI)P(D∣θMI)P(θ∣MI)​ 在模型选择时,最关键的是什么? Bayes 因子,也就是后验比,其中的重要成分是我们所谓的归一化因子 —— 证据. 下面有关非参数统计的表述,正确的是: 没有参数 参数的数量固定 利用一个 flexible 函数形式,来保证能够符合我们的模型 设置弱的、general 的先验 (not necessarily uniform) 通常用更多参数,而不是用参数化的模型 最终我们可以得到一些性质,以便于进行下一步的参数化模型选择 选择 c., d., e., f. 基函数展开有关表述: 结果会取决于基函数 基函数的性质如果出现了简并,那么最后的结果不能用 不同问题需要选取不同基函数 基函数的类型、项的数量可以在下一步被模型选择所精确 选择 b., c., d. Gaussian 过程有关表述: 描述的不是函数的分布 先验是由一个平均函数 (often zero) 和一个有超参数的协方差核所决定的 超参数可以从训练集得出 如果训练集距离真值很远,我们不能得到好的预测 如果数据有噪声,那么不能工作 如果数据不是 Gaussian 过程生成的,那么不能得到正确的结果 注意 Gaussian 过程的具体含义是,我们利用不同的协方差矩阵,在函数空间对函数进行采样 (超参数的采样). 训练集的作用是,告诉我们这些采样的函数的极限范围大概是多少、弥散大概是怎样的. 选择 a., b., c. 我们用什么来描述「不确定的程度」? 信息熵: H=−∑ipiln⁡piH=-\sum_ip_i\ln p_i H=−i∑​pi​lnpi​ 无差别原理是我们最早提出的、判断未知事件的概率分布的原理,它和熵有何关系? 无差别原理对应最大熵原理. Gauss 分布和最大熵原理的关系? 给定均值和方差的情况下,最大熵对应的分布是 Gauss 分布. 上节课我们做的是非参数统计,完全不知道如何构建模型. 这节课我们的了解更少,只能从数据本身推断出可能的结构,甚至无法取基函数. 我们的目的是: 从很多噪声的 MCMC 采样中得到 smooth, bin-free 的概率分布 没有事先模型、解析结果的情况下,得到一个估计 这个过程可以在真实的物理上,也可以是对一个虚拟的参数做估计. Histograms 直方图的定义是, h(x)=∑k=1MhkΠ(x;xk−1,xk)h(x) = \sum_{k=1}^Mh_k\Pi(x;x_{k-1},x_k) h(x)=k=1∑M​hk​Π(x;xk−1​,xk​) 实际上就是一种数数,但是很有用,比如我们做数值积分就可以利用直方图做 Riemann 和. 直方图 bins 太少,会导致很多重要的数据特征没有体现出来;bins 太多,会产生大量的「毛刺」,噪声非常明显. 我们在取 bins 的时候,有一个 Scott 经验法则,对于 NNN 点和标准差 σ^\hat\sigmaσ^,取 vscott=3.49σ^N−1/3v_{\text{scott}}=3.49\hat\sigma N^{-1/3} vscott​=3.49σ^N−1/3 但是仅仅对 Gauss 分布有效. 一个简单的拓展是,Freedman - Diaconis rule,把对长尾敏感的标准差换成百分位数,得到 vFD=2(q75−q25)N−1/3v_{\text{FD}} = 2(q_{75}-q_{25})N^{-1/3} vFD​=2(q75​−q25​)N−1/3 这些经验法则并不能很好地处理窄峰、比较精细的分布 (比如课堂上的 5 个 Lorentz 分布叠加的神必分布),我们还需要更加有效的方法. Knuth Method 暂时先不考虑每个 bin 的宽度不同. 考虑 MMM 个 bin,MMM 作为参数,就变为我们熟悉的问题了,即对下面这个函数做参数估计: h(x)=MV∑k=1MπkΠ(x;xk−1,xk),∑k=1Mπk=1h(x) = \frac{M}{V}\sum_{k=1}^M\pi_k\Pi(x;x_{k-1},x_k),\quad \sum_{k=1}^M\pi_k=1 h(x)=VM​k=1∑M​πk​Π(x;xk−1​,xk​),k=1∑M​πk​=1 就是要找到一个 MMM 使得 h(x)h(x)h(x) 最接近我们的数据. Bayes 定理: P(π,M∣DI)∝P(D∣π,MI)P(π,M∣I)=P(D∣π,MI)P(π∣MI)P(M∣I)P(\pi,M|DI)\propto P(D|\pi,MI)P(\pi,M|I) = P(D|\pi,MI)P(\pi|MI)P(M|I) P(π,M∣DI)∝P(D∣π,MI)P(π,M∣I)=P(D∣π,MI)P(π∣MI)P(M∣I) 边缘化为 P(M∣DI)=∫P(π,M∣DI)dπ∝P(M∣I)∫P(D∣π,MI)P(π∣MI)dπP(M|DI) =\int P(\pi,M|DI)\text{d}\pi\propto P(M|I)\int P(D|\pi,MI)P(\pi|MI)\text{d}\pi P(M∣DI)=∫P(π,M∣DI)dπ∝P(M∣I)∫P(D∣π,MI)P(π∣MI)dπ 先验是均匀分布的 MMM,以及多方的 Jeffreys' for π\piπ: P(π∣MI)=Γ(M/2)ΓM(1/2)∏k=1Mπk−1/2P(\pi|MI) = \frac{\Gamma(M/2)}{\Gamma^M(1/2)}\prod_{k=1}^M\pi_k^{-1/2} P(π∣MI)=ΓM(1/2)Γ(M/2)​k=1∏M​πk−1/2​ 似然是 P(D∣π,MI)=(MV)N∏k=1MπknkP(D|\pi,MI) = \left(\frac{M}{V}\right)^N\prod_{k=1}^M\pi_k^{n_k} P(D∣π,MI)=(VM​)Nk=1∏M​πknk​​ 虽然结果并没有比 FD-rule 好很多,但是至少已经抛弃了 Gauss 分布的前提. Adaptive binning: Bayesian Blocks 直译过来就是自适应的 bin 宽度. 这种方式能够处理小的尖峰 (这个方法是由研究脉冲的天文学家提出的),在不同的数据密度处取不同的 bin 宽度. 这一次我们联合优化 bins 的数量 NbN_bNb​ 和 bins 的宽度构成的向量 T\bold{T}T. 这种情况我们不得不做假设了,下面说几种. 假设数据由 Poisson 分布生成,那么 ln⁡Lmax⁡=∑k=1Nbln⁡Lmax⁡(k)=∑k=1Nbnk(ln⁡nk−ln⁡Tk)+const.\ln\mathcal{L}_{\max}=\sum_{k=1}^{N_b}\ln\mathcal{L}_{\max}^{(k)} = \sum_{k=1}^{N_b}n_k(\ln n_k-\ln T_k)+\text{const.} lnLmax​=k=1∑Nb​​lnLmax(k)​=k=1∑Nb​​nk​(lnnk​−lnTk​)+const. 第二种假设是考虑仪器的测量误差是 Gaussian 分布的,有 ln⁡L({xi,σi}∣Nn,TI)=−12∑k=1Nb∑i∈k(xi−μkσi)2+const.\ln\mathcal{L}(\{x_i,\sigma_i\}|N_n,\bold{T}I)=-\frac{1}{2}\sum_{k=1}^{N_b}\sum_{i\in k}\left(\frac{x_i-\mu_k}{\sigma_i}\right)^2+\text{const.} lnL({xi​,σi​}∣Nn​,TI)=−21​k=1∑Nb​​i∈k∑​(σi​xi​−μk​​)2+const. 这个方法的问题在于,如果我们移动 bin 的起始点位置,会对最后的记过造成很大的影响;另外,高维情况下几乎没有办法处理. 代码: import numpy as np import matplotlib.pyplot as plt from astropy.visualization import hist from scipy.stats import norm, laplace # Generate sample data N = 500 # total number of samples weights = [0.7, 0.15, 0.15] # mixture weights dists = [laplace(0,0.4), norm(-4,0.2), norm(4,0.2)] data = np.hstack([d.rvs(int(N * w)) for d,w in zip(dists,weights)]) fig, ax = plt.subplots() hist_values, hist_bin_edges = [], [] for method in ['scott', 'freedman', 'knuth', 'blocks']: value, edges, _ = hist(data, bins=method, ax=ax, density=True) hist_values.append(value) # retrieve histogram values hist_bin_edges.append(edges) # retrieve bin edges Continuous Estimators Kernel Density Estimator (KDE) 在每个样本附近放一个小的 bump,bump 的求和会给出一个光滑的概率密度分布 (bump 是光滑的). 得到 f^h(x)=1NhD∑i=1NK(d(x,xi)h)\hat{f}_h(x)=\frac{1}{Nh^D}\sum_{i=1}^NK\left(\frac{d(x,x_i)}{h}\right) f^​h​(x)=NhD1​i=1∑N​K(hd(x,xi​)​) 其中 K(x)K(x)K(x) 是 kernel,也就是每一个 bump 的形状. 和 histogram 对比,可以看出 KDE 的好处是,可以得到连续的分布. 但是最大的缺点是,整个分布对带宽 (kernel 的宽度) 非常敏感,不同带宽会得到完全不一样的分布. 这本质上和 bins 的数量问题是一样的,也有 Scott's rule 和 FD rule. 还有一个 cross - validation 方法:最大化下面的 leave - one - out (LOO) 的 log - likelihood: CVLL(h)=1N∑i=1Nlog⁡f^hi−i(xi)\text{CV}_{LL}(h) = \frac{1}{N}\sum_{i=1}^N\log \hat{f}_{h_i-i}(x_i) CVLL​(h)=N1​i=1∑N​logf^​hi​−i​(xi​) KDE 的另一个好处是,可以方便地给出测量的误差. 我们先假设 f(x)f(x)f(x) (分布) 是测量误差和真实分布的卷积: f(x)=(h⋆g)(x)≡∫h(u)g(x−u)duf(x) = (h\star g)(x)\equiv\int h(u)g(x-u)\text{d}u f(x)=(h⋆g)(x)≡∫h(u)g(x−u)du 仔细观察其实也可以发现,KDE 给出的本来就是 kernel 函数和真实分布的卷积,所以做一个反卷积会得到我们所谓的真值分布. 在高维情况下,带宽是一个矩阵,这时需要对数据做一个 pre - whitening (清洗),将每个维度的参数无量纲化,变成一个对称矩阵,用一个各向同性的 kernel 去做 KDE. 代码: import numpy as np from sklearn.neighbors import KernelDensity from sklearn.model_selection import GridSearchCV, LeaveOneOut param_grid = {'bandwidth': np.logspace(-1, 1, 20)} kde = GridSearchCV(KernelDensity(kernel='gaussian'), param_grid, cv=LeaveOneOut()) kde.fit(data[:, None]) print("Best bandwidth: ", kde.best_estimator_.bandwidth) # Evaluate the density on a grid of points (`x_grid`) pdf_kde = np.exp(kde.best_estimator_.score_samples( x_grid[:, None])) # Or, if you have a fixed bandwidth # kde_fixed = KernelDensity(bandwidth=0.5, kernel='gaussian') # kde_fixed.fit(data[:, None]) k - nearest neighbor (k - NN) estimator 基于「邻居」的 kernel: f^k(x)=kNVD(dk)\hat{f}_k(x) = \frac{k}{NV_D(d_k)} f^​k​(x)=NVD​(dk​)k​ 也就是自适应的一种 kernel,不是全部一样的 kernel. 这里 VD(dk)V_D(d_k)VD​(dk​) 是 DDD 维、直径 dkd_kdk​ 的球的体积. 虽然比之前的 KDE 要更进一步,但是还是有一个自由参数,也就是 kkk —— 到底要取几个「邻居」? 代码实践仍然不算难,调用 astroML 包 (astro - machine learning), import numpy as np from astroML.density_estimation import KNeighborsDensity from sklearn.model_selection import GridSearchCV, KFold def knn_scorer(estimator, x_data, y=None): """Custom scorer for k-NN density estimator""" dens = np.maximum(estimator.eval(x_data), 1e-99) return np.mean(np.log(dens)) param_grid = {'k': np.arange(5, 125, 5)} knn = GridSearchCV(KNeighborsDensity('bayesian'), param_grid, cv=KFold(n_splits=5), scoring=knn_scorer) knn.fit(data[:, None]) print("Best k: ", knn.best_estimator_.k) # Evaluate the density on a grid of points (`x_grid`) pdf_knn = knn.best_estimator_.eval(x_grid[:, None]) AI - Based Directions 注意 大家是不是写作业的时候离不开 AI 了... 神经网络的不同权重可以表达处不同的函数. 两种手段: Normalizing flows:从一个简单的基础分布 (比如说 Gaussian) 开始,学习一个可逆双射,映射进入数据空间;从这些变量的变化中找到 density. Autoregressive models:通过乘积法则把联合分布因式分解,用神经网络把每一个条件概率算出来. Normalizing Flows: 从一个简单的分布开始,z0∼N(0,1)z_0\sim\mathcal{N}(0,1)z0​∼N(0,1),考虑一个序列 zk=fk(zk−1)z_k = f_{k}(z_{k-1})zk​=fk​(zk−1​),通过这样的序列把标准的正态分布变成一个任意的分布: pX(x)=pZ(z0)∏i=1K∣det⁡Jfi(zi−1)∣−1p_X(x)=p_Z(z_0)\prod_{i=1}^K|\det J_{f_i}(z_{i-1})|^{-1} pX​(x)=pZ​(z0​)i=1∏K​∣detJfi​​(zi−1​)∣−1 这里,JfiJ_{f_i}Jfi​​ 是 Jacobian Jfi(zi−1)=∂fi(zi−1)/∂zi−1J_{f_i}(z_{i-1})=\partial f_i(z_{i-1})/\partial z_{i-1}Jfi​​(zi−1​)=∂fi​(zi−1​)/∂zi−1​. 我们训练集的目的是最大化似然: max⁡θ1N∑j=1Nlog⁡pX(xj;θ)\max_{\theta}\frac{1}{N}\sum_{j=1}^N\log p_X(x_j;\theta) θmax​N1​j=1∑N​logpX​(xj​;θ) Autoregressive Model: 利用神经网络来对序列中的每一个步骤建模,其实就是一个乘积法则: P(x1,x2,⋯ ,xD)=∏i=1DP(xi∣x1,x2,⋯ ,xi−1)P(x_1,x_2,\cdots,x_D) = \prod_{i=1}^D P(x_i|x_1,x_2,\cdots,x_{i-1}) P(x1​,x2​,⋯,xD​)=i=1∏D​P(xi​∣x1​,x2​,⋯,xi−1​) 下面我们可以做一件更更加有野心的事情,我们可以不知道似然是什么样子了,但是给定参数、模型和背景信息可以模拟出整个数据. 也就是,可以学习后验,来模拟出似然,得到后验;或者学习似然,模拟出后验. 计算参数和数据的联合分布,P(θ,x)P(\theta,x)P(θ,x),神经网络学习这样的分布之后,可以在输入观测数据 xxx 之后直接输出参数的后验分布. Exercise SDSS 巡天的「Great Wall」. SDSS 巡天项目中发现了一条长达亿光年尺度的结构,请大家用自己喜欢的方法 (KDE、kkk - NN 等) 画出它的二维分布.

2025/11/13
articleCard.readMore

Lesson 17 波导

一个平面波可以被 7 个独立的参数描述,分别是振幅的 x,yx,yx,y 分量和对应的相位,以及波矢的三个分量. 能量表达式仍然不变,如果外接电源,则电池的能量会被带走进入电磁波的能量中. 直入射良导体的情况, E0′E0=k′′−kk+k′′,E0′′E0=2kk+k′′\frac{E'_0}{E_0}=\frac{k''-k}{k+k''},\quad\frac{E_0''}{E_0}=\frac{2k}{k+k''} E0​E0′​​=k+k′′k′′−k​,E0​E0′′​​=k+k′′2k​ 透射波的波矢为 k′′=k0,z+iτk''=k_{0,z}+\text{i}\tauk′′=k0,z​+iτ,良导体情况下 τ∼k0,z\tau\sim k_{0,z}τ∼k0,z​,因此 k′′k=2⋅k0,zkeiπ/4=2⋅μσω/2ε0μ0ωeiπ/4=σε0ωeiπ/4\frac{k''}{k}=\sqrt{2}\cdot\frac{k_{0,z}}{k}e^{\text{i}\pi/4} = \sqrt{2}\cdot\frac{\sqrt{\mu\sigma\omega /2}}{\sqrt{\varepsilon_0\mu_0}\omega}e^{\text{i}\pi/4}=\sqrt{\frac{\sigma}{\varepsilon_0\omega}}e^{\text{i}\pi/4} kk′′​=2 ​⋅kk0,z​​eiπ/4=2 ​⋅ε0​μ0​ ​ωμσω/2 ​​eiπ/4=ε0​ωσ​ ​eiπ/4 这里反射波带走了几乎所有的能量,透射波强度小、穿透深度小. 电磁波在波导中的传播 假设电磁波的解为 E⃗(x⃗,t)=E⃗0(x,y)ei(kzz−ωt)\vec{E}(\vec{x},t)=\vec{E}_0(x,y)e^{\text{i}(k_zz-\omega t)} E (x ,t)=E 0​(x,y)ei(kz​z−ωt) 做这样猜解的原因是,波在 x,yx,yx,y 方向都被限制了,因此只能沿着 zzz 方向传播;方程为 ∂2u∂x2+∂2u∂y2+(k2−kz2)u=0\frac{\partial^2u}{\partial x^2}+\frac{\partial^2u}{\partial y^2}+(k^2-k_z^2)u=0 ∂x2∂2u​+∂y2∂2u​+(k2−kz2​)u=0 分离变量,假设 U(x,y)=X(x)Y(y)U(x,y)=X(x)Y(y)U(x,y)=X(x)Y(y),得到两个简谐方程 d2Xdx2+kx2X=0,d2Ydy2+ky2Y=0\frac{\text{d}^2X}{\text{d}x^2}+k_x^2X=0,\quad\frac{\text{d}^2Y}{\text{d}y^2}+k_y^2Y=0 dx2d2X​+kx2​X=0,dy2d2Y​+ky2​Y=0 解得 Ex=(Asin⁡kxx+Bcos⁡kxx)(Csin⁡kyy+Dcos⁡kyy)ei(kzz−ωt)Ey=(A′sin⁡kxx+B′cos⁡kxx)(C′sin⁡kyy+D′cos⁡kyy)ei(kzz−ωt)Ez=(A′′sin⁡kxx+B′′cos⁡kxx)(C′′sin⁡kyy+D′′cos⁡kyy)ei(kzz−ωt)\begin{aligned} &E_x=(A\sin k_xx+B\cos k_xx)(C\sin k_yy+D\cos k_yy)e^{\text{i}(k_zz-\omega t)}\\\\ &E_y=(A'\sin k_xx+B'\cos k_xx)(C'\sin k_yy+D'\cos k_yy)e^{\text{i}(k_zz-\omega t)}\\\\ &E_z=(A''\sin k_xx+B''\cos k_xx)(C''\sin k_yy+D''\cos k_yy)e^{\text{i}(k_zz-\omega t)} \end{aligned} ​Ex​=(Asinkx​x+Bcoskx​x)(Csinky​y+Dcosky​y)ei(kz​z−ωt)Ey​=(A′sinkx​x+B′coskx​x)(C′sinky​y+D′cosky​y)ei(kz​z−ωt)Ez​=(A′′sinkx​x+B′′coskx​x)(C′′sinky​y+D′′cosky​y)ei(kz​z−ωt)​ 边界条件是 EEE 在边界上的切向分量为零,BBB 在边界上的法向分量为零 (波导管的边界是良导体);同时有横波条件 ∂En/∂n^=0\partial E_n/\partial\hat{n}=0∂En​/∂n^=0. 能够出现的模式要求 kx=mπa,ky=nπbk_x = \frac{m\pi}{a},\quad k_y=\frac{n\pi}{b} kx​=amπ​,ky​=bnπ​ 同时如果模式太高,会造成 kzk_zkz​ 变为虚数、也就是传播衰减的情况,这定出了一个截止模式. 对于磁场,应该有 ∇×E⃗=−∂B⃗∂t=iωB⃗\nabla\times\vec{E} = -\frac{\partial\vec{B}}{\partial t}=\text{i}\omega\vec{B} ∇×E =−∂t∂B ​=iωB 最终应该有两种波,横电波 (TE) 和横磁波 (TM),两种波分别满足 A1A2=−kykx,A1A2=kxky\frac{A_1}{A_2} = -\frac{k_y}{k_x},\quad \frac{A_1}{A_2}=\frac{k_x}{k_y} A2​A1​​=−kx​ky​​,A2​A1​​=ky​kx​​ 这两种偏振恰好是垂直的两种线偏振. 截止频率: ωc,mn=πμε(ma)2+(nb)2\omega_{c,mn}=\frac{\pi}{\sqrt{\mu\varepsilon}}\sqrt{\left(\frac{m}{a}\right)^2+\left(\frac{n}{b}\right)^2} ωc,mn​=με ​π​(am​)2+(bn​)2 ​ 所有截止频率中最低的一个是 101010 模式的截止频率 (假设长边是 aaa),获得截止波长 λc,10=2a\lambda_{c,10}=2a λc,10​=2a 可以通过改变波导管的尺寸来限制能够传播的模式,简化可能传播的那些频率. 同时,波导管中的波前并不是垂直 zzz 方向,而是一个侧着的平面,相速度允许超过光速;这样的超光速并不违背相对论,因为这是一个严格的单色波,没有调幅和调频,因此不能携带任何有效的信号.

2025/11/13
articleCard.readMore

Lesson 15 自旋

角动量的另一个对易关系, [L2,L⃗]=0,[L2,Li]=0[L^2,\vec{L}]=0,\quad[L^2,L_i]=0 [L2,L ]=0,[L2,Li​]=0 考虑新定义一个角动量升降算符, L^±=L^x±iL^y\hat{L}_{\pm} = \hat{L}_x\pm \text{i}\hat{L}_y L^±​=L^x​±iL^y​ 计算这个算符的本征值,得到 L2ft=(L−L+Lz2+ℏLz)ft=ℏ2l(l+1)ftL^2f_t = (L_-L_+L_z^2+\hbar L_z)f_t = \hbar^2l(l+1)f_t L2ft​=(L−​L+​Lz2​+ℏLz​)ft​=ℏ2l(l+1)ft​ 也就是说这个本征值是 λ=ℏ2l(l+1)\lambda=\hbar^2l(l+1)λ=ℏ2l(l+1). 因此角动量的模长本征值只能是 ℏl(l+1)\hbar\sqrt{l(l+1)}ℏl(l+1) ​,对于每一个这样的角动量,都能绕着 zzz 轴扫出一个锥面,这就是一个相干态. 实际上我们刚刚的计算中对 lll 是什么样的数字并没有要求,但是 Lz=ℏmL_z=\hbar mLz​=ℏm 应该是分立的值,而同时有 m=−l,−l+1,⋯ ,0,⋯ ,lm=-l,-l+1,\cdots,0,\cdots,lm=−l,−l+1,⋯,0,⋯,l. 也就是对于一个 lll,有 2l+12l+12l+1 个 mmm 值,要求 l=l=l= 半整数. 这会造成特殊的性质,也就是自旋需要转 4π4\pi4π 才能够回到自身. 自旋 自旋是固有的性质,和坐标、运动没有关系. 自旋的大小只能是半整数和整数,fermion 的自旋是半整数、boson 的自旋为整数. 在二维空间中 zzz 方向自旋的表示为 Sz=ℏ2(100−1)S_z=\frac{\hbar}{2}\begin{pmatrix} 1&0\\0&-1 \end{pmatrix} Sz​=2ℏ​(10​0−1​) 自旋的升降算符 S±=ℏ(01 or 00 or 10)S_{\pm}=\hbar\begin{pmatrix} 0&1\text{ or }0\\0\text{ or }1&0 \end{pmatrix} S±​=ℏ(00 or 1​1 or 00​) Pauli 矩阵: σx=(0110),σy=(0−ii0),σz=(100−1)\sigma_x=\begin{pmatrix} 0&1\\1&0 \end{pmatrix},\quad\sigma_y=\begin{pmatrix} 0&-\text{i}\\\text{i}&0 \end{pmatrix},\quad\sigma_z=\begin{pmatrix} 1&0\\0&-1 \end{pmatrix} σx​=(01​10​),σy​=(0i​−i0​),σz​=(10​0−1​)

2025/11/13
articleCard.readMore

Lesson 8 超快物理 & 精密测量

飞秒照相机 —— 超快物理 LASER 实际上是一种缩写,Light Amplificated by Simulated Emission Radiation,也就是受激辐射所产生的光放大. 超快激光的时间尺度一般是飞秒量级,也就是 10−15 s10^{-15}\text{ s}10−15 s 级别,目前有皮秒激光、飞秒激光,比较新的有阿秒激光. 能标上,最高能够达到拍瓦. 如果是不同波长的波叠加,并且是相位不固定的自然光,那么这种叠加光相消的概率非常大,最终只会得到比较混乱的一些本底;但是在激光中,不同频的光波是同相的,在同时达到峰值时会出现极大值. 一般我们用作激光器的物质是氧化铝中掺杂钛 (也就是红宝石),这种物质的吸收谱和发射谱都比较宽,可以在共振腔中做锁模产生激光.

2025/11/12
articleCard.readMore

Lesson 8 Diffusion

之前讲的内容比较静态,之后我们需要了解分子的动力学. 从扩散开始,到最重要的分子马达. 随机行走:Brown 运动 我们认为 Brown 粒子本身和水分子处于热平衡的状态,取时间尺度为 Δt\Delta tΔt,在这么短的时间内只有一个水分子和粒子发生碰撞. 那么考虑 NNN 个时间段之后,首先可以确认的是,平均值 ⟨xN⟩\braket{x_N}⟨xN​⟩ 应该等于零. ⟨xN2⟩=⟨(∑iΔxi)(∑jΔxj)⟩=∑i⟨Δxi2⟩+∑i≠j⟨ΔxiΔxj⟩\braket{x_N^2} =\Braket{\left(\sum_i\Delta x_i\right)\left(\sum_j\Delta x_j\right)} = \sum_i\braket{\Delta x_i^2}+\sum_{i\neq j}\braket{\Delta x_i\Delta x_j} ⟨xN2​⟩=⟨(i∑​Δxi​)(j∑​Δxj​)⟩=i∑​⟨Δxi2​⟩+i=j∑​⟨Δxi​Δxj​⟩ 认为任意两次之间是相互独立的,所以上式化为 ⟨xN2⟩=∑i⟨Δxi2⟩∝t⟹⟨xN2⟩=2Dt\braket{x_N^2}=\sum_i\braket{\Delta x_i^2} \propto t\Longrightarrow\braket{x_N^2}=2Dt ⟨xN2​⟩=i∑​⟨Δxi2​⟩∝t⟹⟨xN2​⟩=2Dt 如果是很多个 Brown 粒子,那么考虑这些粒子的浓度,首先是守恒方程 ∂c∂t+∇⋅j⃗=0\frac{\partial c}{\partial t}+\nabla\cdot\vec{j}=0 ∂t∂c​+∇⋅j ​=0 对于 x→x+dxx\to x+\text{d}xx→x+dx 之间的一段,在一维情况下, j⃗=1AΔt(−N(x+dx)2+N(x)2)x^=−∂N(x)∂x⋅(Δx)2AΔxΔt=−∂N(x)∂x⋅D⋅1AΔx\vec{j}=\frac{1}{A\Delta t}\left(-\frac{N(x+\text{d}x)}{2}+\frac{N(x)}{2}\right)\hat{x} = -\frac{\partial N(x)}{\partial x}\cdot\frac{(\Delta x)^2}{A\Delta x\Delta t} = -\frac{\partial N(x)}{\partial x}\cdot D\cdot\frac{1}{A\Delta x} j ​=AΔt1​(−2N(x+dx)​+2N(x)​)x^=−∂x∂N(x)​⋅AΔxΔt(Δx)2​=−∂x∂N(x)​⋅D⋅AΔx1​ 那个 1/21/21/2 来源于粒子可以往两边跑. 也就是 j⃗=−D∇c\vec{j}=-D\nabla cj ​=−D∇c (Fick 扩散定律),最终联立有 ∂c∂t=D∇2c\frac{\partial c}{\partial t}= D\nabla^2 c ∂t∂c​=D∇2c 解得粒子浓度应该是 c(x,t)=N4πDte−x2/(4Dt)c(x,t)=\frac{N}{\sqrt{4\pi Dt}}e^{-x^2/(4Dt)} c(x,t)=4πDt ​N​e−x2/(4Dt) 明显看出这里的方差正是 2Dt2Dt2Dt. 同时从量纲可以看出,存在一个特征时间 τ(L)=L2/D\tau(L)=L^2/Dτ(L)=L2/D,这代表着平均到达 LLL 处的首次到达时间. 简单估计 Brown 运动的效率: K+\text{K}^+K+ 扩散系数为 103 μm2/s10^3\,\mu\text{m}^2/\text{s}103μm2/s,在细胞内部的到达时间大概是 0.1 s0.1\text{ s}0.1 s,非常有效. 但是如果考虑最长的神经细胞 (和身体尺度相当),到达时间就是 109 s10^9\text{ s}109 s 量级 (31 年!). 一个重要应用是所谓的 FRAP 方法:用荧光蛋白结合要标记的物质,然后杀灭某个范围 (比如细胞膜) 内部的该物质,发现荧光按照某种曲线恢复. 这个过程实际上就是一个偏微分方程,用偶函数的级数解代进去就可以做,最终的曲线应该和扩散系数有联系,是一种测量扩散系数的方案. 吸收球问题:假设存在一个球状细胞,外部有很多小分子,小分子碰到细胞膜就会被吸收进去. 如果无穷远处有一个粒子库,保证无穷远边界上的浓度是恒定的,要求解细胞最终能够吸收多少小分子进入细胞内部. 在这个问题里,我们不知道细胞里面发生了什么,只是取细胞膜上面的边界条件为 c(R)=0c(R)=0c(R)=0,无穷远处 c(∞)=c0c(\infty)=c_0c(∞)=c0​,产生一个往细胞内部吸收的浓度差. 方程为 ∇2c=0\nabla^2c=0 ∇2c=0 只需要考虑径向,也就是 1r2∂∂r(r2∂c∂r)=0\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial c}{\partial r}\right)=0 r21​∂r∂​(r2∂r∂c​)=0 最终解得, c=B−Ar,c(∞)=c0,c(R)=0⟹c(r)=c0(1−Rr)c=B-\frac{A}{r},\quad c(\infty)=c_0,\quad c(R)=0\Longrightarrow c(r)=c_0\left(1-\frac{R}{r}\right) c=B−rA​,c(∞)=c0​,c(R)=0⟹c(r)=c0​(1−rR​) 向细胞内部的流和流量为 j=−D∂c∂r∣r=R=Dc0R,4πR2j=4πDc0R∝Rj = -D\left.\frac{\partial c}{\partial r}\right|_{r=R}=\frac{Dc_0}{R},\quad 4\pi R^2j = 4\pi Dc_0R\propto R j=−D∂r∂c​ ​r=R​=RDc0​​,4πR2j=4πDc0​R∝R 因此,细胞的吸收效率是正比于 R1R^1R1 而不是 R2R^2R2!以氧气为例,氧气的消耗率应该正比于 R2∼3R^{2\sim3}R2∼3,所以一个细胞不可能长得太大,因为氧气供不应求. 注意 当然,如果细胞是柱状的,那么就会是 rln⁡rr\ln rrlnr 的形式,还是无法达到 r2∼3r^{2\sim3}r2∼3,只能说这是一种优化. 我们已经知道了对于一个小的细胞而言,它的吸收效率并不低. 那么为什么 E.coli 这样的细胞还需要运动能力呢? 如果不动,那么吸收一个分子的时间是 tw=L2/Dt_w =L^2/Dtw​=L2/D;如果以速度 vvv 追击,那么吸收一个分子的时间是 tr=L/vt_r=L/vtr​=L/v. (当然,我们这里没有考虑主动追击所消耗的能量是多少) 两个时间相等的临界点是 tr=tw⟹LvD=1t_r=t_w\Longrightarrow\frac{Lv}{D}=1 tr​=tw​⟹DLv​=1 对于 E.coli 来说,速度最快大概是 30 μm/s30\,\mu\text{m}/\text{s}30μm/s;同时扩散系数大约是 1000 μm2/s1000\,\mu\text{m}^2/\text{s}1000μm2/s. 可以算出,L∼30 μmL\sim30\,\mu\text{m}L∼30μm. E.coli 的运动策略是,直线跑一段,然后在原地打转,之后再选择一个方向直线行动,这个直线跑的距离就是 LLL 的量级,比这个量级低的话跑动就是没有收益的. vL/D≡PevL/D\equiv\text{Pe}vL/D≡Pe 这个量被称为 Peclet number,决定了细胞是否需要跑动,Pe>1\text{Pe}>1Pe>1 时跑动就是有收益的. 其实 30 μm/s30\,\mu\text{m}/\text{s}30μm/s 是非常快的,需要特殊的分子马达,对于真核细胞来说跑动并没有收益,因为这些细胞的运动速度基本上是 1μm/min1\mu\text{m}/\text{min}1μm/min 的量级. Duffusion in External Fields 在一个外部的势能场 U(x)U(x)U(x) 中,同时存在一个摩擦 f=ξvf=\xi vf=ξv,得到 D∇c+c∇Uξ=0D\nabla c+\frac{c\nabla U}{\xi}=0 D∇c+ξc∇U​=0 解得 Einstein 关系 Dξ=kBTD\xi=k_BT Dξ=kB​T (又称,涨落 - 耗散定理) 其中 DDD 表征着涨落、ξ\xiξ 表征着耗散. 推论: x=vt=fξ⋅t=ft⋅DkBT=fkBT⋅σx22x=vt=\frac{f}{\xi}\cdot t=ft\cdot\frac{D}{k_BT}=\frac{f}{k_BT}\cdot\frac{\sigma_x^2}{2} x=vt=ξf​⋅t=ft⋅kB​TD​=kB​Tf​⋅2σx2​​ 也就是 xxx 和其方差 σx2\sigma_x^2σx2​ 有关系. 这意味着涨落和响应是耦合的.

2025/11/11
articleCard.readMore

The Shape of Cosmic Explosions

—— Yi YANG 我们关心宇宙学爆炸中的几何结构,它们给出了一个新的维度. 主要的问题在于,我们难以测量一个超新星的结构,以一个最近的、以 0.05c0.05c0.05c 膨胀的超新星为例,一天膨胀 0.05c⋅day0.05c\cdot\text{day}0.05c⋅day,但是距离至少是 2.7×1072.7\times10^72.7×107 光年量级,最终我们得到的角直径已经是 10−1210^{-12}10−12 量级. 对于一个爆炸的星体来说,我们考虑它的 spherical (球性)、aspherical (椭球性),这可以通过观察其偶极矩来做到;同时,我们还观察偶极矩的变化,从初始的矢量和末态的矢量来确认偶极矩变化的情况. 考虑一个大质量星体的诞生与死亡:在它的一生中,一直有两种力相互抗衡 —— 向内的引力和向外的压力. 一开始我们只有气体,然后是 4He^4\text{He}4He、12C^{12}\text{C}12C、16O^{16}\text{O}16O、Ne\text{Ne}Ne、Si\text{Si}Si、Fe\text{Fe}Fe,到了铁元素之后,铁非常稳定,也难以被引力压缩,最终星体就会爆炸,在中心留下一个白矮星、中子星或者黑洞. 对于一个铁核来说,中间有电子简并压,这样的星体会形成白矮星:所有的电子都有相互排斥的趋势. 但是如果引力压强足够大,能够把电子压进原子核中,就会发生反应 p++e−→n0+νep^++e^-\to n^0+\nu_ep++e−→n0+νe​,变成所谓的中子星. 这种压力会让一个千公里尺度的白矮星 shrink 为一个十公里尺度的致密星体. 在中心核形成致密星体的同时,外部的气体物质还是会因为引力的作用向中心坍缩,但是中心的核像一堵墙一样阻挡了外部气体进入,当气体撞击核的表面时,就会产生极强的爆炸;同时,上面形成中子的反应中,中微子也带走了大量能量,这部分能量也不可忽略,在爆炸中起到了很大作用. 最终我们会得到星体亮度 L∝T9L\propto T^9L∝T9 的幂律. 外部物质向中心掉落并反弹,又会与更外层的物质碰撞,最终形成爆炸的最主要表现形式,也就是冲击波. 因为中心的核也会与光子发生一些核反应,吸收大量爆炸能量,所以在 ∼0.1 s\sim0.1\text{ s}∼0.1 s 时间时,整个爆炸会停止,整个爆炸半径在百千米量级停止下来;但是我们确实观察到了更大半径的爆炸,这是因为中微子在其中又一次起到了重要作用,它「重启」了整个爆炸. 简单的物理图像是这样的:一个中子在高温高压的环境下倾向于变为能量更低的一个电子和一个质子,这个过程放出中微子;但是周围的环境想要把这个电子压回质子里面,又形成中子,再放出反中微子;循环不断进行,整个系统就不断往外发射高能的中微子,使得整个体系的中微子数量变得非常巨大. 提示 这是 Gamov 提出的一个效应,但是命名为 Urca (一种 Cassino 游戏,赌场中能够见到). 这或许是因为在赌场中的金币就像这里疯狂放出的中微子一样吧... 产生的大量中微子会驱动整个爆炸,使得整体的膨胀半径变得更加远.

2025/11/11
articleCard.readMore

Lesson 16 电磁波的反射与折射

Fresnel 公式 从 Maxwell 方程的角度来思考一下电磁波的反射和折射. 考虑电磁波从 ε1,μ1\varepsilon_1,\mu_1ε1​,μ1​ 入射到 ε2,μ2\varepsilon_2,\mu_2ε2​,μ2​,入射角为 θ\thetaθ、折射角为 θ′\theta'θ′. 仍然是四个边值关系: n^×(E⃗2−E⃗1)=0,n^×(H⃗2−H⃗1)=α⃗t=0n^⋅(D⃗2−D⃗1)=σ=0,n^⋅(B⃗2−B⃗1)=0\begin{aligned} \hat{n}\times(\vec{E}_2-\vec{E}_1)=0,&\quad\hat{n}\times(\vec{H}_2-\vec{H}_1)=\vec{\alpha}_t=0\\\\ \hat{n}\cdot(\vec{D}_2-\vec{D}_1)=\sigma=0,&\quad\hat{n}\cdot(\vec{B}_2-\vec{B}_1)=0 \end{aligned} n^×(E 2​−E 1​)=0,n^⋅(D 2​−D 1​)=σ=0,​n^×(H 2​−H 1​)=α t​=0n^⋅(B 2​−B 1​)=0​ 这里只需要用到前两个切向的边值关系. 假设入射波为 E⃗0ei(k⃗⋅x⃗−ωt)\vec{E}_0e^{\text{i}(\vec{k}\cdot\vec{x}-\omega t)}E 0​ei(k ⋅x −ωt),反射波为 E⃗0′ei(k⃗′⋅x⃗−ωt)\vec{E}_0'e^{\text{i}(\vec{k}'\cdot\vec{x}-\omega t)}E 0′​ei(k ′⋅x −ωt),折射波为 E⃗0′′ei(k⃗′′⋅x⃗−ωt)\vec{E}_0''e^{\text{i}(\vec{k}''\cdot\vec{x}-\omega t)}E 0′′​ei(k ′′⋅x −ωt). (显然,频率应该一致,否则就不能保证每一时刻的边值关系都成立) 相位相同,得到: kxx+kyy−ωt=kx′x+ky′y−ωt=kx′′x+ky′′y−ωtk_xx+k_yy-\omega t=k_x'x+k_y'y-\omega t=k_x''x+k_y''y-\omega t kx​x+ky​y−ωt=kx′​x+ky′​y−ωt=kx′′​x+ky′′​y−ωt 这里设定 xyxyxy 平面为反射和折射的界面. 于是应该有 x,yx,yx,y 方向的波矢相同. 但是我们知道色散关系,因此知道波矢的模长应该和 με\sqrt{\mu\varepsilon}με ​ 成正比,于是: 对于反射,两个波介质相同,∣k⃗∣|\vec{k}|∣k ∣ 相同,所以 kzk_zkz​ 相同, kx=kx′⟹ksin⁡θ=k′sin⁡θ′⟹sin⁡θ′sin⁡θ=kk′=1k_x=k_x'\Longrightarrow k\sin\theta=k'\sin\theta'\Longrightarrow\frac{\sin\theta'}{\sin\theta} = \frac{k}{k'}=1 kx​=kx′​⟹ksinθ=k′sinθ′⟹sinθsinθ′​=k′k​=1 反射角等于入射角. 对于折射,两个波矢满足 k′′k=μ2ε2μ1ε1=n2n1\frac{k''}{k}=\frac{\sqrt{\mu_2\varepsilon_2}}{\sqrt{\mu_1\varepsilon_1}}=\frac{n_2}{n_1} kk′′​=μ1​ε1​ ​μ2​ε2​ ​​=n1​n2​​ 也就有折射定律 (Snell's law): sin⁡θ′′sin⁡θ=kk′′=n1n2\frac{\sin\theta''}{\sin\theta}=\frac{k}{k''}=\frac{n_1}{n_2} sinθsinθ′′​=k′′k​=n2​n1​​ 接下来分为两种线偏振的方向来寻找折射波、反射波和入射波振幅之间的关系. 第一种情况是 E⃗\vec{E}E 垂直于 xzxzxz 平面,得到 (称为 s 偏振) E0⊥′E0⊥=ε1μ1cos⁡θ−ε2μ2cos⁡θ′ε1μ1cos⁡θ+ε2μ2cos⁡θ′,E0⊥′′E0⊥=2ε1μ1cos⁡θε1μ1cos⁡θ+ε2μ2cos⁡θ′\frac{E_{0\perp}'}{E_{0\perp}} = \frac{\displaystyle{\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta-\sqrt{\frac{\varepsilon_2}{\mu_2}}\cos\theta'}}{\displaystyle{\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta+\sqrt{\frac{\varepsilon_2}{\mu_2}}\cos\theta'}},\quad\frac{E''_{0\perp}}{E_{0\perp}}=\frac{\displaystyle{2\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta}}{\displaystyle{\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta+\sqrt{\frac{\varepsilon_2}{\mu_2}}\cos\theta'}} E0⊥​E0⊥′​​=μ1​ε1​​ ​cosθ+μ2​ε2​​ ​cosθ′μ1​ε1​​ ​cosθ−μ2​ε2​​ ​cosθ′​,E0⊥​E0⊥′′​​=μ1​ε1​​ ​cosθ+μ2​ε2​​ ​cosθ′2μ1​ε1​​ ​cosθ​ 第二种情况是 E⃗\vec{E}E 平行于 xzxzxz 平面,得到 (称为 p 偏振) E0∥′E0∥=ε2μ2cos⁡θ−ε1μ1cos⁡θ′ε2μ2cos⁡θ+ε1μ1cos⁡θ′,E0∥′′E0∥=2ε1μ1cos⁡θε2μ2cos⁡θ+ε1μ1cos⁡θ′\frac{E'_{0\parallel}}{E_{0\parallel}}=\frac{\displaystyle{\sqrt{\frac{\varepsilon_2}{\mu_2}}\cos\theta-\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta'}}{\displaystyle{\sqrt{\frac{\varepsilon_2}{\mu_2}}\cos\theta+\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta'}},\quad\frac{E''_{0\parallel}}{E_{0\parallel}} = \frac{\displaystyle{2\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta}}{\displaystyle{\sqrt{\frac{\varepsilon_2}{\mu_2}}\cos\theta+\sqrt{\frac{\varepsilon_1}{\mu_1}}\cos\theta'}} E0∥​E0∥′​​=μ2​ε2​​ ​cosθ+μ1​ε1​​ ​cosθ′μ2​ε2​​ ​cosθ−μ1​ε1​​ ​cosθ′​,E0∥​E0∥′′​​=μ2​ε2​​ ​cosθ+μ1​ε1​​ ​cosθ′2μ1​ε1​​ ​cosθ​ 讨论几个光学现象: 反射波的半波损失 平面波从光疏介质到光密介质入射时,振幅反射率很可能变成负的,相位反相,这就是所谓的半波损失. 平行偏振反射波的消失 对于某个特殊入射角度 θR\theta_RθR​ 满足 θR+θ′′=π/2\theta_R+\theta''=\pi/2θR​+θ′′=π/2,称为 Brewster 角,这样的入射角会导致 E0∥′=0E'_{0\parallel}=0E0∥′​=0,也就是反射光中仅仅只有 s 光,没有 p 光. 用这个入射角做玻璃堆,可以达到起偏的效果,透射光全部为 p 光. (当然一般不会用玻璃堆起偏的反射光做实验,因为光束很宽) 利用 Snell's law,Brewster 角实际上满足: tan⁡θR=n1n2\tan\theta_R = \frac{n_1}{n_2} tanθR​=n2​n1​​ 并且反射波和折射波相互垂直. 全反射 在光疏介质到光密介质入射时,当入射角大于 arcsin⁡n1/n2\arcsin n_1/n_2arcsinn1​/n2​ 时,出现全反射. 这时候所有的能量也全部被反射,没有能量穿过入射面. 当然,考虑隐失波的存在,实际上入射波在光密介质中有一段光程,而不是完全没有穿过入射面. 导体中的电磁波 因为导体弛豫时间非常短,不考虑导体内部存在自由电荷. 波动方程: ∇2E⃗−μσ∂E⃗∂t−με∂2E⃗∂t2=0\nabla^2\vec{E}-\mu\sigma\frac{\partial\vec{E}}{\partial t}-\mu\varepsilon\frac{\partial^2\vec{E}}{\partial t^2}=0 ∇2E −μσ∂t∂E ​−με∂t2∂2E ​=0 有一个阻尼项. 这时候用复数的波矢,得到衰减因子为 e−z/τe^{-z/\tau}e−z/τ,对于不良导体, τ=12μεσ≪εμε0μ0k\tau = \frac{1}{2}\sqrt{\frac{\mu}{\varepsilon}}\sigma\ll\sqrt{\frac{\varepsilon\mu}{\varepsilon_0\mu_0}}k τ=21​εμ​ ​σ≪ε0​μ0​εμ​ ​k 深入的深度远大于波长,和普通的不导电介质类似. 如果是良导体,那么透射深度极小,出现所谓的趋肤效应. 同时,这些深度都和频率有关,频率越高,趋肤效应越明显.

2025/11/11
articleCard.readMore

Lesson 14 氢原子

「最干净的三维量子力学问题」 任何一个算符跟 Hamiltonian 对易,原则上就是守恒的. 在氢原子中,角动量的 derivative 都是沿着切向定义的,因此在 Hamiltonian 仅仅和 rrr 有关的情况下,角动量一定是守恒的. 径向的有效势能: Veff=−e24πε01r+ℏ22ml(l+1)r2V_{\text{eff}} = -\frac{e^2}{4\pi\varepsilon_0}\frac{1}{r}+\frac{\hbar^2}{2m}\frac{l(l+1)}{r^2} Veff​=−4πε0​e2​r1​+2mℏ2​r2l(l+1)​ 这里有很多可以改变的东西,比如说介电常数,或者将质量换成反质子质量 (变成奇异原子),那么势能曲线就会发生变化,原本没有势阱的地方就会出现势阱等等. 用类似 Binet 方程的方式可以解出 Bohr 能级. 一般的氢原子波函数为 ψnlm(r,θ,ϕ)=Rnl(r)Ylm(θ,ϕ)\psi_{nlm}(r,\theta,\phi) = R_{nl}(r)Y^m_l(\theta,\phi) ψnlm​(r,θ,ϕ)=Rnl​(r)Ylm​(θ,ϕ) nnn 为主量子数,lll 为角量子数,mmm 为磁量子数. 这里有 Rnl(r)=1rρl+1e−ρν(ρ),ρ=ran,a=Bohr radiusR_{nl}(r) = \frac{1}{r}\rho^{l+1}e^{-\rho}\nu(\rho),\quad\rho=\frac{r}{an},\quad a=\text{Bohr radius} Rnl​(r)=r1​ρl+1e−ρν(ρ),ρ=anr​,a=Bohr radius 其中,ν\nuν 是一个 Laguerre 多项式, ν(ρ)=Ln−l−12l(2ρ)\nu(\rho) = L^{2l}_{n-l-1}(2\rho) ν(ρ)=Ln−l−12l​(2ρ) 氢原子光谱规律是 1λ=R(1nf2−1ni2)\frac{1}{\lambda} = R\left(\frac{1}{n_f^2}-\frac{1}{n_i^2}\right) λ1​=R(nf2​1​−ni2​1​)

2025/11/11
articleCard.readMore

Lesson 7 Bessel 方程 & 球函数

Bessel 方程 方程形式为 d2wdz2+1zdwdz+(1−ν2z2)w=0\frac{\text{d}^2w}{\text{d}z^2}+\frac{1}{z}\frac{\text{d}w}{\text{d}z}+\left(1-\frac{\nu^2}{z^2}\right)w=0 dz2d2w​+z1​dzdw​+(1−z2ν2​)w=0 默认 ν\nuν 是一个正实数. z=0z=0z=0 是方程的正则奇点,z=∞z=\inftyz=∞ 是非正则奇点. 考虑 z=0z=0z=0 邻域的解为 w(z)=zρ∑k=0∞ckzk,c0≠0w(z)=z^\rho\sum_{k=0}^\infty c_kz^k,\quad c_0\neq0 w(z)=zρk=0∑∞​ck​zk,c0​=0 代入,得到 ∑k=0∞ck(k+ρ)(k+ρ−1)zk+ρ−2+∑k=0∞ck(k+ρ)zk+ρ−2+∑k=0∞ckzk+ρ−ν2∑k=0∞ckzk+ρ−2=0\begin{aligned} &\sum_{k=0}^\infty c_k(k+\rho)(k+\rho-1)z^{k+\rho-2}+\sum_{k=0}^\infty c_k(k+\rho)z^{k+\rho-2}\\ &+\sum_{k=0}^\infty c_kz^{k+\rho}-\nu^2\sum_{k=0}^\infty c_kz^{k+\rho-2}=0 \end{aligned} ​k=0∑∞​ck​(k+ρ)(k+ρ−1)zk+ρ−2+k=0∑∞​ck​(k+ρ)zk+ρ−2+k=0∑∞​ck​zk+ρ−ν2k=0∑∞​ck​zk+ρ−2=0​ 约去 zρ−2z^{\rho-2}zρ−2, ∑k=0∞ck[(k+ρ)2−ν2]zk+∑k=0∞ckzk+2=0\sum_{k=0}^\infty c_k[(k+\rho)^2-\nu^2]z^k+\sum_{k=0}^\infty c_kz^{k+2}=0 k=0∑∞​ck​[(k+ρ)2−ν2]zk+k=0∑∞​ck​zk+2=0 由最低次幂的系数,且 c0≠0c_0\neq0c0​=0,得到指标方程为 ρ2−ν2=0\rho^2-\nu^2=0 ρ2−ν2=0 可以取 ρ1,2=±ν\rho_{1,2}=\pm\nuρ1,2​=±ν. 再看 z1z^1z1 项系数,为 c1[(ρ+1)2−ν2]=c1(2ρ+1)=0c_1[(\rho+1)^2-\nu^2]=c_1(2\rho+1)=0 c1​[(ρ+1)2−ν2]=c1​(2ρ+1)=0 如果 ρ≠−1/2\rho\neq-1/2ρ=−1/2,那么 c1=0c_1=0c1​=0;否则是任意的. 递推关系: cn=−1n(n+2ρ)cn−2c_n=-\frac{1}{n(n+2\rho)}c_{n-2} cn​=−n(n+2ρ)1​cn−2​ 我们最后关注的肯定是偶数项,因为 c0c_0c0​ 被要求了不为零,所以这一个序列更加重要;至于奇数项作用并不是特别大. 偶数项: c2n=(−1)nn!1(ρ+1)n122nc0=(−1)nΓ(ρ+1)c0n!Γ(ρ+n+1)22nc_{2n}=\frac{(-1)^n}{n!}\frac{1}{(\rho+1)_n}\frac{1}{2^{2n}}c_0=\boxed{\frac{(-1)^n\Gamma(\rho+1)c_0}{n!\Gamma(\rho+n+1)2^{2n}}} c2n​=n!(−1)n​(ρ+1)n​1​22n1​c0​=n!Γ(ρ+n+1)22n(−1)nΓ(ρ+1)c0​​​ 奇数项为零 (可以要求). 取 ρ1=ν\rho_1=\nuρ1​=ν,c0=12νΓ(ν+1)c_0=\displaystyle{\frac{1}{2^\nu\Gamma(\nu+1)}}c0​=2νΓ(ν+1)1​,得到 Bessel 函数 Jν(z)=∑k=0∞(−1)kk!Γ(k+ν+1)(z2)2k+νJ_\nu(z)=\sum_{k=0}^\infty\frac{(-1)^k}{k!\Gamma(k+\nu+1)}\left(\frac{z}{2}\right)^{2k+\nu} Jν​(z)=k=0∑∞​k!Γ(k+ν+1)(−1)k​(2z​)2k+ν ρ2=−ν\rho_2=-\nuρ2​=−ν 时,取 c0=2νΓ(−ν+1)c_0=\displaystyle{\frac{2^\nu}{\Gamma(-\nu+1)}}c0​=Γ(−ν+1)2ν​, J−ν(z)=∑k=0∞(−1)kk!Γ(k−ν+1)(z2)2k−νJ_{-\nu}(z)=\sum_{k=0}^\infty\frac{(-1)^k}{k!\Gamma(k-\nu+1)}\left(\frac{z}{2}\right)^{2k-\nu} J−ν​(z)=k=0∑∞​k!Γ(k−ν+1)(−1)k​(2z​)2k−ν 但是我们并没有解决 ρ=−1/2\rho=-1/2ρ=−1/2 时,c1≠0c_1\neq0c1​=0 的情形. 实际上经过计算可以证明: z−1/2∑n=0∞c2n+1z2n+1=c1π2⋅J1/2(z)z^{-1/2}\sum_{n=0}^\infty c_{2n+1}z^{2n+1}=c_1\sqrt{\frac{\pi}{2}}\cdot J_{1/2}(z) z−1/2n=0∑∞​c2n+1​z2n+1=c1​2π​ ​⋅J1/2​(z) 也就是在 w2(z)w_2(z)w2​(z) 上叠加一个第一解.

2025/11/7
articleCard.readMore

Lesson 8 Nonparametric Statistics

提示 Quizzes 给定信息 III,数据 DDD,模型 MMM 和参数 θ\thetaθ,那么 先验 (prior):P(θ∣MI)P(\theta|MI)P(θ∣MI) 似然 (likelihood):P(D∣θMI)P(D|\theta MI)P(D∣θMI) 后验 (posterior):P(θ∣DMI)P(\theta|DMI)P(θ∣DMI) 证据 (evidence):P(D∣MI)P(D|MI)P(D∣MI) 可以用 marginalization 来计算. Bayes 定理: P(θ∣DMI)=P(θ∣MI)P(D∣θMI)P(D∣MI)P(\theta|DMI)=\frac{P(\theta|MI)P(D|\theta MI)}{P(D|MI)} P(θ∣DMI)=P(D∣MI)P(θ∣MI)P(D∣θMI)​ 什么是 Monte-Carlo? 均匀地随机采点,然后采完之后做平均. 什么是 Important Sampling? 因为有些点的 likelihood 很低,所以可以没有必要过多地采样这些点,相当于在 Monte-Carlo 上面加一个分布函数去采样,我们希望这个分布函数和我们的后验尽可能一样. 如果我们在做 MC 采样时,增加了 100 倍数据量,那么误差应该? 有一个常见的关系,∼N−1/2\sim N^{-1/2}∼N−1/2. 对于 MCMC 算法,下面哪一个正确? 每个点取决于上一个点. …… 一个陷阱是,MCMC 不能直接得到证据,同时,MCMC 并不会最终收敛到一个点. MCMC 的 issues? Incomplete burn-in Burn-in 时间太短会造成 bias. High auto-correlation 点与点之间关联太强,那么就会造成大量的浪费. Too wide & too narrow 可能会跑得太远造成浪费,也有可能被 trap. HMC? …… nested sampling (V.S MCMC) 更准确 内置的模型选择 副产品是 evidence 可以不需要调参数 对于多峰的分布更加 robust 需要 gradient information 选择 b, c, e. 不选择 a,是因为准确度取决于不同的实际问题. 这节课要开始讲应用了. Nonparametric Statistics (非参数统计):我们探索未知的理论时,并不知道特别好的函数形式,所以现在需要一个 flexible 的模型来描述可能的函数形式;同时,要充分利用好先验的作用,因为这时我们的知识非常少;另外,为了表达我们的未知模型 (足够 flexible),需要大量的参数,这和 Occam's Razor 是违背的,因此还需要一个方式来描述我们的复杂程度. Model Forms and Representations 「Fit what you know, soften what you do not know.」 已经有 DDD 和 III,确定最后的 f(x)f(x)f(x). 第一种情况是我们已经非常了解 f(x)f(x)f(x),这就是一个测电阻的实验,我们的操作是把估计函数变成了估计确定形式的函数的一个参数;第二种情况是我们大概知道是哪一些函数,那么我们就可以按照上节课的方法,每个模型都试一次,最后计算后验比;第三种情况是最困难的,完全不知道任何函数形式,这一点我们后面会讲到. 现在我们假设某一次测量得到的光谱上有一系列非常 sharp 的发射线, ϕ(λ)=∑j=1Mαjδ(λ−λj)[photon⋅s−1]\phi(\lambda)=\sum_{j=1}^M\alpha_j\delta(\lambda-\lambda_j)\quad[\text{photon}\cdot\text{s}^{-1}] ϕ(λ)=j=1∑M​αj​δ(λ−λj​)[photon⋅s−1] 考虑像素的影响 (iii) 和 Gauss 型的一个点扩散函数 (point-spread function, PSF),宽度为 www,现在的谱线变成了一个不光滑的形式. μ=Aexp⁡[−(x−λ)22w2]+B\mu = A\exp\left[-\frac{(x-\lambda)^2}{2w^2}\right]+B μ=Aexp[−2w2(x−λ)2​]+B 总的似然为 P(D∣fI)=∏iμinie−μini!P(D|fI)=\prod_i\frac{\mu_i^{n_i}e^{-\mu_i}}{n_i!} P(D∣fI)=i∏​ni​!μini​​e−μi​​ 这节课我们已经不能再忽略分母了. Case 1 我们知道一定只有三条谱线, L(θ)=∑i(niln⁡μi−μi−ln⁡ni!)\mathcal{L}(\theta)=\sum_i(n_i\ln \mu_i-\mu_i-\ln n_i!) L(θ)=i∑​(ni​lnμi​−μi​−lnni​!) 这里也显式写出了分母. 同时因为我们对这些数据的了解程度比较多、数据量比较大,取什么先验并不重要,所以最简单地,直接取 π(θ)=const.\pi(\theta)=\text{const.}π(θ)=const.. from scipy.special import gammaln, xlogy def prior_transform(cube, ranges): """Transform unit cube to physical parameters for UltraNest""" params = np.empty_like(cube) for i, (pmin, pmax) in enumerate(ranges): params[i] = pmin + (pmax - pmin) * cube[i] return params def log_likelihood(params): """Log-likelihood function for spectrum data (x,spec)""" if params[1] < params[0] or params[2] < params[1]: return -1e99 * params[:3].sum() # enforce lam1 <= lam2 <= lam3 mu = spec_model(x, lam=params[:3], A=params[3:], B=50, w=2) loglike = xlogy(spec, mu) - mu - gammaln(spec + 1) return loglike.sum() 这段代码的目的是,去掉三个谱线的对称性,也就是要求三个谱线存在 λ1<λ2<λ3\lambda_1<\lambda_2<\lambda_3λ1​<λ2​<λ3​ 的关系,如果不满足这样的关系,就返回一个 -1e99 的极小似然,建立一堵「墙」;同时还要给一个小的常数,产生一个「斜坡」,让 Markov chain 知道怎么跑回来. 另外介绍一个 code trick,在很久以前跑过的 nest 算法之后,想要重新读出来要使用 read_file 函数,这个函数没有很好的文档,所以必须要提一下: from ultranest.integrator import read_file from getdist import plots, MCSamples # Load UltraNest results (same as that returned by sampler.run()) _, results = read_file(log_dir, x_dim=len(param_names)) ws = results['weighted_samples'] # Create (weighted) getdist MCSamples object with hard prior ranges mcsample = MCSamples(samples=ws['points'], weights=ws['weights'], loglikes=-ws['logl'], names=param_names, labels=param_labels, ranges={n:p for n,p in zip(param_names, param_ranges)}, sampler='nested') # Make the posterior triangle plot g = plots.get_single_plotter() g.triangle_plot(mcsample, filled=True) 如果不用 slides 上面的代码,最后得到的图片一定会有问题. 按照上面那些代码可以得到这样的图片:(蓝色是最终拟合,直方图是数据,其他是 MAP 给出的谱线位置,蓝色线的阴影是我们得到的每个点的标准差) Case 2 现在我们要做模型选择, μ2,i(M)=μ2(x2;M)=∑j=1M{Ajexp⁡[−(x2−λj)22wj2]+Bj}\mu_{2,i}^{(M)}=\mu_2(x_2;M)=\sum_{j=1}^M\left\{ A_j\exp\left[-\frac{(x_2-\lambda_j)^2}{2w_j^2}\right]+B_j\right\} μ2,i(M)​=μ2​(x2​;M)=j=1∑M​{Aj​exp[−2wj2​(x2​−λj​)2​]+Bj​} 我们现在甚至不知道到底有几条谱线. 所以尝试跑 2 条谱线的模型、4 条谱线的模型,最终得到下面的结果: 后验比:ln⁡O23=ln⁡(Z2/Z3)=−14.4\ln O_{23} = \ln(\mathcal{Z}_2/\mathcal{Z}_3)=-14.4lnO23​=ln(Z2​/Z3​)=−14.4,ln⁡O43=ln⁡(Z4/Z3)=−2.1\ln O_{43}=\ln(\mathcal{Z}_4/\mathcal{Z}_3)=-2.1lnO43​=ln(Z4​/Z3​)=−2.1. 根据经验,后验比绝对值超过 555 就可以给出决定性结果,这里可以排除掉 2 条谱线的模型;4 条谱线的模型被 Occam's Razor 所抛弃,最后的结果还是和 case 1 一致. Case 3 现在我们什么都不知道了. 为了减少所用的参数到可数的范围,我们只能取一些弱假设 (不改变问题的性质的那些假设). 没有参数化的模型,所以一个最简单的想法是,给每一个像素点都找一个值. 但是这样会产生巨量的参数. 更加折衷的方案是,考虑基函数展开: f(x)=∑l=1∞blhl(x)f(x)=\sum_{l=1}^\infty b_lh_l(x) f(x)=l=1∑∞​bl​hl​(x) 对于这个问题,我们知道谱线是点扩散函数,所以拿 Gauss 分布作为基函数展开;在数据中的 21 个区间内,取 11 个中心值,用 11 个参数进行拟合,结果如图: 可以看到图中占据主导作用的只有 2 - 4 个峰,这说明我们已经找到了一个不错的函数形式,下一步该缩减参数了,于是我们下一步合理的操作就是缩减这 11 个参数,用 2 - 4 个参数来拟合,接近正确答案. Gaussian Process Regression 除了直接做参数的先验,我们应该还有其他方法. 下面进入早期机器学习的领域. 我们现在不做参数的先验,而是做函数的先验:P(f∣I)∼N(m⃗,K)P(f|I)\sim\mathcal{N}(\vec{m},\bold{K})P(f∣I)∼N(m ,K) 输入的参数 X⃗={x1,⋯ ,xn}\vec{X}=\{x_1,\cdots,x_n\}X ={x1​,⋯,xn​} 被 Gauss 分布所产生: f(X⃗)∼N(m⃗(X⃗),K(X⃗,X⃗))f(\vec{X})\sim\mathcal{N}(\vec{m}(\vec{X}),\bold{K}(\vec{X},\vec{X})) f(X )∼N(m (X ),K(X ,X )) Gauss 分布是常见的,所以这个方法并不仅仅适用于 Gauss 型的分布. 核函数 (kernel function):k(xi,xj;θ)k(x_i,x_j;\theta)k(xi​,xj​;θ),with hyperparameters θ\thetaθ. 常取的一个核函数是 Radial basis function (RBF),类似 Gauss 分布 k(xi,xj)=σ2exp⁡[−(xi−xj)22l2]k(x_i,x_j)=\sigma^2\exp\left[-\frac{(x_i-x_j)^2}{2l^2}\right] k(xi​,xj​)=σ2exp[−2l2(xi​−xj​)2​] 还有周期性的 k(xi,xj)=σ2exp⁡[−2sin⁡2(π∣xi−xj∣/p)l2]k(x_i,x_j)=\sigma^2\exp\left[-\frac{2\sin^2(\pi|x_i-x_j|/p)}{l^2}\right] k(xi​,xj​)=σ2exp[−l22sin2(π∣xi​−xj​∣/p)​] 或者线性的. 这些核函数描述的是每两个坐标上的函数值关联大小,直观来看,一个点和自身的关联是 111,越往远处走,关联性就会出现变化,可能是越来越小,也可能存在周期性. 用一个核函数 (2 个参数 σ,l\sigma,lσ,l),可以确定一族函数. 用一组训练集 (X,Y)=(xi,yi)i=0n(X,Y)=(x_i,y_i)_{i=0}^n(X,Y)=(xi​,yi​)i=0n​ 来优化超参数: P(θ∣X,Y)∝P(Y∣X,θ)P(θ)P(\theta|X,Y)\propto P(Y|X,\theta)P(\theta) P(θ∣X,Y)∝P(Y∣X,θ)P(θ) 证据: P(Y∣X,θ)=∫P(Y∣f,X,θ)P(f∣X,θ)dfP(Y|X,\theta)=\int P(Y|f,X,\theta)P(f|X,\theta)\text{d}f P(Y∣X,θ)=∫P(Y∣f,X,θ)P(f∣X,θ)df 这是在函数空间里面的一个积分. 从训练集中,我们学会: [Yf(X∗)]∼N(0,[K(X,X)K(X,X∗)K(X∗,X)K(X∗,X∗)])\begin{bmatrix} Y\\f(X^*) \end{bmatrix}\sim\mathcal{N}\left(0,\begin{bmatrix} \bold{K}(X,X)&\bold{K}(X,X^*)\\ \bold{K}(X^*,X)&\bold{K}(X^*,X^*) \end{bmatrix}\right) [Yf(X∗)​]∼N(0,[K(X,X)K(X∗,X)​K(X,X∗)K(X∗,X∗)​]) 即得到一个联合分布. 最后得到一个「函数的概率云」,函数可以在范围内自由变动;但是一旦给定一个点的函数值,在这一点的函数就会「坍缩」. 下面的代码是我们课程第一次使用机器学习的工具包: from sklearn.gaussian_process import GaussianProcessRegressor from sklearn.gaussian_process.kernels import RBF lambdas = [4, 12, 16] As = [40, 50, 60] x, spec = sim_spec(lambdas, As, B=50, w=2) spec_var = spec # Poisson variance kernel = 1 * RBF(length_scale=1, length_scale_bounds=(0.1,10)) GP = GaussianProcessRegressor(kernel=kernel, alpha=spec_var, n_restarts_optimizer=9) GP.fit(x.reshape(-1,1), spec.reshape(-1,1)) # Generate the credible intervals x_sp = np.linspace(0, 20, 1000).reshape(-1,1) mean, std = GP.predict(x_sp, return_std=True) 得到的结果: 我们的假设只有:函数是平滑的,而且在一定范围里面,基函数是 Gauss 的. 这已经能够得到足够好的结果 —— 函数在每一点的值可以被较为准确地写出. 当然如果想要得到「有几条谱线」的答案,已经可以化为 Case 2 来做. Maximum Entropy Principle 回到我们课程最开始的问题:统计如何表达我们的无知?也就是,Gauss 分布究竟在什么程度上表达了我们是无知的?为什么我们一开始要采用 Gauss 分布? 一个好的分布函数的前提是: 连续性 单调性,更大的概率表征更不确定 不变性,不同问题得出相同结果 满足这些条件的最佳函数是 Hi=∑i−piln⁡piH_i=\sum_i-p_i\ln p_i Hi​=i∑​−pi​lnpi​ 这正是熵,Shannon 的信息熵. 我们知道在最无知的情况下,{pi}={1/n}\{p_i\} = \{1/n\}{pi​}={1/n}. 更深层次的原因是,要求信息熵的最大值,做 Lagrange 乘子法得到的就是等概率原理. 因此我们可以说,最大熵原理是更基本的一条原理. 如果进一步地,我已经知道了 ∫xp(x)dx=μ,∫(x−μ)2p(x)dx=σ2\int xp(x)\text{d}x=\mu,\quad \int(x-\mu)^2p(x)\text{d}x=\sigma^2 ∫xp(x)dx=μ,∫(x−μ)2p(x)dx=σ2 也就是在变分时再加入两个 Lagrange 乘子. 最后我们得到了 Gauss 分布: p(x)=12πσ2exp⁡[−(x−μ)22σ2]p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right] p(x)=2πσ2 ​1​exp[−2σ2(x−μ)2​] Exercise Given the simulated light curve, predict the brightnesses of the star at along with the uncertainties Try Gaussian process regression [online example] with an appropriate kernel If time permits, try also predictions via parameter inference (assume the model is known)

2025/11/7
articleCard.readMore

Lesson 15 电磁波

电磁波的方程可以由 Maxwell 方程得到. 但是实际上不同的波长会造成不同的 ε\varepsilonε,存在色散关系 ε(ω)\varepsilon(\omega)ε(ω). 因此先来看没有色散关系的真空: μ0ε0∂2E⃗∂t2=∇×∂B⃗∂t=−∇×(∇×E⃗)=−∇(∇⋅E⃗)+∇2E⃗=∇2E⃗\mu_0\varepsilon_0\frac{\partial^2\vec{E}}{\partial t^2}=\nabla\times\frac{\partial\vec{B}}{\partial t}=-\nabla\times(\nabla\times\vec{E})=-\nabla(\nabla\cdot\vec{E})+\nabla^2\vec{E}=\nabla^2\vec{E} μ0​ε0​∂t2∂2E ​=∇×∂t∂B ​=−∇×(∇×E )=−∇(∇⋅E )+∇2E =∇2E 当在介质中时, D⃗=D⃗(ω)=ε(ω)E⃗(ω) ,B⃗=B⃗(ω)=μ(ω)H⃗(ω)\vec{D}=\vec{D}(\omega)=\varepsilon(\omega)\vec{E}(\omega)\,,\quad\vec{B}=\vec{B}(\omega)=\mu(\omega)\vec{H}(\omega) D =D (ω)=ε(ω)E (ω),B =B (ω)=μ(ω)H (ω) 真空中的平面波解为 E⃗=E⃗0ei(k⃗⋅x⃗−ωt)\vec{E}=\vec{E}_0e^{\text{i}(\vec{k}\cdot\vec{x}-\omega t)} E =E 0​ei(k ⋅x −ωt) 其中 k⃗\vec{k}k 是波矢,表达了波传播的方向;k⃗⋅x⃗=const.\vec{k}\cdot\vec{x}=\text{const.}k ⋅x =const. 表征了一个平面,这个平面就是所谓平面波的等相面. 同时为了满足条件 ∇⋅E⃗=0\nabla\cdot\vec{E}=0∇⋅E =0,得到 k⃗⋅E⃗0ei(k⃗⋅x⃗−ωt)=0\vec{k}\cdot\vec{E}_0e^{\text{i}(\vec{k}\cdot\vec{x}-\omega t)}=0 k ⋅E 0​ei(k ⋅x −ωt)=0 也就是 E⃗0\vec{E}_0E 0​ 只能在垂直 k⃗\vec{k}k (也就是波传播方向),是为横波. 磁场的波动和电场的波动是相关的,可以得到 ∂B⃗∂t=−∇×E⃗=−ik⃗×E⃗⟹B⃗=−ik⃗−iω×E⃗+B⃗1(x,y,z)\frac{\partial\vec{B}}{\partial t}=-\nabla\times\vec{E}=-\text{i}\vec{k}\times\vec{E}\Longrightarrow\vec{B}=\frac{-\text{i}\vec{k}}{-\text{i}\omega}\times\vec{E}+\vec{B}_1(x,y,z) ∂t∂B ​=−∇×E =−ik ×E ⟹B =−iω−ik ​×E +B 1​(x,y,z) 其中常数项是某一个全空间存在的静磁场,和电磁波并无关系,所以磁场的波动也能够写成 B⃗=B⃗0ei(k⃗⋅x⃗−ωt)\vec{B}=\vec{B}_0e^{\text{i}(\vec{k}\cdot\vec{x}-\omega t)} B =B 0​ei(k ⋅x −ωt)

2025/11/7
articleCard.readMore

Lesson 7 暗物质探测 & 原子核钟

深地暗物质与中微子探测 —— Fei GAO 我们倾向于认为暗物质是一种稳定的基本粒子,当然有很多不同的模型,也就是理论学家们提出的暗物质可能的本质. 按照宇宙学的理论,我们周围应该有很多暗物质,但是暗物质和我们之间没有电磁相互作用和强相互作用,所以像气体一样穿过我们的身体. 可以估算:暗物质的速度不能大于银河系的逃逸速度,所以只能是几百公里每秒;太阳系相对于银心的速度约是两百公里每秒,我们和暗物质的相对速度也是这个量级,也就是 10−310^{-3}10−3 光速. 这样我们就能估算暗物质的动能,同时能够想到,暗物质在这样的速度下和周围的普通物质发生碰撞,比如电离气体分子等等,就可以被观察到. 问题在于,除了搭建好一个灵敏的探测器以外,我们可能会遇到各种各样的宇宙射线、杂乱的光干扰. 为了隔绝所有带电的物质,主流的暗物质探测选择在地下进行. 中国的锦屏实验室是起步最晚的一个,但是等效深度 2400 m2400\text{ m}2400 m (上面有一座山),是最深最大的一个,能够把宇宙线强度降低 10 个数量级. 我们今天主要讲的是在意大利进行的 XENONnT 实验:在空气中分离氙原子,液化作为探测物质. 我们的光电倍增管能够非常灵敏地 (单光子级别) 探测,首先是液氙中的光信号;另外,如果产生了电子,我们也希望能够探测这一个信号,所以上面留空了一段气体相的氙并加强电场,电子在气体氙中会没有阻碍地高速撞击某个气体原子,产生电致发光,也能用倍增管探测. 测量几个月之后,我们要对数据做统计推断 (哎呀这不是我们天统吗). 当然最终我们并不认为找到暗物质,但是应该能够对暗物质和物质的相互作用做一个上限的限制.

2025/11/5
articleCard.readMore

Lesson 13 球坐标的 Schrödinger 解

∇2=1r2∂∂r(r2∂∂r)+1r2sin⁡θ∂∂θ(sin⁡θ∂∂θ)+1r2sin⁡2θ∂2∂ϕ2\nabla^2=\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{1}{r^2\sin\theta}\frac{\partial}{\partial\theta}\left(\sin\theta\frac{\partial}{\partial\theta}\right)+\frac{1}{r^2\sin^2\theta}\frac{\partial^2}{\partial\phi^2} ∇2=r21​∂r∂​(r2∂r∂​)+r2sinθ1​∂θ∂​(sinθ∂θ∂​)+r2sin2θ1​∂ϕ2∂2​ 这就是球坐标系下的 Laplace 算子. 我们可能还会用到所谓的抛物坐标,也就是 x−y,x+y,zx-y,x+y,zx−y,x+y,z,这个坐标很适合处理氢原子的散射态问题. 对于球坐标,方程是 −ℏ22m[1r2∂∂r(r2∂∂r)+1r2sin⁡θ∂∂θ(sin⁡θ∂∂θ)+1r2sin⁡2θ∂2∂ϕ2]+V(r)ψ=Eψ-\frac{\hbar^2}{2m}\left[\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{1}{r^2\sin\theta}\frac{\partial}{\partial\theta}\left(\sin\theta\frac{\partial}{\partial\theta}\right)+\frac{1}{r^2\sin^2\theta}\frac{\partial^2}{\partial\phi^2}\right]+V(r)\psi=E\psi −2mℏ2​[r21​∂r∂​(r2∂r∂​)+r2sinθ1​∂θ∂​(sinθ∂θ∂​)+r2sin2θ1​∂ϕ2∂2​]+V(r)ψ=Eψ 我们用 Separation Ansatz (分离变量猜解),ψ(r,θ,ϕ)=R(r)Y(θ,ϕ)\psi(r,\theta,\phi)=R(r)Y(\theta,\phi)ψ(r,θ,ϕ)=R(r)Y(θ,ϕ),得到 1Rddr(r2dRdr)−2mr2ℏ2[V(r)−E]=l(l+1)1Y[1sin⁡θ∂∂θ(sin⁡θ∂Y∂θ)+1sin⁡2θ∂2Y∂ϕ2]=−l(l+1)\begin{aligned} &\frac{1}{R}\frac{\text{d}}{\text{d}r}\left(r^2\frac{\text{d}R}{\text{d}r}\right)-\frac{2mr^2}{\hbar^2}[V(r)-E]=l(l+1)\\\\ &\frac{1}{Y}\left[\frac{1}{\sin\theta}\frac{\partial}{\partial\theta}\left(\sin\theta\frac{\partial Y}{\partial\theta}\right)+\frac{1}{\sin^2\theta}\frac{\partial^2Y}{\partial\phi^2}\right]=-l(l+1) \end{aligned} ​R1​drd​(r2drdR​)−ℏ22mr2​[V(r)−E]=l(l+1)Y1​[sinθ1​∂θ∂​(sinθ∂θ∂Y​)+sin2θ1​∂ϕ2∂2Y​]=−l(l+1)​ 其中,我们称 lll 为角量子数. 对第二个方程再进行分离变量,最后会得到一个 Legendre 多项式. 轨道方程方面,可以换元 R=u/rR = u/rR=u/r,方程变为一维的合流超几何方程 (有点像 Binet 方程), [−ℏ22md2dr2+Veff(r)]u(r)=Eu(r)\left[-\frac{\hbar^2}{2m}\frac{\text{d}^2}{\text{d}r^2}+V_{\text{eff}}(r)\right]u(r)=Eu(r) [−2mℏ2​dr2d2​+Veff​(r)]u(r)=Eu(r) 其中, Veff(r)=V(r)+ℏ22ml(l+1)r2V_{\text{eff}}(r)=V(r)+\frac{\hbar^2}{2m}\frac{l(l+1)}{r^2} Veff​(r)=V(r)+2mℏ2​r2l(l+1)​ 球 Bessel 函数: jl(x)=(−x)l(1xddx)l(sin⁡xx),nl(x)=−(−x)l(1xddx)l(cos⁡xx)j_l(x)=(-x)^l\left(\frac{1}{x}\frac{\text{d}}{\text{d}x}\right)^l\left(\frac{\sin x}{x}\right),\quad n_l(x)=-(-x)^l\left(\frac{1}{x}\frac{\text{d}}{\text{d}x}\right)^l\left(\frac{\cos x}{x}\right) jl​(x)=(−x)l(x1​dxd​)l(xsinx​),nl​(x)=−(−x)l(x1​dxd​)l(xcosx​)

2025/11/5
articleCard.readMore

Lesson 7 高分子链 (三)

蛋白质和和高分子的差异比较大,蛋白质的构造一般是「密堆积」的模式,如果是随机游走地构建的话,永远都无法得到这么密的结构;但是我们讨论的那些高分子 (微管之类) 内部都是短程力,e−r/ξe^{-r/\xi}e−r/ξ 因子占据主导作用,其结构是随机游走的模式. HP model 蛋白质形成的 toy model:HP model. 考虑在空间中的格点中摆放氨基酸,没有摆放氨基酸的格点上都是水分子;每一种摆放方式称为一个构型. 同时我们还要把氨基酸按照一定顺序连接起来. 在固定的摆放位置上,我们的连接就是一种「一笔画」问题,但是要考虑每一个构型和连接对应的能量,一共有两个惩罚因子:一个是疏水基团 (H) 和水在一起,其惩罚因子为 ε\varepsilonε (也就是能量升高 ε\varepsilonε);另一个是疏水基团和亲水基团 (P) 在一起 (不成键但是相邻),惩罚因子也是 ε\varepsilonε. 惩罚因子更高的结构难以存在,我们如果枚举这些结果,能够找到更优的排列、对应地落在更优的构型里面. 以 3×3×33\times3\times33×3×3 的格点为例,存在 ∼50000\sim50000∼50000 个不同的构型,以及 227∼1082^{27}\sim10^8227∼108 种排列,用计算机模拟,可以发现只有极少数的构型,非常多的序列愿意落在这些构型上面. 而且,不同的格点分布 (比如 6×66\times66×6 的格点),也有同样的结论. 这个模型虽然是一个所谓 toy model,但是给出了正确的基本结论. 但是局限性在于,不是所有蛋白质都有固定的结构:之前研究的有关基因修复和抗癌机制的「明星分子」P53 就不存在固定的结构,这称为 IDP,很多信号分子符合这个性质;还有一些蛋白质有一部分有固定的结构,其他的基团并不存在结构 (不能折叠),这被称为 IDR. 研究这类蛋白质有何作用是目前的前沿之一,所谓的 liquid-liquid phase separation 问题,分析无膜细胞器的相互作用. Liquid-liquid Phase Separation 一个无膜细胞器 (液滴) 一直和外界存在物质交换,用荧光物质实验,发现这个液滴中的荧光一开始是逐渐消散,然后又慢慢变亮. 考虑存在 A 和 B 两种分子,在格点中密堆积,混合熵为 ΔSNkB=−xAln⁡xA−(1−xA)ln⁡(1−xA) ,xA+xB=1\frac{\Delta S}{Nk_B}=-x_A\ln x_A-(1-x_A)\ln(1-x_A)\,,\quad x_A+x_B=1 NkB​ΔS​=−xA​lnxA​−(1−xA​)ln(1−xA​),xA​+xB​=1 其自由能 G∝−TΔSG\propto -T\Delta SG∝−TΔS 有一个最低点 (大概长下面这样): 这个能量只有一个低谷,所以不会发生两个相的分离 (想想 Landau 二级相变!);因此要达到两相分离,我们必须要考虑不理想的溶液,也就是把二次项找出来. 我们来考虑一个 A 分子周围有多少个 A 分子,这里用到平均场近似,一个小体积内,有和总的 A 分子数一样的比例. 什么时候可以忽略涨落用平均场近似? 维数越多,每个单元的近邻就越多,平均的效应就越明显,平均场近似也越好. 这也是为什么虽然一维的 Ising model 失效 (相变点在 0 K0\text{ K}0 K),但是二维乃至三维的 Ising model 给出非常不错的结果. 原来的方程:(这里相同分子算了两次,有个倍数) zNA=2mAA+mAB,zNB=2mBB+mABzN_A=2m_{AA}+m_{AB},\quad zN_B=2m_{BB}+m_{AB} zNA​=2mAA​+mAB​,zNB​=2mBB​+mAB​ 所以能量项里面, UN=12zwAAxA2+12zwBB(1−xA)2+zwABxA(1−xA)\frac{U}{N}=\frac{1}{2} zw_{AA}x_A^2+\frac{1}{2}zw_{BB}(1-x_A)^2+zw_{AB}x_A(1-x_A) NU​=21​zwAA​xA2​+21​zwBB​(1−xA​)2+zwAB​xA​(1−xA​) 一次项并不重要,它和之前是一样的,重要的是二次项,得到上面的函数达到临界值之后出现两相分离. 相平衡要求化学势平衡和渗透压平衡 (力学平衡),这给出了两个方程来确定两相的占比. Metastability:亚稳态. 对于靠近势能其中一个低谷的某个状态,如果不微扰的话就不会自发地发生相分离,这个本质上和水的过冷却一样. 在实践上,一般以温度作为调控因子,温度高的时候熵的作用非常明显,系统更加趋向于融合,难以发生分离. Polymer Solution:和上面类似,但是我们现在要把那些本来自由的粒子用化学键串起来,串起来的过程实际上减少了熵 (自由度降低),因此高分子更加容易发生相分离. 染色体 染色体上的一部分染色质有一定的固有 territory,我们发现有些染色质在核内部的位置是固定的,这意味着它们被「绑在」核膜上面. 核膜是一个极为刚性的结构. 这种模式降低了染色质的熵.

2025/11/4
articleCard.readMore

Multiplexed Survey Telescope in the Era of 30-m ELT

—— Huang SONG 兴隆国家天文台,有一台 2.16 m2.16\text{ m}2.16 m 直径的望远镜,是 1989 年建立的 (虽然 1958 年就开始筹划了). 目前,中国仍然需要大型的地面望远镜. 现在我们有:郭守敬望远镜 (LAMOST) 4.9 m4.9\text{ m}4.9 m,丽江的 2.4 m2.4\text{ m}2.4 m 口径望远镜,墨子望远镜 (WFST) 2.5 m2.5\text{ m}2.5 m (中科大),…… 现在上交正在冷湖建立 JUST (4.4 m4.4\text{ m}4.4 m 口径),我们在冷湖建造 MUST (6.5 m6.5\text{ m}6.5 m 口径),北大正在规划建立一座成长型通用光学望远镜 (EAST),口径在 6∼8 m6\sim 8\text{ m}6∼8 m 之间. 当然,目前最尖端的望远镜正在筹建,欧洲的合作项目 E-ELT 的望远镜达到了将近 40 m40\text{ m}40 m 口径,美国的 GMT 有 24.5 m24.5\text{ m}24.5 m 的等效口径,可以想象那样的大小能够发现什么样的新物理. 望远镜本体可以看作是一个引擎,其他的配套设施也起到了很大的作用. 以日本的 Subaru 望远镜为例,虽然他们的望远镜已经有一定的年限,但是新的 Ultimate-Subaru 计划准备全面更新 Subaru 的所有配套设施. Subaru 作为 4 m4\text{ m}4 m 量级的望远镜,其图像精度和信息量肯定比不上 39 m39\text{ m}39 m 的 E-ELT,但是视场宽度远大于 E-ELT,这是这些「较小」的望远镜的优势. 望远镜的数据量非常巨大,以 Vera Rubin (8.4 m8.4\text{ m}8.4 m) 为例,一晚上能够产生 15TB 的数据,在运行的十年内,拍摄了 550M 张照片,大于 500PB 的数据量,它的计算处理速度大于 1.8 Pflops1.8\text{ Pflops}1.8 Pflops (每秒 1.81.81.8 千万次浮点运算). 同时,有专门的光缆传输数据回到美国 (Vera Rubin 在 Chile 的南部),美国本土没有能力处理的数据会被传到欧洲进行处理,一台望远镜就对应了一整个 pipeline. 我们当前的目标就是,获得更加更加精确的宇宙三维图像,来验证理论,并利用理论来探索更早期的宇宙历史.

2025/11/4
articleCard.readMore

Lesson 6 二阶线性常微分方程的幂级数解法 (二)

方程常点邻域内的解 /Theorem/ 如果 p(z)p(z)p(z) 和 q(z)q(z)q(z) 在圆 ∣z−z0∣<R|z-z_0|<R∣z−z0​∣<R 内单值解析,则在此圆内常微分方程初值问题 d2wdz2+p(z)dwdz+q(z)w=0w(z0)=c0 ,w′(z0)=c1\begin{aligned} &\frac{\text{d}^2w}{\text{d}z^2}+p(z)\frac{\text{d}w}{\text{d}z}+q(z)w=0\\\\ &w(z_0)=c_0\,,\quad w'(z_0)=c_1 \end{aligned} ​dz2d2w​+p(z)dzdw​+q(z)w=0w(z0​)=c0​,w′(z0​)=c1​​ 有唯一的一个解 w(z)w(z)w(z),并且 w(z)w(z)w(z) 在这个圆内单值解析. 取 u=dw/dzu=\text{d}w/\text{d}zu=dw/dz,则化为一阶方程组: u′=−pu−qw ,w′=uu'=-pu-qw\,,\quad w'=u u′=−pu−qw,w′=u 转化为积分方程组: u=c1−∫z0z(pu+qw)dzw=c0+∫z0zudz\begin{aligned} &u=c_1-\int_{z_0}^z(pu+qw)\text{d}z\\\\ &w=c_0+\int_{z_0}^zu\text{d}z \end{aligned} ​u=c1​−∫z0​z​(pu+qw)dzw=c0​+∫z0​z​udz​ 要求 ∣z−z0∣<R|z-z_0|<R∣z−z0​∣<R. 如果取 u0=c1u_0=c_1u0​=c1​ 和 w0=c0w_0=c_0w0​=c0​,迭代,得到 un+1=c1−∫z0z(pun+qwn)dzwn+1=c0+∫z0zundz\begin{aligned} &u_{n+1}=c_1-\int_{z_0}^z(pu_n+qw_n)\text{d}z\\\\ &w_{n+1}=c_0+\int_{z_0}^zu_n\text{d}z \end{aligned} ​un+1​=c1​−∫z0​z​(pun​+qwn​)dzwn+1​=c0​+∫z0​z​un​dz​ 每一阶都是解析函数,因为最开始的函数是解析的;因为解析性,所以积分与路径无关,取一个 z0z_0z0​ 到 zzz 的直线积分路径,令 z−z0=ρeiφz-z_0=\rho e^{\text{i}\varphi}z−z0​=ρeiφ,则 u1=c1−∫0ρ(c1p+c1q)eiφdρw1=c0+∫0ρc1eiφdρ\begin{aligned} &u_1=c_1-\int_0^\rho(c_1p+c_1q)e^{\text{i}\varphi}\text{d}\rho\\\\ &w_1=c_0+\int_0^\rho c_1e^{\text{i}\varphi}\text{d}\rho \end{aligned} ​u1​=c1​−∫0ρ​(c1​p+c1​q)eiφdρw1​=c0​+∫0ρ​c1​eiφdρ​ 必定存在 M>0M>0M>0 满足 ∣p∣<M|p|<M∣p∣<M 且 ∣q∣<M|q|<M∣q∣<M,取 m=max⁡{∣c0∣,∣c1∣}m=\max\{|c_0|,|c_1|\}m=max{∣c0​∣,∣c1​∣},则 ∣u1−u0∣<2mMρ ,∣w1−w0∣<mMρ<2mMρ|u_1-u_0|<2mM\rho\,,\quad|w_1-w_0|<mM\rho<2mM\rho ∣u1​−u0​∣<2mMρ,∣w1​−w0​∣<mMρ<2mMρ 后面迭代的每一项都是满足上述条件的,有 ∣un−un−1∣<m(2Mρ)nn! ,∣wn−wn−1∣<m(2Mρ)nn!|u_n-u_{n-1}|<\frac{m(2M\rho)^n}{n!}\,,\quad|w_n-w_{n-1}|<\frac{m(2M\rho)^n}{n!} ∣un​−un−1​∣<n!m(2Mρ)n​,∣wn​−wn−1​∣<n!m(2Mρ)n​ 最终 u−c1=(u1−u0)+(u2−u1)+⋯u-c_1=(u_1-u_0)+(u_2-u_1)+\cdots u−c1​=(u1​−u0​)+(u2​−u1​)+⋯ 全部一致收敛. 解的存在性得证,唯一性可以反证法得到. 定理说明常点邻域的解可以表示为 w(z)=∑k=0∞ck(z−z0)kw(z)=\sum_{k=0}^\infty c_k(z-z_0)^k w(z)=k=0∑∞​ck​(z−z0​)k 同时只需要 c0c_0c0​ 和 c1c_1c1​ 就能定出所有后面的系数,于是可以写出一个线性表示: w(z)=c0w1(z)+c1w2(z)w(z)=c_0w_1(z)+c_1w_2(z) w(z)=c0​w1​(z)+c1​w2​(z) /Example/ (Legendre 方程) 求 Legendre 方程 (1−x2)d2ydx2−2xdydx+l(l+1)y=0(1-x^2)\frac{\text{d}^2y}{\text{d}x^2}-2x\frac{\text{d}y}{\text{d}x}+l(l+1)y=0 (1−x2)dx2d2y​−2xdxdy​+l(l+1)y=0 在 x=0x=0x=0 点邻域的解,其中 lll 是一个参数.

2025/11/4
articleCard.readMore

Lesson 14 磁场的多极展开

继续来讲磁场的多极展开. 磁矩的定义: m⃗=12∫Vx⃗′×j⃗(x⃗′)dτ′\vec{m}=\frac{1}{2}\int_V\vec{x}'\times\vec{j}(\vec{x}')\text{d}\tau' m =21​∫V​x ′×j ​(x ′)dτ′ 因为不存在磁单极,所以磁矩对应的是矢势的领头项,为 A⃗(1)(x⃗)=μ04πm⃗×r⃗r3\vec{A}^{(1)}(\vec{x})=\frac{\mu_0}{4\pi}\frac{\vec{m}\times\vec{r}}{r^3} A (1)(x )=4πμ0​​r3m ×r ​ 而对应的标势表达,可以写成 φm=μ04πm⃗⋅r⃗r3\varphi_m = \frac{\mu_0}{4\pi}\frac{\vec{m}\cdot\vec{r}}{r^3} φm​=4πμ0​​r3m ⋅r ​ 下面考虑用虚功原理来计算磁矩在外磁场中的受力,第一步应该是计算磁矩在外磁场中的势能. 对于在磁场中的磁矩,考虑磁矩产生 B⃗1\vec{B}_1B 1​ 和 H⃗1\vec{H}_1H 1​,外磁场产生 B⃗2\vec{B}_2B 2​ 和 H⃗2\vec{H}_2H 2​,总的磁能应该是 12∫(B⃗1+B⃗2)⋅(H⃗1+H⃗2)dτ\frac{1}{2}\int(\vec{B}_1+\vec{B}_2)\cdot(\vec{H}_1+\vec{H}_2)\text{d}\tau 21​∫(B 1​+B 2​)⋅(H 1​+H 2​)dτ 其中相互作用能是 w=B1⃗⋅H⃗2+B⃗2⋅H⃗1=(∇×A⃗1)⋅H⃗2+(∇×A⃗2)⋅H⃗1=∇⋅(A⃗1×H⃗2)+A⃗1⋅(∇×H⃗2)+∇⋅(A⃗2×H⃗1)+A⃗2⋅(∇×H⃗1)=∇⋅(A⃗1×H⃗2)+∇⋅(A⃗2×H⃗1)+A⃗1⋅j⃗2+A⃗2⋅j⃗1\begin{aligned} w &= \vec{B_1}\cdot\vec{H}_2+\vec{B}_2\cdot\vec{H}_1\\\\ &=(\nabla\times\vec{A}_1)\cdot\vec{H}_2+(\nabla\times\vec{A}_2)\cdot\vec{H}_1\\\\ &= \nabla\cdot(\vec{A}_1\times\vec{H}_2)+\vec{A}_1\cdot(\nabla\times\vec{H}_2)+\nabla\cdot(\vec{A}_2\times\vec{H}_1)+\vec{A}_2\cdot(\nabla\times\vec{H}_1)\\\\ &=\nabla\cdot(\vec{A}_1\times\vec{H}_2)+\nabla\cdot(\vec{A}_2\times\vec{H}_1)+\vec{A}_1\cdot\vec{j}_2+\vec{A}_2\cdot\vec{j}_1 \end{aligned} w​=B1​ ​⋅H 2​+B 2​⋅H 1​=(∇×A 1​)⋅H 2​+(∇×A 2​)⋅H 1​=∇⋅(A 1​×H 2​)+A 1​⋅(∇×H 2​)+∇⋅(A 2​×H 1​)+A 2​⋅(∇×H 1​)=∇⋅(A 1​×H 2​)+∇⋅(A 2​×H 1​)+A 1​⋅j ​2​+A 2​⋅j ​1​​ 而前两项是小量,可以忽略;最后得到的相互作用能应该为 W=12∫(j⃗1⋅A⃗2+j⃗2⋅A⃗1)dτ=12μ04π∫[∫j⃗1⋅j⃗2r3dr+∫j⃗2⋅j⃗1r3dr]=∫j⃗1⋅A⃗2dτ\begin{aligned} W&=\frac{1}{2}\int(\vec{j}_1\cdot\vec{A}_2+\vec{j}_2\cdot\vec{A}_1)\text{d}\tau=\frac{1}{2}\frac{\mu_0}{4\pi}\int\left[\int\frac{\vec{j}_1\cdot\vec{j}_2}{r^3}\text{d}r+\int\frac{\vec{j}_2\cdot\vec{j}_1}{r^3}\text{d}r\right]\\ &=\int\vec{j}_1\cdot\vec{A}_2\text{d}\tau \end{aligned} W​=21​∫(j ​1​⋅A 2​+j ​2​⋅A 1​)dτ=21​4πμ0​​∫[∫r3j ​1​⋅j ​2​​dr+∫r3j ​2​⋅j ​1​​dr]=∫j ​1​⋅A 2​dτ​ 如果用标势,那么应该得到 W=IφmW=I\varphi_mW=Iφm​. 用磁场表达,磁矩在外场中的势能是 W=m⃗⋅B⃗W=\vec{m}\cdot\vec{B} W=m ⋅B 对比电偶极子,那里是 −p⃗⋅E⃗-\vec{p}\cdot\vec{E}−p ​⋅E ,多了一个负号. 但是这并不意味着在外场中磁矩会向着磁场相反的方向转动,因为虚功原理要求磁矩大小不变,但是磁矩转动时磁通量会变化、电流也会随之变化,所以必须要外接电源;外接电源就会有电源做功,而我们考虑的是磁场的能量,这就差了一个负号. 当然,如果将电源的能量考虑进来,最后的总能量还应该是 −m⃗⋅B⃗-\vec{m}\cdot\vec{B}−m ⋅B ,力矩仍然使得磁矩向着磁场方向转动. 把电源做功也考虑进来,最终的磁矩受力为 F⃗=−∇(−m⃗⋅B⃗)=(m⃗⋅∇)B⃗\vec{F}=-\nabla(-\vec{m}\cdot\vec{B})=(\vec{m}\cdot\nabla)\vec{B} F =−∇(−m ⋅B )=(m ⋅∇)B

2025/11/4
articleCard.readMore

Lesson 7 Regression & Samplers

提示 Quizzes 给定背景信息 III,数据 DDD,模型 MMM 和参数 θ\thetaθ,则 (参数的) 先验 (prior):P(θ∣MI)P(\theta|MI)P(θ∣MI) 似然 (likelihood):P(D∣θMI)P(D|\theta MI)P(D∣θMI) 后验 (posterior):P(θ∣DMI)P(\theta|DMI)P(θ∣DMI),我们大多数时间在找的东西. (模型的) 证据 (evidence):P(D∣MI)P(D|MI)P(D∣MI),可以给出 Bayes 因子,影响后验比. Bayes 定理: P(θ∣DMI)=P(θ∣MI)P(D∣θMI)P(D∣MI)P(\theta|DMI)=\frac{P(\theta|MI)P(D|\theta MI)}{P(D|MI)} P(θ∣DMI)=P(D∣MI)P(θ∣MI)P(D∣θMI)​ 什么是冗余参数? 我们不关心的某一个参数,它能够影响我们的问题,但是我们会把它积分掉. 存在冗余参数 θn\theta_nθn​ 存在的情况下写出我们关心的参数 θp\theta_pθp​ 的联合后验分布 P(θp,θn∣DMI)P(\theta_p,\theta_n|DMI) P(θp​,θn​∣DMI) 则我们的 θp\theta_pθp​ 后验可以由 marginalization 得到: P(θp∣DMI)=∫P(θp,θn∣DMI)dθnP(\theta_p|DMI)=\int P(\theta_p,\theta_n|DMI)\text{d}\theta_n P(θp​∣DMI)=∫P(θp​,θn​∣DMI)dθn​ 我们可以固定冗余参数来求我们关心的参数的后验,而不是积分冗余参数吗? 不行,因为固定了一个参数,自由度变少了,我们最后得到的方差会变小,但是这相当于人为引入了一个不合理的先验,我们最后的先验会是错误的. 我们如何总结性地描述一个多元的 Gauss 型后验分布? 用 nσn\sigmanσ 这样的量来描述置信区间;需要协方差矩阵来描述变量之间的关联 (这已经包含了标准差);还需要均值 / 中位数 / 峰值来固定这些量的位置 (当然 Gauss 型分布下这三者相等). 怎么计算协方差矩阵? 已知一组参数构成的向量 θ⃗\vec{\theta}θ ,协方差矩阵为 Cij=⟨(θi−⟨θi⟩)(θj−⟨θj⟩)⟩C_{ij}=\braket{(\theta_i-\braket{\theta_i})(\theta_j-\braket{\theta_j})} Cij​=⟨(θi​−⟨θi​⟩)(θj​−⟨θj​⟩)⟩ 怎么计算关联矩阵? ρij=⟨(θi−⟨θi⟩)(θj−⟨θj⟩)⟩σiσj\rho_{ij}=\frac{\braket{(\theta_i-\braket{\theta_i})(\theta_j-\braket{\theta_j})}}{\sigma_i\sigma_j} ρij​=σi​σj​⟨(θi​−⟨θi​⟩)(θj​−⟨θj​⟩)⟩​ 这个矩阵比协方差矩阵少了对角元的信息. 判断下面的论断: 协方差矩阵是对称且半正定的. ✓\checkmark✓ 负的协方差表征负相关. ✓\checkmark✓ 协方差越大,关联越强. ×\times×,因为这个量和单个变量的方差有关. …… 什么是导出参数? 不参与拟合,但是可以由拟合时用到的参数导出的参数. 如果 z=f(x,y)z=f(x,y)z=f(x,y),那么: zzz 的后验可以直接由 x,yx,yx,y 的联合分布导出. ✓\checkmark✓ zzz 一定和 x,yx,yx,y 相关. ×\times×,因为有可能构造出 ⟨xz⟩=⟨x⟩⟨z⟩\braket{xz}=\braket{x}\braket{z}⟨xz⟩=⟨x⟩⟨z⟩ 的情况. 如何在同一个模型 MMM 下合成两个不同的数据集 D1,D2D_1,D_2D1​,D2​? 把似然乘在一起,因为直接乘后验的话,先验会乘两次. P(D1,D2∣θMI)=P(D1∣θMI)P(D2∣θMI)P(D_1,D_2|\theta MI)=P(D_1|\theta MI)P(D_2|\theta MI) P(D1​,D2​∣θMI)=P(D1​∣θMI)P(D2​∣θMI) 把两个独立数据集合在一起的好处是什么? 能够让参数变得更紧. 乘法法则: Likelihood×Prior=Posterior×Evidence\text{Likelihood}\times\text{Prior}=\text{Posterior}\times\text{Evidence} Likelihood×Prior=Posterior×Evidence 左边是输入,右边是输出. I do not fear computers. I fear the lack of them. —— Issac Asimov, 1962 这句话放在今天还是适用的,我们不需要害怕 AI,而是应该害怕没有 AI. Monte - Carlo Integration 到极高维度的情况,最有效的数值积分方法就是 Monte-Carlo. 如果我想要求一个积分: ∫abf(x)dx\int_a^bf(x)\text{d}x ∫ab​f(x)dx 做法应该是在 xxx 轴上面均匀采样,得到一组函数值,把这些值取平均,得到 =∑n=1Nf(xn)NΔxn=\sum_{n=1}^N\frac{f(x_n)}{N}\Delta x_n =n=1∑N​Nf(xn​)​Δxn​ 但是均匀撒点会导致在函数值比较低的地方也有不少的点,很多点被浪费掉了. 我们考虑的改进方法是,乘上一个分布函数之后再采样,归一化之后取平均,这是所谓的 importance sampling. 这时候, ∫abf(x)dx≈1N∑i=1Nf(Xi)q(Xi)\int_a^bf(x)\text{d}x\approx\frac{1}{N}\sum_{i=1}^N\frac{f(X_i)}{q(X_i)} ∫ab​f(x)dx≈N1​i=1∑N​q(Xi​)f(Xi​)​ 这个采样函数和被积分的函数相似度越高,我们的数值积分效率越高. 一般而言,我们会取 Gauss 函数作为采样函数. 这个方法的误差会是 N−1/2N^{-1/2}N−1/2 衰减,同时很容易推广到高维. Markov - Chain Monte - Carlo MCMC 算法使得我们的计算量更小、找到的先验更不容易偏离目标函数太远. Markov-Chain 要求我们的每下一个点依赖于上一个点,所有的采样点会更趋向于概率密度高的位置. 采样时,我们按照被积分函数作为分布函数生成下一个点,其中生成在概率密度太低位置的点会被合理的舍弃掉;初始的一部分点被称为 burn-in,它们取决于初始位置,在之后的计算中可能会排除掉这些点. 计算接受比例: r=f(x′)f(xi)⋅q(xi∣x′)q(x′∣xi)r=\frac{f(x')}{f(x_i)}\cdot\frac{q(x_i|x')}{q(x'|x_i)} r=f(xi​)f(x′)​⋅q(x′∣xi​)q(xi​∣x′)​ 我们只接受超过大概 20%∼80%20\%\sim80\%20%∼80% 接受比的点,如果低于接受比,那么这个点就被舍弃,从上一个点重新生成. 回到上节课的那一个问题,Gaussian Spectral Line: Ni=Aexp⁡[−(x−μi)22σi2]N_i=A\exp\left[-\frac{(x-\mu_i)^2}{2\sigma_i^2}\right] Ni​=Aexp[−2σi2​(x−μi​)2​] MCMC 的模拟看起来很不错. 但是实际上这是今天要讲的最差的算法,缺点在于: 没有保证收敛 Burn-in 不知道需要跑多久,如果不够久会导致存在 bias 实际上还是有很大一部分点是多余的 换参数之后,采样函数的形式也必须改,不是统一的 并行性不够好,同时采样的链太多效果不好 和最后取的 Gauss 函数宽度关系很大: 如果 Gauss 函数取得太窄,采样点在很长一段时间都陷在一个「坑」里面出不来,需要很长的 burn-in;如果取得太宽,采样点一下就被拒绝了. 物理学家想出了一种改进,Hamiltonian Monte Carlo (HMC) 算法,考虑把后验分布作为一个等高线图,定义势能,Hamiltonian 为 H(θ,p)=U(θ)+K(p)=U(θ)+12p⃗TM−1p⃗H(\theta,p)=U(\theta)+K(p)=U(\theta)+\frac{1}{2}\vec{p}^T\bold{M}^{-1}\vec{p} H(θ,p)=U(θ)+K(p)=U(θ)+21​p ​TM−1p ​ 其中 M\bold{M}M 是质量矩阵,是人为定义的. 每一次采样,都计算一次动力学方程,用标准的动力学模拟算法「leapfrog (蛙跳)」来算下一步应该走到哪里, p⃗←p⃗−ε2∇U(θ)θ⃗←θ⃗+εM−1p⃗\begin{aligned} &\vec{p}\leftarrow\vec{p}-\frac{\varepsilon}{2}\nabla U(\theta)\\\\ &\vec{\theta}\leftarrow\vec{\theta}+\varepsilon\bold{M}^{-1}\vec{p} \end{aligned} ​p ​←p ​−2ε​∇U(θ)θ ←θ +εM−1p ​​ 这样的算法可以实现一次「跑得很远」,避免被最开始的 Gauss 函数和分布函数的「坑」限制 (因为这样存在一种「惯性」);同时也不会「跑偏方向」,因为由「受力」来驱动. 这种方式是目前几百维的问题最快的数值模拟方式. 但是问题在于,我们需要知道后验分布的导函数 (当然,现在我们已经学会了很多求导数的算法),同时我们需要更多的参数 ε\varepsilonε、M\bold{M}M 等等. 这个方法在 1980s 由量子色动力学的研究者们提出,但是一直不温不火,直到 2011 年出现了 No-U-Turn Sampler (NUTS),这种改进版的算法可以自己在行进的过程中决定参数 ε\varepsilonε、M\bold{M}M 等等应该取多少,而且在很多开源的包里面都已经内置了这些算法,比如 PyMC,Stan,NumPyro,etc. 一个例子:我们想要解我们周围的星系分布,从现在的状况反解原初的宇宙状况. 这个问题现在已经由 HMC 解决. 当然,HMC 必须要能求梯度的后验分布. 总结:MCMC 的输入是一个不归一化的 (log) 后验分布 (and gradient of HMC),输出是一个由后验生成的采样. Nested Sampling HMC 还是难以处理多峰问题,而且不能容易地计算出 evidence. 这个全新的算法 (04 年提出) 的目的就是想要计算 evidence,同时将后验作为一个合理的副产物输出. 天体物理学家 06 年就开始使用这个,现在为止这是天体物理领域最强大的算法之一. 这种算法的想法是:我们之前想要用采样点来表示这个分布,在参数空间的维度变大之后一定会变得更加复杂;所以我们想到采样空间中的等高线 (或者说超曲面),而不是点,这时候我们不管多少维都变成一维的问题,同时把这些等高线 (面) 加起来就直接成为积分值. 定义 X(λ)X(\lambda)X(λ) 是先验的分布 π(θ)\pi(\theta)π(θ) 中大于 λ\lambdaλ 的部分: X(λ)=∫L(θ)>λπ(θ)dθ⟹dX=π(θ)dθX(\lambda)=\int_{\mathcal{L}(\theta)>\lambda}\pi(\theta)\text{d}\theta\Longrightarrow\text{d}X=\pi(\theta)\text{d}\theta X(λ)=∫L(θ)>λ​π(θ)dθ⟹dX=π(θ)dθ 因此就得到了一个类似 Lebesgue 积分的东西 (L~\tilde{\mathcal{L}}L~ 是归一化的似然), Z=∫L(θ⃗)π(θ⃗)dθ⃗=∫01L~(θ⃗)dθ⃗\mathcal{Z}=\int\mathcal{L}(\vec{\theta})\pi(\vec{\theta})\text{d}\vec{\theta}=\int_0^1\tilde{\mathcal{L}}(\vec{\theta})\text{d}\vec{\theta} Z=∫L(θ )π(θ )dθ =∫01​L~(θ )dθ 于是我们的采样点从 θ⃗\vec{\theta}θ 变成了一维的 XXX 点. 具体如何采样? 在先验 π(θ)\pi(\theta)π(θ) 中取 nliven_{\text{live}}nlive​ 个「活着的」点 考虑这些点中具有最小似然 L∗\mathcal{L}^*L∗ 的那一个点,标记为「死掉的」点 (也就是山脚) 再采样一个点,如果比山脚低就舍弃,比山脚高就留下作为一个新的「活着的」点,不断迭代,保证「活着的」点数量一直固定 这时候我知道不同的山脚往上涨的期望是多少,因为我标记了每一个「死掉的」点 计算出全部「死掉的」点的高度差,再加上最后「活着的」点,就计算出 evidence 在这个过程中,每死亡一个点,它周围的那一小块比它低的部分的形状就大致确定,所以得到一小块后验;死亡的点越多,我们就能得到整块的后验长成什么样子. 现在已经有了很多基于这个算法的工具: UltraNest:这是最准确的,但是效率不够高 Dynsety:这个为了效率牺牲了一些准确度 PyPolyChord / PolyChord:这是一个商业化的工具 PyMultiNest / Multinest:这是 05 年写出的「鼻祖级」代码,效率和后辈们差不多,但是准确度已经不够高了 Exercise 计算恒星的光变曲线. 一个恒星的真实光变曲线是 m(t)=Asin⁡(2πTt+ϕ)+m0[mag]m(t)=A\sin\left(\frac{2\pi}{T}t+\phi\right)+m_0\quad\text{[mag]} m(t)=Asin(T2π​t+ϕ)+m0​[mag] 我们一年观察 N=32N=32N=32 个随机的夜晚,但是每天晚上的观测条件不同. 同时,有一个 Gauss 型的噪声叠加在这个光变曲线上. 问题转化为: 我们已知每天的数据、观测仪器误差、观测的时间 未知的量是理论曲线中的参数 A,T,ϕ,m0A,T,\phi,m_0A,T,ϕ,m0​ (作为 θ⃗\vec{\theta}θ ). 先验是 A∈[0,3]A\in[0,3]A∈[0,3],T∈[10,300]T\in[10,300]T∈[10,300],ϕ∈[0,2π]\phi\in[0,2\pi]ϕ∈[0,2π],m0∈[10,20]m_0\in[10,20]m0​∈[10,20],ln⁡π(θ⃗)=0\ln\pi(\vec{\theta})=0lnπ(θ )=0 (因为都是均匀分布). 似然对数: ln⁡L(θ⃗)=−12∑i=1N(mi−m(ti;θ⃗))2σi2+const.\ln\mathcal{L}(\vec{\theta})=-\frac{1}{2}\sum_{i=1}^N\frac{(m_i-m(t_i;\vec{\theta}))^2}{\sigma_i^2}+\text{const.} lnL(θ )=−21​i=1∑N​σi2​(mi​−m(ti​;θ ))2​+const. 提示 实际上这就是所谓的「卡方」χ2\chi^2χ2,也就是高中数学 (和频率学家们) 经常算的东西.

2025/10/30
articleCard.readMore

Lesson 13 磁标势

在定义磁标势的情况下,磁场的问题能够和电场的问题对应起来,有 ∇2φm=−ρmμ0 ,∇⋅H⃗=ρmμ0\nabla^2\varphi_m=-\frac{\rho_m}{\mu_0}\,,\quad\nabla\cdot\vec{H}=\frac{\rho_m}{\mu_0} ∇2φm​=−μ0​ρm​​,∇⋅H =μ0​ρm​​ 对于有磁介质存在的情况,H⃗\vec{H}H 和 B⃗\vec{B}B 存在边界条件, n^12⋅(B⃗2−B⃗1)=0 ,n^12×(H⃗2−H⃗1)=α⃗m\hat{n}_{12}\cdot(\vec{B}_2-\vec{B}_1)=0\,,\quad\hat{n}_{12}\times(\vec{H}_2-\vec{H}_1)=\vec{\alpha}_m n^12​⋅(B 2​−B 1​)=0,n^12​×(H 2​−H 1​)=α m​ 边界上存在面电流时,按理来说不应该转化为磁荷法来计算,但是有时边界能够分割出两个部分,两个空间部分分别能够用磁荷法,两边用边界条件进行连接,比如:一个面密度为 σ\sigmaσ 的均匀球面,绕着某一条直径以速度 ω\omegaω 旋转. 磁荷法的边界条件写成: ∂φm1∂θ+∂φm2∂θ=αm\frac{\partial\varphi_{m1}}{\partial\theta}+\frac{\partial\varphi_{m2}}{\partial\theta}=\alpha_m ∂θ∂φm1​​+∂θ∂φm2​​=αm​ 上面讲到的那个例子和在均匀电场中被均匀极化的小球非常相似,都是外场为严格偶极场、内场为严格均匀场. 磁标势更多地运用于讨论铁磁体产生的磁场 (全空间没有传导电流),但是铁磁体的磁化强度 M⃗\vec{M}M 和磁场强度 H⃗\vec{H}H 的依赖关系比较复杂,M⃗\vec{M}M 和磁化过程有关系 (磁滞回线). 一般考虑已知 M⃗\vec{M}M 的永磁体 (硬铁磁质) 或者磁导率很大的软铁磁质 (一般用作引导磁场的材料,比如变压器). 如果电流分布集中于一个小区域,那么和电场类似,也可以展开为多极: A⃗(x⃗)=μ04π∫Vj⃗(x⃗′)rdτ′=μ04π∫Vj⃗(x⃗′)[1R−x⃗′⋅∇1R+12!x⃗x⃗:∇∇1R+⋯ ]\vec{A}(\vec{x})=\frac{\mu_0}{4\pi}\int_V\frac{\vec{j}(\vec{x}')}{r}\text{d}\tau'=\frac{\mu_0}{4\pi}\int_V\vec{j}(\vec{x}')\left[\frac{1}{R}-\vec{x}'\cdot\nabla\frac{1}{R}+\frac{1}{2!}\vec{x}\vec{x}:\nabla\nabla\frac{1}{R}+\cdots\right] A (x )=4πμ0​​∫V​rj ​(x ′)​dτ′=4πμ0​​∫V​j ​(x ′)[R1​−x ′⋅∇R1​+2!1​x x :∇∇R1​+⋯] 展开式的第二项为 A⃗(1)(x⃗)=−μ04π∇j1R∫Vj⃗(x⃗′)xj′dτ′\vec{A}^{(1)}(\vec{x})=-\frac{\mu_0}{4\pi}\nabla_j\frac{1}{R}\int_V\vec{j}(\vec{x}')x_j'\text{d}\tau' A (1)(x )=−4πμ0​​∇j​R1​∫V​j ​(x ′)xj′​dτ′ 这是因为,并矢 j⃗(x⃗′)xl\vec{j}(\vec{x}')x_lj ​(x ′)xl​ 能够写成对称部分和反对称部分,一个矢量点乘反对称并矢可以化为一组矢量双叉乘,进行化简.

2025/10/30
articleCard.readMore

Lesson 6 探索物质的终极结构

—— Zhihong YE 和施老师差不多,也是中高能核物理领域. 一些科学史 阿克那萨哥拉:万物处于永恒的运动,在循环中相互转化;物质不会凭空产生和消失;物质有「种子」,由同样的基础成分组成;物质可以无限分割. 早期的原子论由德谟克利特提出. 之后在 2500 年前左右,几乎几个重要的文明都提出了四元素论或者五元素论. 同时,炼金术发展出了早期的化学. 17 世纪,早期的「微粒论」被提出. 19 世纪,Lavoisier 收录了 33 种元素;1862 年,法国人尚古多用螺旋图总结了 62 种元素,直到 1869 年 Менделеев 提出元素周期表. 1897 年 Thompson 从阴极射线中发现电子;1909 年 Rutherford 散射实验,提出原子的太阳系模型. 1918 年 Rutherford 又发现了质子,之后就是量子力学的提出和 Bohr 原子模型. Quark & gluon 如何形成质子和中子? 半径问题:带电 quark 运动产生了电荷和磁荷的分布,但是理论半径和实验不同 质量问题:quark 质量只占据核子质量的 10%10\%10%,动能贡献了 70%70\%70%,剩下的部分来源未知,有可能是暗能量? 自旋问题:核子自旋并非简单的三 quark 自旋之和,70%70\%70% 的自旋贡献来源并不确定. 胶子可能可以直接组成物质. 理论与实验 最直接的方法是通过第一性原理,由 QCD 直接推导出夸克和胶子在核子里面的波函数. 在得到破碎的核子之后,我们能够反演得到原来的核子结构. 同时我们并不知道我们碰撞中打到了哪一个夸克,但是我们可以从统计上确认到底是哪一个被打到.

2025/10/30
articleCard.readMore

Lesson 12 高维的 Schrödinger 方程

如果某一个态是 ∣ψ⟩\ket{\psi}∣ψ⟩,那么它可以被投影到不同的表象空间. 这样的态叫做纯态. 什么是混态? 混态是纯态加上一些其他的自由度,比如一个偷偷观测这个粒子的某一个自由度. 这样我们能够写出一个更大的纯态,包含这些其他自由度. 高维的 Schroödinger 方程 三维情况下,Hamiltonian 写成 H=px2+py2+pz22m+Vx+Vy+VzH=\frac{p_x^2+p_y^2+p_z^2}{2m}+V_x+V_y+V_z H=2mpx2​+py2​+pz2​​+Vx​+Vy​+Vz​ 比较好的情况是能够分离变量,也就是 ψ(x,y,z)=ϕx(x)ϕy(y)ϕz(z)\psi(x,y,z)=\phi_x(x)\phi_y(y)\phi_z(z)ψ(x,y,z)=ϕx​(x)ϕy​(y)ϕz​(z),得到三个方向上的方程,这里的 EEE 分为 Ex,Ey,EzE_x,E_y,E_zEx​,Ey​,Ez​,Hamiltonian 分解为 H^i=p^x22mx+12mxω2x2\hat{H}_i=\frac{\hat{p}_x^2}{2m_x}+\frac{1}{2}m_x\omega^2x^2 H^i​=2mx​p^​x2​​+21​mx​ω2x2 三维的方程写成 iℏ∂Ψ∂t=[−ℏ22m∇2+V]Ψ\text{i}\hbar\frac{\partial\Psi}{\partial t}=\left[-\frac{\hbar^2}{2m}\nabla^2+V\right]\Psi iℏ∂t∂Ψ​=[−2mℏ2​∇2+V]Ψ 在球坐标下, ∇2=1r2∂∂r(r2∂∂r)+1r2sin⁡θ∂∂θ(sin⁡θ∂∂θ)+1r2sin⁡2θ∂2∂ϕ2\nabla^2=\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{1}{r^2\sin\theta}\frac{\partial}{\partial\theta}\left(\sin\theta\frac{\partial}{\partial\theta}\right)+\frac{1}{r^2\sin^2\theta}\frac{\partial^2}{\partial\phi^2} ∇2=r21​∂r∂​(r2∂r∂​)+r2sinθ1​∂θ∂​(sinθ∂θ∂​)+r2sin2θ1​∂ϕ2∂2​ 像数理方程一样,分离变量. 对于方位角 ϕ\phiϕ 的本征方程,为 1Φd2Φdϕ2=−m2\frac{1}{\Phi}\frac{\text{d}^2\Phi}{\text{d}\phi^2}=-m^2 Φ1​dϕ2d2Φ​=−m2 得到角向的波函数是 Φ=eimϕ\Phi=e^{\text{i}m\phi}Φ=eimϕ. 而 θ\thetaθ 的本征函数是 Legendre 多项式,得到 Θ(θ)=APlm(cos⁡θ)\Theta(\theta)=AP_l^m(\cos\theta) Θ(θ)=APlm​(cosθ) 其中, Pl(x)=12l⋅l!(ddx)l(x2−1)lP_l(x)=\frac{1}{2^l\cdot l!}\left(\frac{\text{d}}{\text{d}x}\right)^l(x^2-1)^l Pl​(x)=2l⋅l!1​(dxd​)l(x2−1)l

2025/10/30
articleCard.readMore

Lesson 6 高分子链 (二)

如果很多人都迟交作业,那么分数 decay 的因子会很强. 当然我们没有要求大家把所有的题目做出来做得很完美,比如打了 ∗∗**∗∗ 的题目有时候会需要查找文献或者调研. 我们要说一下,为什么远离平衡的稳态对生物体那么重要:如果某种蛋白质存在错误折叠和正确折叠两种状态,它们之间的转换平衡常数是 K−K_-K−​ 和 K+K_+K+​,有两个公式主导了这个过程: 平衡常数:这产生一条对数坐标上的正比例函数 物质守恒:这产生一条对数坐标上的负相关一次函数 这两条直线会在某个点相交,这就是系统唯一可以存在的平衡态. 不管这之间的转换到底是如何进行的,平衡态一定只能是这个解. 但是,如果我们让两个方向的转换有一个方向是不平衡的,比如引入一个驱动 (ATP →\to→ ADP 之类),那么我们就不止一个解,原来的那个「正比例函数」的斜率可以变化,在物质守恒的那条直线上扫出一个线段那么多的解. 线段的一个端点是无驱动的平衡态,另一端是只有有驱动的那一个反应时,达到的极限状态. 这样我们就能够通过引入驱动的方式,使得生物体内的反应变得可以调控. 当反应物和生成物增多,我们可以画一个相空间,每一条轴都是参与反应物质的浓度,那么物质守恒对应一个 n−1n-1n−1 维的超曲面,可以存在的状态区间是过原点的一条直线扫出来的一个 n−1n-1n−1 维面,驱动越大,可能的状态区间就越来越大. 这是 2024 年才发表的结果,其实是很前沿的. 高分子 继续回来讲我们的高分子. 实际上一个一维链是一个 Ising model,势能为 H=−h∑iσi+J∑(i,j)σiσjH=-h\sum_i\sigma_i+J\sum_{(i,j)}\sigma_i\sigma_j H=−hi∑​σi​+J(i,j)∑​σi​σj​ Ising 模型存在一个关联函数: g(r)=⟨σiσi+1⟩=tanh⁡r(βJ)=e−r/ξg(r)=\braket{\sigma_i\sigma_{i+1}}=\tanh^r(\beta J)=e^{-r/\xi} g(r)=⟨σi​σi+1​⟩=tanhr(βJ)=e−r/ξ 但是只有在小的原子量情况下 Ising 模型才能比较好地估计高分子的关联长度,更大的原子量这些模型就因为某些长程的关联而不适用了. 考虑更高的维度,两个链节之间的关联依赖于它们的夹角 (为简便,只考虑近邻的相互作用): ⟨x⃗i⋅x⃗j⟩=a2(cos⁡θ)∣j−i∣=a2e−∣j−i∣/sp\braket{\vec{x}_i\cdot\vec{x}_j}=a^2(\cos\theta)^{|j-i|}=a^2e^{-|j-i|/s_p} ⟨x i​⋅x j​⟩=a2(cosθ)∣j−i∣=a2e−∣j−i∣/sp​ (比如 1 和 3 的关联:a2⟨x⃗1⋅x⃗3⟩=⟨x⃗1⋅x⃗2⟩⟨x⃗2⋅x⃗3⟩a^2\braket{\vec{x}_1\cdot\vec{x}_3}=\braket{\vec{x}_1\cdot\vec{x}_2}\braket{\vec{x}_2\cdot\vec{x}_3}a2⟨x 1​⋅x 3​⟩=⟨x 1​⋅x 2​⟩⟨x 2​⋅x 3​⟩) 如果连续化计算,得到首到尾的距离平均应该是 ⟨r2⟩=⟨∫0Lt⃗(s1)ds1∫0Lt⃗(s2)ds2⟩=∫0L∫0L⟨t⃗(s1)⋅t⃗(s2)⟩ds1ds2=∫0L∫0Le−∣s1−s2∣/ξpds1ds2\begin{aligned} \braket{r^2} &= \braket{\int_0^L\vec{t}(s_1)\text{d}s_1\int_0^L\vec{t}(s_2)\text{d}s_2}\\\\ &=\int_0^L\int_0^L\braket{\vec{t}(s_1)\cdot\vec{t}(s_2)}\text{d}s_1\text{d}s_2\\\\ &=\int_0^L\int_0^Le^{-|s_1-s_2|/\xi_p}\text{d}s_1\text{d}s_2 \end{aligned} ⟨r2⟩​=⟨∫0L​t (s1​)ds1​∫0L​t (s2​)ds2​⟩=∫0L​∫0L​⟨t (s1​)⋅t (s2​)⟩ds1​ds2​=∫0L​∫0L​e−∣s1​−s2​∣/ξp​ds1​ds2​​ 这样的关联可能来源于单元的带电性,或者一个比较好的模型 —— 弹性. 弯曲角度圆心角为 θ\thetaθ 时,总的弹性势能是 E=B2∫0S1R2ds=B2SR2=B2Sθ2E=\frac{B}{2}\int_0^S\frac{1}{R^2}\text{d}s=\frac{B}{2}\frac{S}{R^2}=\frac{B}{2S}\theta^2 E=2B​∫0S​R21​ds=2B​R2S​=2SB​θ2 计算上面弹性势能的平均值,为 kBTk_BTkB​T 量级,所以 ⟨θ2⟩=2kBTB\braket{\theta^2}=\frac{2k_BT}{B} ⟨θ2⟩=B2kB​T​ (能均分,有 θ\thetaθ 和 ϕ\phiϕ 两个弯曲自由度) 这样的量代表着一个高分子整体的弯曲程度,可以实测得到一个高分子「直」的部分的长度:对于 RNA,实测数据为 ∼1 nm\sim1\text{ nm}∼1 nm,DNA 为 ∼50 nm\sim50\text{ nm}∼50 nm,actin (肌动蛋白) 为 ∼18  μm\sim18\,\,\mu\text{m}∼18μm,MT (微管) 为 ∼6 mm\sim6\text{ mm}∼6 mm. 这是很神奇的,因为在细胞内部,微管的直线长度实际上只有 ∼30  μm\sim30\,\,\mu\text{m}∼30μm 的量级,和溶液中的差距 200 倍. 所以我们的假设一定有哪里出了问题: 问题在于:我们假设高分子与周围的介质处于平衡态. 实际上在细胞内部,分子马达会对微管等等高分子产生很多撞击,导致高分子变得弯曲. 拉直 DNA:WLC Model. 就像小时候卷曲的电话线,在简单拉直的时候,我们并不需要费很多力,因为这是一种「熵弹性」(当然宏观物体的熵效应并不明显,我们只是比喻);但是要拉开微观的那些小螺旋,就需要花更大的力气,就像 DNA 的单元之间的小结构在拉得很直时有显著的作用. 下面说几个例子. Force Sensing (力感知):比如诱导干细胞的发育,只需要改变它所处的力环境. 什么样的结构能够将力学信号改成化学信号? 一种叫做 talin 的蛋白,有一端扎在细胞膜上,另一端固定在细胞骨架上,一旦受到力的作用,上面的一个结构会被弹开,露出里面的一个结合位点. talin 上一共有 13 个能被弹开的结构. 下游的信号分子能够结合这个位点,进行下一步的反应. 这个蛋白把力学信号转换为了「结合能力」,实测得到几个 pN\text{pN}pN 大小的力能够造成 1000 倍以上的亲和力变化. 当然我们做了平衡态的假设,也就是细胞骨架一直以力平衡方式拉着 talin. 但是这个调控过程不一定是平衡的,有可能是以一个固定的速度在拉着 talin (固定速度是可以实现的,比如分子马达的速度一般就是恒定的),这时候就不再是平衡态的过程了. DNA 成环:可以计算 DNA 成环的自由能变化,对于长度为 LLL 的一个环, ΔEbend∼1/L ,ΔS∼−ln⁡L ,ΔG=ΔE−TΔS\Delta E_{\text{bend}}\sim1/L\,,\quad\Delta S\sim-\ln L\,,\quad\Delta G=\Delta E-T\Delta S ΔEbend​∼1/L,ΔS∼−lnL,ΔG=ΔE−TΔS 其中熵的变化是因为:另一头本来能够在一个半径为 LLL 的球面上运动,但是现在被固定在这一头的位置,丧失了一个球面的自由度. 蛋白质的折叠也和上面两个例子类似.

2025/10/28
articleCard.readMore

Galaxy Formation in Supercomputers

—— Hui Li 这个领域的「望远镜」不是真正的望远镜,而是超级计算机. 不同的星系有很多不同的特征,比如银河系是一个有旋臂的螺旋星系,还有很多巨型星系、暗红色的矮星系、绕着更大星系旋转的水母状星系等等. 我们的核心问题是什么样的物理机制决定了这些星系的形态. 另一个问题是,这些星系的空间分布并不呈现非常随机的分布,而是有一定的空间关联,它们的分布有一定的拓扑结构,从 1977 的 CfA 巡天到现在的 DESI 暗能量光谱巡天,都能找到一定的结构特征. 目前我们已经知道了这些问题的初始条件 (宇宙大爆炸和 CMB 的早期微小涨落) 和末态条件 (当前的观测结果). 现在的很多不均匀性应该来自于早期宇宙的那些微小涨落,它们能够成长成为现在的大尺度结构,比如一个高密度区域能够吸引更多物质,长成更大的星系团. The first N-body simulation with light bulbs: Development of a「BAR-TYPE」Density Wave in the Central Layer of Galaxy. —— Per Olaf Lindblad, Stockholm Observatory, April 1961 这是最早的一个模拟,他们在初态设置了很多灯泡,用接收器来测量收到的光强 (这和引力一样,也是 1/r21/r^21/r2 律),然后用光强大小来判断某个位置受到的引力大小,之后按照这样的「引力」来移动灯泡,「演化」这个系统,最后能够得到一个类似于螺旋星系的结构. 当然,现在我们在超算上用 billion 量级的引力单元来模拟宇宙的结构. Gravity-Only N-Body Simulations 每个单元的运动方程是 x⃗¨i=−∇iΦ(x⃗i) ,Φ(x⃗)=−G∑j=1Nmj[(x⃗−x⃗j)2+ε2]1/2(1)\ddot{\vec{x}}_i=-\nabla_i\varPhi(\vec{x}_i)\,,\quad\varPhi(\vec{x})=-G\sum_{j=1}^N\frac{m_j}{[(\vec{x}-\vec{x}_j)^2+\varepsilon^2]^{1/2}}\tag{1} x ¨i​=−∇i​Φ(x i​),Φ(x )=−Gj=1∑N​[(x −x j​)2+ε2]1/2mj​​(1) 简单的想法是直接求和,得到全空间的引力势,但是这个方法的复杂度是 O(N2)\mathcal{O}(N^2)O(N2),因为求和的难度是 N(N+1)N(N+1)N(N+1). 到 1 million 量级的粒子数量时,我们还能够计算,但是已经非常吃力. 人们想出了很多更有效率的算法,比如 Tree Algorithm,考虑把粒子放在一个树状分组中,找到每一个分组的中心质量,然后计算远场的某处引力势: 最后只用对最近的一些粒子做引力的直接求和,更远的区域可以先做质量求和再求引力,这样的算法得到的复杂度是 O(Nlog⁡N)\mathcal{O}(N\log N)O(NlogN). (当然还有很多别的算法,但是复杂度都差不多) 下面我们来看看模拟到底得到了什么: 大尺度结构成长于早期的均匀密度之中,逐渐变得非线性 暗物质晕的存在 暗物质晕有内部结构 暗物质晕的空间分布: 这个理论结果和目前已经得到的大量巡天结果相吻合,这很令人自豪,因为我们输入的不过是 CMB 的结构,但是我们得到了和观测吻合的结果. 暗物质晕周围会出现很多小尺度的暗物质晕,这是因为暗物质晕的形成是「bottom-up」的过程,大尺度结构来源于小尺度结构的涌现;小型的暗物质晕叫做 satellite 暗物质晕 (这刚好和丹丹老师讲到的东西类似). Cosmological Hydrodynamical Simulations 「Putting Everything Together」 我们不能只算暗物质的引力作用,这还不够,我们需要研究重子物质如何在暗物质晕中分布. (Dandan Xu 提到过的星系质量曲线和理论模拟出的暗物质晕质量曲线之间存在一个压低) 这样非线性的效应需要我们考虑很多 dirty 细节,比如气体的压强、Boltzmann 积分微分方程、流体力学、…… 这时候我们的任务变得非常 chaotic. 在模拟中,这样的系统和之前的 gravitation-only 系统不一样了,星系的中心出现了超新星爆炸、黑洞等等,气体被爆炸和喷流抛射出去,磁场和电场产生了很大的作用,星系也呈现了更多有趣的形态. Missing satellite problem:我们的模拟中得到,我们周围应该有更多的卫星星系,但是我们并没有观测到那么多. 一个可能的解释是,这些小型的暗物质晕并不能形成星系,它们是 dizzy 的,所以我们无法观测到;另外,更加轻的暗物质晕的势阱非常浅,更容易被一场超新星爆炸破坏掉. New Frontiers Galaxy Formation in the Cosmic Dawn (Epoch of Reionization) 我们考虑远处的星系的吸收谱线,有些吸收谱线只有电离之后的氢才能吸收,我们的观测结果发现 Lyman 谱线被吸收,这些吸收谱被红移之后在光谱上形成了梳齿状的结构,被称为 Lyman Alpha Forest. 我们的问题是,为什么之前的原子化宇宙到现在被「再电离 (reionization)」了. 再电离之前的宇宙,能量较低的光子会被原子所吸收,而光子能够穿过电离后的气体. 到 z=6z=6z=6 的时期,宇宙突然变得非常「透明」,但是我们还不知道什么样的源导致了这样的现象. 为什么是「再电离」? 很显然啊,宇宙大爆炸的高温下没有什么东西不是电离的,只是冷却后变得原子化了. Evolution of Galaxies in Their Ecosystem 上节课 Zhijie Qu 讲的就是这个,星系周围的气体和星系自己组成了一种生态系统,在这样的系统中研究星系的演化是当前的一个前沿话题. 星系不仅和周围的气体相互作用,星系之间也存在气体的交换. missing Baryon problem (Zhijie Qu 讲过这个,崔老师也是做这个的). 课后问题 为什么方程 (1) 里面有一个 ε\varepsilonε? 这被称为 soften. 因为我们用一个粒子来模拟成千上万个暗物质粒子,如果只有两个粒子,它们相互作用时可能出现相互绕转的现象,但是我们知道对于两团物质而言这是完全不可能的,它们应该相互穿过、受到一点点引力作用. ε\varepsilonε 就体现的是这样的作用. 计算更高阶关联函数的意义? 两点关联函数已经和当前的宇宙结构符合得很好了,三点、四点等等的关联函数一般被用来验证 Newton 引力的正确性.

2025/10/28
articleCard.readMore

Lesson 12 静磁场

这节课讲静磁场. 静磁场满足的方程类似静电场的 Poisson 方程,但是是矢量形式: ∇2A⃗=μj⃗\nabla^2\vec{A}=\mu\vec{j} ∇2A =μj ​ /Example/ 求半径 aaa 的导线圆环载电流为 III,求空间矢势和磁感应强度.

2025/10/28
articleCard.readMore

Lesson 11 不确定关系

下周这个时候考试. 我们已经学了第二章,知道了很多具体的例子;第三章主要是形式化的理论. 不确定关系 我们先定义一下,什么是误差: f=(A^−⟨A⟩)ψ⟹σA2=⟨f∣f⟩f=(\hat{A}-\braket{A})\psi\Longrightarrow\sigma_A^2=\braket{f|f} f=(A^−⟨A⟩)ψ⟹σA2​=⟨f∣f⟩ 这个量 (方差) 不管均值是多少,都是非负的. 利用 Cauchy - Schwartz 不等式,应该有 ∣⟨f∣g⟩∣2≤⟨f∣f⟩⟨g∣g⟩=σA2σB2|\braket{f|g}|^2\leq\braket{f|f}\braket{g|g}=\sigma_A^2\sigma_B^2 ∣⟨f∣g⟩∣2≤⟨f∣f⟩⟨g∣g⟩=σA2​σB2​ 考虑: ⟨f∣g⟩−⟨g∣f⟩=⟨A^B^⟩−⟨B^A^⟩=⟨[A^,B^]⟩\braket{f|g}-\braket{g|f} = \braket{\hat{A}\hat{B}}-\braket{\hat{B}\hat{A}}=\braket{[\hat{A},\hat{B}]} ⟨f∣g⟩−⟨g∣f⟩=⟨A^B^⟩−⟨B^A^⟩=⟨[A^,B^]⟩ 我们知道 ⟨g∣f⟩=⟨f∣g⟩∗\braket{g|f}=\braket{f|g}^*⟨g∣f⟩=⟨f∣g⟩∗,因此可以将上面的不等式写成 σA2σB2≥[12i(⟨f∣g⟩−⟨g∣f⟩)]2=[12i⟨[A^,B^]⟩]2\sigma_A^2\sigma_B^2\geq\left[\frac{1}{2\text{i}}(\braket{f|g}-\braket{g|f})\right]^2=\left[\frac{1}{2\text{i}}\braket{[\hat{A},\hat{B}]}\right]^2 σA2​σB2​≥[2i1​(⟨f∣g⟩−⟨g∣f⟩)]2=[2i1​⟨[A^,B^]⟩]2 因此最终得到了任意两个可观测量之间的不确定性关系: σAσB≥12⟨[A^,B^]⟩\sigma_A\sigma_B \geq \frac{1}{2}\braket{[\hat{A},\hat{B}]} σA​σB​≥21​⟨[A^,B^]⟩ 如果我们想测量一组非对易的物理量,那么一定无法同时测准. 同样,这个推导可以推广到更多的物理量上,比如一组三个可观测量. 如果两个算符有一套共同的完备基, P^fn=λnfn ,Q^fn=μnfn\hat{P}f_n = \lambda_nf_n\,,\quad\hat{Q}f_n=\mu_nf_n P^fn​=λn​fn​,Q^​fn​=μn​fn​ 那么拿它们的对易子对一个波函数进行作用: [P^,Q^]f=(P^Q^−Q^P^)∑ncnfn=∑ncn(λnμn−μnλn)fn=0[\hat{P},\hat{Q}]f = (\hat{P}\hat{Q}-\hat{Q}\hat{P})\sum_n c_nf_n=\sum_nc_n(\lambda_n\mu_n-\mu_n\lambda_n)f_n=0 [P^,Q^​]f=(P^Q^​−Q^​P^)n∑​cn​fn​=n∑​cn​(λn​μn​−μn​λn​)fn​=0 这说明共享一套完备基的两个算符一定是相对易的. 不确定性关系在统计力学中有很多应用,比如相空间中一个态占据的体积是 ℏ\hbarℏ. 我们相空间的自由度来源于总的粒子数和共轭变量的个数,如果仅仅考虑三维动量和坐标,有 NNN 个粒子,那么相空间的状态密度应该是 ℏ−6N\hbar^{-6N}ℏ−6N 的量级,非常大. 虽然我们没有引入时间算符,但是时间与能量算符应该也满足共轭关系: [E^,t^]=iℏ[\hat{E},\hat{t}]=\text{i}\hbar [E^,t^]=iℏ 于是,能量和时间的不确定度也存在不确定性关系: τ∼ℏΔE\tau\sim\frac{\hbar}{\Delta E} τ∼ΔEℏ​ Dirac Notation 认为状态对应的波函数是矢量,可以换不同的表象: ∣S⟩=∑ncn∣en⟩ ,cn=⟨en∣S⟩\ket{S}=\sum_nc_n\ket{e_n}\,,\quad c_n=\braket{e_n|S} ∣S⟩=n∑​cn​∣en​⟩,cn​=⟨en​∣S⟩ 这时 Schrödinger 方程写为 iℏddt∣S(t)⟩=H^∣S(t)⟩\text{i}\hbar\frac{\text{d}}{\text{d}t}\ket{S(t)}=\hat{H}\ket{S(t)} iℏdtd​∣S(t)⟩=H^∣S(t)⟩ 如果选坐标基,就得到坐标空间的波函数, ψ(x,t)=⟨x∣S(t)⟩\psi(x,t)=\braket{x|S(t)} ψ(x,t)=⟨x∣S(t)⟩ 也可以引入动量空间的波函数 ϕ(p,t)=⟨p∣S(t)⟩\phi(p,t)=\braket{p|S(t)}ϕ(p,t)=⟨p∣S(t)⟩、能量表象的波函数 cn(t)=⟨n∣S(t)⟩c_n(t)=\braket{n|S(t)}cn​(t)=⟨n∣S(t)⟩ (离散的能级系统)…… ∣S(t)⟩=∫∣x⟩⟨x∣S(t)⟩dx=∫∣p⟩⟨p∣S(t)⟩dp=∑n∣n⟩⟨n∣S(t)⟩=⋯\ket{S(t)}=\int\ket{x}\braket{x|S(t)}\text{d}x = \int\ket{p}\braket{p|S(t)}\text{d}p = \sum_n\ket{n}\braket{n|S(t)}=\cdots ∣S(t)⟩=∫∣x⟩⟨x∣S(t)⟩dx=∫∣p⟩⟨p∣S(t)⟩dp=n∑​∣n⟩⟨n∣S(t)⟩=⋯

2025/10/27
articleCard.readMore

Lesson 5 二阶线性常微分方程的幂级数解法 (一)

我们来说说作业里面的一个题: 求稳定解: ∂u∂t−κ∂2u∂x2=0u∣x=0=Acos⁡ωt ,u∣x→∞=0\begin{aligned} &\frac{\partial u}{\partial t}-\kappa\frac{\partial^2u}{\partial x^2}=0\\\\ &u|_{x=0}=A\cos\omega t\,,\quad u|_{x\to\infty}=0 \end{aligned} ​∂t∂u​−κ∂x2∂2u​=0u∣x=0​=Acosωt,u∣x→∞​=0​ 这个绝对不能分离变量,因为分离变量本质上是为本征值问题服务的,这里是无穷的边界、而且稳定解要求不能把无穷处的边界条件齐次化掉. 如果我们没有学过复变函数,可以假设: u=f(x)cos⁡ωt+g(x)sin⁡ωtu=f(x)\cos\omega t+g(x)\sin\omega t u=f(x)cosωt+g(x)sinωt (当然,我们推荐复变的方法,也就是 u=f(x)eiωtu=f(x)e^{\text{i}\omega t}u=f(x)eiωt,只是最后应该取实部)

2025/10/24
articleCard.readMore

Lesson 6 Multi-variable Analysis

提示 Quizzes 给定信息 III、数据 DDD 和假说 HHH,则 Prior (先验):P(H∣I)P(H|I)P(H∣I) Likelihood (似然):P(D∣HI)P(D|HI)P(D∣HI) Posterior (后验):P(H∣DI)P(H|DI)P(H∣DI) Evidence (证据):P(D∣I)P(D|I)P(D∣I) Bayes 公式: P(H∣DI)=P(D∣HI)P(H∣I)P(D∣I)P(H|DI)=\frac{P(D|HI)P(H|I)}{P(D|I)} P(H∣DI)=P(D∣I)P(D∣HI)P(H∣I)​ 我们用什么量来判断假说成立的可能性大小? 后验比 (Posterior (log -) odds) 做二元的假设检验 (HHH vs Hˉ\bar{H}Hˉ),写出后验比: OH=P(H∣DI)P(Hˉ∣DI)=P(D∣HI)P(H∣I)P(D∣HˉI)P(Hˉ∣I)O_H=\frac{P(H|DI)}{P(\bar{H}|DI)} = \frac{P(D|HI)P(H|I)}{P(D|\bar{H}I)P(\bar{H}|I)} OH​=P(Hˉ∣DI)P(H∣DI)​=P(D∣HˉI)P(Hˉ∣I)P(D∣HI)P(H∣I)​ 怎么通过后验比的值来判断假说的可信度? OH≫1O_H\gg1OH​≫1,prefer HHH;OH≪1O_H\ll1OH​≪1,prefer Hˉ\bar{H}Hˉ;如果 OH∼1O_H\sim1OH​∼1,那么我们无法区分这两种假说. 我们得到了可信的、但是很不合理的数据,和我们已有的所有假说都不符合,那么我们下一步最好怎么做? 考虑引入一个新的假设,这个假设的先验很低但是能够解释我们的现象. 这是科研最难的部分之一 —— 提出新的模型和假说. 什么时候一个「死假设」会「复活」? 当数据比较极端但是支持死假设时. 重复进行很多次实验,那么某一个特定假设的正确可能性会随着实验次数单调变化 不止一个假说时,不一定单调. 冗余参数是什么? 一个连续化的参数 fff (比如正面硬币概率),我们并不觉得它很重要,只需要它在一个区间中,所以可以积分掉这个参数 (也就是边缘化,marginalization) 数据一定会让观点趋同吗? 错. 同样的数据可以支持相反的观点. 给定模型 MMM 和模型的参数 θ\thetaθ,则 Bayes 公式中的 MMM 和 III 可以视为一体的: P(θ∣DMI)=P(D∣θMI)P(θ∣MI)P(D∣MI)P(\theta|DMI)=\frac{P(D|\theta MI)P(\theta|MI)}{P(D|MI)} P(θ∣DMI)=P(D∣MI)P(D∣θMI)P(θ∣MI)​ 证据是什么? E(M)=P(D∣MI)=∫P(D∣θMI)P(θ∣MI)dθE(M)=P(D|MI)=\int P(D|\theta MI)P(\theta|MI)\text{d}\theta E(M)=P(D∣MI)=∫P(D∣θMI)P(θ∣MI)dθ Bayes 因子是什么? Qij=E(Mi)E(Mj)Q_{ij}=\frac{E(M_i)}{E(M_j)} Qij​=E(Mj​)E(Mi​)​ 这个会乘在我们之前的后验比上面. 什么是 Occam's razor? 在两个模型拟合数据的效果差不多时,我们倾向于选择参数更少、参数跑动空间更小、更简单的理论. 相关性 ≠\neq= 因果性. Multi-parameter Posterior 前面 1/31/31/3 学期一直在抛硬币,现在我们终于来研究天文问题了. 我们来研究光谱,用 Gauss 分布来描述一个连续的谱: ϕ(λ)=αexp⁡[−(λ−λ0)22w2]+β\phi(\lambda) = \alpha\exp\left[-\frac{(\lambda-\lambda_0)^2}{2w^2}\right]+\beta ϕ(λ)=αexp[−2w2(λ−λ0​)2​]+β 模拟: import numpy as np def expected_counts(x, A=50, w=5, B=50, lam0=0): """Compute expected photon counts at channels x Note that A and w may be ndarrays for posterior sampling""" n = [A * np.exp(-(xi - lam0)**2 / (2 * w**2)) + B for xi in x] return np.array(n) def sim_spec(A=50, w=5, B=50, lam0=0, m=1, M=51, seed=42): """Simulate a spectrum with given parameters""" x = (np.arange(M) - M // 2) * m # channel centers nexp = expected_counts(x, A=A, w=w, B=B, lam0=lam0) rng = np.random.default_rng(seed) num = rng.poisson(nexp) # simulated counts return x, num (β\betaβ 是一个噪声) 光子量为 mtϕ(λ)mt\phi(\lambda)mtϕ(λ). 我们期望,将这个探测到的连续数据离散化,得到分立的谱线. 之前我们说过,光子的分布符合 Poisson 分布: P(ni≡n(xi)∣Ni)=Ninie−Nini!P(n_i\equiv n(x_i)|N_i)=\frac{N_i^{n_i}e^{-N_i}}{n_i!} P(ni​≡n(xi​)∣Ni​)=ni​!Nini​​e−Ni​​ 如果 αmt=βmt=50\alpha mt=\beta mt=50αmt=βmt=50,信噪比是多少? 信号 S=50S=50S=50,这是显然的;噪声和信号都符合 Poisson 分布,它们的叠加意味着平均值相加,而噪声是 μ\sqrt{\mu}μ ​ (平均值的平方根),所以噪声 N=50+50=10N=\sqrt{50+50}=10N=50+50 ​=10,信噪比是 555,这在天文上已经很难得了. 考虑 λ0\lambda_0λ0​ 和 B=mtβB=mt\betaB=mtβ 已经给出了,未知量只有 AAA 和 www. 由 Bayes 定理,得到 p(A,w∣ni,I)∝p(ni∣A,w,I)p(A,w∣I)p(A,w|n_i,I)\propto p(n_i|A,w,I)p(A,w|I) p(A,w∣ni​,I)∝p(ni​∣A,w,I)p(A,w∣I) 假设每次的数据都是独立的, p({ni}i=1M∣A,w,I)=∏i=1Mp(ni∣A,w,I)=∏i=1MNinie−Nini!p(\{n_i\}^M_{i=1}|A,w,I)=\prod_{i=1}^Mp(n_i|A,w,I)=\prod_{i=1}^M\frac{N_i^{n_i}e^{-N_i}}{n_i!} p({ni​}i=1M​∣A,w,I)=i=1∏M​p(ni​∣A,w,I)=i=1∏M​ni​!Nini​​e−Ni​​ 这里的乘积太大了,考虑取对数,得到 ln⁡p(A,w∣{ni},I)=ln⁡p({ni}∣A,w,I)+ln⁡p(A,w∣I)=∑i=1M(niln⁡Ni−Ni)−ln⁡(Aw)+const.\begin{aligned} \ln p(A,w|\{n_i\},I)&=\ln p(\{n_i\}|A,w,I)+\ln p(A,w|I)\\\\ &=\sum_{i=1}^M(n_i\ln N_i-N_i)-\ln(Aw)+\text{const.} \end{aligned} lnp(A,w∣{ni​},I)​=lnp({ni​}∣A,w,I)+lnp(A,w∣I)=i=1∑M​(ni​lnNi​−Ni​)−ln(Aw)+const.​ 取 ln⁡\lnln 之后,因为数据已经给定,所以 nin_ini​ 的那些项实际上是常数,我们的计算被简化了很多. 最终我们将得到一个 AAA - www 平面上的等高线图 (等 σ\sigmaσ 线图):对于二维分布,1σ1\sigma1σ 对应 39.34%39.34\%39.34%、2σ2\sigma2σ 对应 86.47%86.47\%86.47%、3σ3\sigma3σ 对应 98.89%98.89\%98.89%. 但是我们觉得给出一个图片并不是足够说明问题,所以我们需要投影到两个轴上面,这又是我们提到过的边缘化 (marginalization):这里的冗余参数是我们不关心的那一个,需要将它积分掉. 投影之后按照一维的方式来估测我们的真值、误差等等. 我们的工作做完了吗? 并没有! 我们没办法从两个一维的分布把之前的二维分布重建出来了,所谓的重建只能得到一个很「正」的椭圆. Correlation & Degeneracy (关联和重建) 高维的方差定义为: C(θ)=⟨(θ−⟨θ⟩)(θ−⟨θ⟩)T⟩=(σ12ρ12σ1σ2⋯ρ1nσ1σn⋮⋱⋱⋮σnσ1ρn2σnσ2⋯ρnnσn2)C(\theta)=\braket{(\theta-\braket{\theta})(\theta-\braket{\theta})^T}=\begin{pmatrix} \sigma_1^2&\rho_{12}\sigma_1\sigma_2&\cdots&\rho_{1n}\sigma_1\sigma_n\\ \vdots&\ddots&\ddots&\vdots\\ \sigma_n\sigma_1&\rho_{n2}\sigma_n\sigma_2&\cdots&\rho_{nn}\sigma_n^2 \end{pmatrix} C(θ)=⟨(θ−⟨θ⟩)(θ−⟨θ⟩)T⟩= ​σ12​⋮σn​σ1​​ρ12​σ1​σ2​⋱ρn2​σn​σ2​​⋯⋱⋯​ρ1n​σ1​σn​⋮ρnn​σn2​​ ​ 这里的非对角元定义为协方差,矩阵称为协方差矩阵. 在这个问题中,我们的协方差是 ⟨(A−⟨A⟩)(w−⟨w⟩)⟩\braket{(A-\braket{A})(w-\braket{w})} ⟨(A−⟨A⟩)(w−⟨w⟩)⟩ 当然,协方差矩阵的计算只需要一行 numpy 的代码罢了. 用协方差矩阵重建这个二维分布时,我们发现每个单维度的分布并无变化 (只由对角元决定),而重建出来的二维分布不再是之前的一个椭圆,而是很接近我们最开始测量到的数据. 当我们重建出这个二维分布时,我们发现,AAA 增大时 www 减小,只有这样的模型才能够满足我们的这个关系. 回到物理的情景,实际上意味着当光谱的峰值提升,光谱的宽度应该降低,这是由光子数守恒 (面积守恒) 所决定的. 通过观察协方差矩阵来判断数据的关联模式:对角元决定了长轴 / 短轴的宽度 (椭圆的胖瘦),非对角元的正负性决定了相关关系是正相关还是负相关,非对角元越大、相关性越强. 如果把协方差矩阵 (Covariance Matrix) 归一化,得到 Correlation Matrix: R=(1ρ12⋯ρ1nρ211⋯ρ2n⋮⋮⋱⋮ρn1ρ2n⋯1)\bold{R}=\begin{pmatrix} 1&\rho_{12}&\cdots&\rho_{1n}\\ \rho_{21}&1&\cdots&\rho_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ \rho_{n1}&\rho_{2n}&\cdots&1 \end{pmatrix} R= ​1ρ21​⋮ρn1​​ρ12​1⋮ρ2n​​⋯⋯⋱⋯​ρ1n​ρ2n​⋮1​ ​ 这个矩阵的矩阵元 ∈[−1,1]\in[-1,1]∈[−1,1]. 假设两个参数 θi\theta_iθi​ 和 θj\theta_jθj​ 不相关,则它们的 ρij=0\rho_{ij}=0ρij​=0,协方差: ⟨(θi−⟨θi⟩)(θj−⟨θj⟩)⟩=⟨θiθj⟩−⟨θi⟩⟨θj⟩=0\braket{(\theta_i-\braket{\theta_i})(\theta_j-\braket{\theta_j})}=\braket{\theta_i\theta_j}-\braket{\theta_i}\braket{\theta_j}=0 ⟨(θi​−⟨θi​⟩)(θj​−⟨θj​⟩)⟩=⟨θi​θj​⟩−⟨θi​⟩⟨θj​⟩=0 这和我们之前说到的独立事件的式子很像. 那么我们看看下面的论断: 独立事件一定不相关 不相关事件一定独立 完美独立的事件的相关系数一定是 ±1\pm1±1 如果两个变量都和第三个变量强相关,那么它们之间一定相关 首先对于 3.,我们课程只考虑线性的相关性,所以是对的;对于 4.,我们能够构造出一个非常扁的圆柱,它在某个平面上投影是一个圆 (完全不相关),而在另外两个平面上投影都是直线 (完全相关). 所以实际上只有第一个论断是正确的,因为「独立」是一个极强的条件. 在上面的问题中,我们还能够对单个变量进行估计:先猜测一个 AAA 值然后估计 www. 我们发现,猜错 AAA 会导致 www 出现比较大的偏差. 如果我们强行固定 AAA (自由参数),会得到更小的不确定度,也会出现更大的 bias —— 这是不好的,因为我们的数据应该忠实地反应我们对现实的了解程度,不能有意地加强先验来获得更小的不确定度,何况这样可能产生更大的偏差. Derived Parameters 假设我们的 www 来源于恒星的 Doppler 效应,恒星的速度展开正比于 www: σv=10w\sigma_v=10w σv​=10w 最无脑的思路是,把 www 换成 σv\sigma_vσv​,在之前的计算中完全用 σv\sigma_vσv​ 来操作. 但是这样有点太麻烦,我们可以用上面的关系来直接确定两种分布之间的关系,在这里是形状相同的两个分布. 但是如果是 f=Aw/10f=Aw/10f=Aw/10 的分布呢? 用 Jacobian: ∣∇g∣=∣w/10A/10010∣=w|\nabla g|=\begin{vmatrix} w/10&A/10\\0&10 \end{vmatrix}=w ∣∇g∣= ​w/100​A/1010​ ​=w 则 114514 p(f,σv∣D,I)=p(A,w∣D,I)⋅p(f,\sigma_v|D,I)=p(A,w|D,I)\cdot p(f,σv​∣D,I)=p(A,w∣D,I)⋅ 考虑 y⃗\vec{y}y ​ 是由 AAA 和 www 两个分量构成的矢量,换成另外两个,那么得到了所谓误差传递公式: σz=[∂y∂A∂y∂w]−1[σA2σAσwσwσAσw2][∂y∂A∂y∂w]\sigma_z=\begin{bmatrix} \frac{\partial y}{\partial A}\\\frac{\partial y}{\partial w} \end{bmatrix}^{-1}\begin{bmatrix} \sigma_A^2&\sigma_A\sigma_w\\ \sigma_w\sigma_A&\sigma_w^2 \end{bmatrix}\begin{bmatrix} \frac{\partial y}{\partial A}\\\frac{\partial y}{\partial w} \end{bmatrix} σz​=[∂A∂y​∂w∂y​​]−1[σA2​σw​σA​​σA​σw​σw2​​][∂A∂y​∂w∂y​​] 当然我们高中竞赛的时候不会考虑这些交叉项. Exercise 固定 AAA,做 BBB 和 www 的统计. 独立的数据产生的结果可以叠加: p(f,σv∣D1D2I)=p(f,σv∣D1I)⋅p(f,σv∣D2I)p(f,\sigma_v|D_1D_2I)=p(f,\sigma_v|D_1I)\cdot p(f,\sigma_v|D_2I) p(f,σv​∣D1​D2​I)=p(f,σv​∣D1​I)⋅p(f,σv​∣D2​I) 原则上这样的叠加会让二维图上整个区域变小,但是可能会出现下面的情况: 这来源于对理论的解读不同,也可能是系统误差.

2025/10/23
articleCard.readMore

Lesson 11 静磁场

φ(x)=14πεQR+14πεp⃗⋅x⃗R3+14πεD↠:x⃗x⃗2R5+⋯\varphi(x) = \frac{1}{4\pi\varepsilon}\frac{Q}{R}+\frac{1}{4\pi\varepsilon}\frac{\vec{p}\cdot\vec{x}}{R^3}+\frac{1}{4\pi\varepsilon}\frac{\overset\twoheadrightarrow{D}:\vec{x}\vec{x}}{2R^5}+\cdots φ(x)=4πε1​RQ​+4πε1​R3p ​⋅x ​+4πε1​2R5D↠:x x ​+⋯ 电荷体系在外场中的能量:能量为 W=∫Vρ(x⃗)φe(x⃗)dτW=\int_V\rho(\vec{x})\varphi_e(\vec{x})\text{d}\tau W=∫V​ρ(x )φe​(x )dτ 如果电荷体系 ρ\rhoρ 仅仅分布在外场中的一个小区域,那么这里的 φe\varphi_eφe​ 也可以利用多极展开,得到 φe(x⃗)=φe(0)+(x⃗⋅∇)φe(0)+12!(x⃗x⃗:∇∇)φe(0)+⋯\varphi_e(\vec{x})=\varphi_e(0)+(\vec{x}\cdot\nabla)\varphi_e(0)+\frac{1}{2!}(\vec{x}\vec{x}:\nabla\nabla)\varphi_e(0)+\cdots φe​(x )=φe​(0)+(x ⋅∇)φe​(0)+2!1​(x x :∇∇)φe​(0)+⋯ 能量展开为 W=W(0)+W(1)+W(2)+⋯W = W^{(0)}+W^{(1)}+W^{(2)}+\cdots W=W(0)+W(1)+W(2)+⋯ 展开式的第三项: W(2)=∫Vρ(x⃗)⋅12!(x⃗x⃗:∇∇)φe(0)dτ=16D↠:∇∇φe(0)=−16D↠:∇E⃗e(0)W^{(2)} = \int_V\rho(\vec{x})\cdot\frac{1}{2!}(\vec{x}\vec{x}:\nabla\nabla)\varphi_e(0)\text{d}\tau=\frac{1}{6}\overset{\twoheadrightarrow}{D}:\nabla\nabla\varphi_e(0)=-\frac{1}{6}\overset{\twoheadrightarrow}{D}:\nabla\vec{E}_e(0) W(2)=∫V​ρ(x )⋅2!1​(x x :∇∇)φe​(0)dτ=61​D↠:∇∇φe​(0)=−61​D↠:∇E e​(0) 而我们已经熟知第二项是 −p⃗⋅E⃗-\vec{p}\cdot\vec{E}−p ​⋅E 的势能. 用虚功原理求电偶极子在外场中的受力: Δ(−p⃗⋅E⃗)Δx=−(p⃗⋅∇)E⃗\frac{\Delta(-\vec{p}\cdot\vec{E})}{\Delta x}=-(\vec{p}\cdot\nabla)\vec{E} ΔxΔ(−p ​⋅E )​=−(p ​⋅∇)E 这里的含义是,在均匀场中电偶极子不会受到合力,在不均匀的场中才可能有受力. 如果虚功原理做的是微小的角位移,则得到力矩为 Δ(−p⃗⋅E⃗)Δθ=M⃗⟹M⃗⋅δθ^=(δθ^×p⃗)⋅E⃗=(p⃗×E⃗)⋅δθ^⟹M⃗=p⃗×E⃗\frac{\Delta(-\vec{p}\cdot\vec{E})}{\Delta \theta}=\vec{M}\Longrightarrow\vec{M}\cdot\delta\hat{\theta}=(\delta\hat{\theta}\times\vec{p})\cdot\vec{E} = (\vec{p}\times\vec{E})\cdot\delta\hat{\theta}\Longrightarrow\vec{M}=\vec{p}\times\vec{E} ΔθΔ(−p ​⋅E )​=M ⟹M ⋅δθ^=(δθ^×p ​)⋅E =(p ​×E )⋅δθ^⟹M =p ​×E 静磁场 我们的要求是,电流的分布永远不随时间发生变化,也就是 ∇⋅j⃗=−∂ρ∂t=0\nabla\cdot\vec{j}=-\frac{\partial\rho}{\partial t}=0 ∇⋅j ​=−∂t∂ρ​=0 可以用矢势来确定磁场的分布 B⃗=∇×A⃗\vec{B}=\nabla\times\vec{A} B =∇×A 矢势具有很大的任意性,可以相差任意一个标量函数的梯度. 所以我们需要取特定规范条件来制约 AAA,这里我们先取 Coulomb 规范: ∇⋅A⃗=0\nabla\cdot\vec{A}=0 ∇⋅A =0 来证明一定能够找到这样的 AAA: 如果存在一个 AAA 使得 B⃗=∇×A⃗\vec{B}=\nabla\times\vec{A}B =∇×A 但是不满足 Coulomb 规范,则应该有 ∇⋅A⃗=u≠0\nabla\cdot\vec{A}=u\neq0 ∇⋅A =u=0 我们可取另一个解为 A⃗′=A⃗+∇ψ\vec{A}'=\vec{A}+\nabla\psi A ′=A +∇ψ 其中 ψ\psiψ 为 Poisson 方程 ∇2ψ=u\nabla^2\psi=u∇2ψ=u 的某个解,这时 A⃗′\vec{A}'A ′ 就满足规范条件.

2025/10/23
articleCard.readMore

Lesson 5 核物理与观测宇宙学

中高能核物理简介 —— 施舒哲 大家都认识的何教授就是这一个课题组的. 我们从元素周期表说起,在遥远的过去,人们猜想物质是由元素构成的,但是并没有什么检验手段,有些「玄学」的意味. 第一次工业革命后,我们有了更多的实验手段,那时 Avogadro 提出物质由分子构成,分子是保持化学成分的单元;Dalton 提出,分子可以分为原子,原子是化学反应的基本单元. 那时人们觉得这些就是最基本的粒子. Mendeleev 发现了元素周期表,他发现原子也具有一定的组成规律,各种原子的化学性质表现出来的规律揭示着它们也存在内部结构. 后来人们发现,原子由质子、中子和电子组成. 第二次工业革命后,人们能够建造大型的粒子对撞机,发现很多和电子、质子、中子相似的基本粒子,比如 μ\muμ 子、τ\tauτ 子等轻子;Σ+\Sigma_+Σ+​ 等重子 (约 100 个);π\piπ、KKK 等介子 (数百个). 我们能够用质量、奇异荷 (在粒子反应中的新的一种守恒荷)、电荷三种指标作为三角形来排布那些重子. 这样的规律同样揭示了重子存在内部结构,我们引入 quark,每个 quark 有 flavour 和电荷量,三个 quark 组成一个表中的重子. 但是我们并没有看到自由的 quark,理论家们提出的解释是,quark 禁闭在粒子内,quark 的另一个内禀自由度 —— 颜色 (类似自旋的某种属性),要求它们形成色单态,色多态的 quark 态是不存在的,它们互相排斥且能量发散. Quark 之间传递相互作用由胶子进行,胶子的作用被 Yang - Mills 场描述. 怎么验证? 深度非弹性碰撞 将两个原子核对撞,能量非常大,这对应一个很小的空间分辨率,能看到所谓的「部分子」. 相对论重离子对撞 形成 quark - gluon 等离子体. 相对论重离子碰撞中,我们只能探测到末态产生的那些粒子,而不能直接探测高温的等离子体. 因此需要理论预测某种等离子态的热力学性质,来推断末态各种粒子的产额: N∝(2J+1)∫d3p⃗em2+p2T±1N\propto(2J+1)\int\frac{\text{d}^3\vec{p}}{e^{\displaystyle{\frac{\sqrt{m^2+p^2}}{T}}}\pm1} N∝(2J+1)∫eTm2+p2 ​​±1d3p ​​ 相对论流体力学: ∂μTμν=0 ,Tμν=(ε+P+Π)uμuν−(P+Π)gμν+πμν\partial_\mu T^{\mu\nu}=0\,,\quad T^{\mu\nu}=(\varepsilon+P+\Pi)u^\mu u^\nu-(P+\Pi)g^{\mu\nu}+\pi^{\mu\nu} ∂μ​Tμν=0,Tμν=(ε+P+Π)uμuν−(P+Π)gμν+πμν 这里,ε\varepsilonε 和 PPP 都是热力学量,可以由第一性原理 QCD 计算得到;Π\PiΠ 是非平衡项,πμν\pi^{\mu\nu}πμν 是粘滞修正. Cosmology with Large-Scale Structures —— 赵成 又是这个图,我已经看他放了三遍了: 当我们观测星空,会发现星空绕着北极星旋转,所以东西方的古人提出了类似的地心学说. 当人们观测到行星退行,日心说又逐渐占了主导. 我们的认知取决于我们看到了什么,而不是我们比古人更加聪明. 大爆炸理论:光子和重子会在膨胀过程中脱耦,那时候的光子形成了 CMB.

2025/10/22
articleCard.readMore

Lesson 10 隧穿

11-03 期中考试. 对于势垒的 tunnelling,我们考虑入射波为 eikxe^{\text{i}kx}eikx,反射为 re−ikxre^{-\text{i}kx}re−ikx、透射为 teikxte^{\text{i}kx}teikx,在势垒中间的波函数是 e±κxe^{\pm\kappa x}e±κx. 一维 Schrödinger 方程: (−ℏ22m∂2∂x2+V0)ψ=ℏ2k22mψ\left(-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V_0\right)\psi=\frac{\hbar^2k^2}{2m}\psi (−2mℏ2​∂x2∂2​+V0​)ψ=2mℏ2k2​ψ 令 ℏ2κ22m=V0−ℏ2k22m\frac{\hbar^2\kappa^2}{2m}=V_0-\frac{\hbar^2k^2}{2m} 2mℏ2κ2​=V0​−2mℏ2k2​ 则得到势垒中间的波函数满足 ∂2∂x2ψ=κ2ψ\frac{\partial^2}{\partial x^2}\psi=\kappa^2\psi ∂x2∂2​ψ=κ2ψ 不过我们认为,粒子在进入经典不允许的区域之后,其波函数振幅应该越来越小,所以要求在势垒中的解必须是 ∝e−κx\propto e^{-\kappa x}∝e−κx 的. 我们可能会问:为什么一个势阱的散射态的透射率会有波动性的变化? 这是因为,势阱有点像 Fabry - Perot 干涉仪,在透射时其实是在内部不断相互反射,形成驻波时才能实现很好的透射或者反射,这像光学一样. Hamiltonian 的本征态可以表示所有的波函数: ψ(x)=∫ψkeikxdk\psi(x)=\int\psi_ke^{\text{i}kx}\text{d}k ψ(x)=∫ψk​eikxdk 散射态 + 势阱里面的一些束缚态,是完备的;而平面波叠加得到的这些态是超完备的,含有很多没有必要了解的态,比如更多的平面波态.

2025/10/22
articleCard.readMore

Lesson 5 高分子链

上节课我们把学到的平衡态统计用到了二态系统里面. 后面这门课所用到的语言可能会更加变成大家不太熟悉的一种,不管是物理系同学还是生物方向的同学,这是因为学术界正在向着复苏上世纪六十年代的一些表述的方向发展. 二态系统 接着来说一些二态系统没讲完的内容. Hopfield 提出的动态校验:在 DNA 的复制中加入一步不可逆反应,它连接的两个反应都是平衡的,这两个过程都因为自由能的差异会有一个错误概率. 但是因为这两个反应之间不能平衡,所以这两个错误概率是相乘的关系,错误概率以平方的形式被降低了. 如果这个不可逆反应换成可逆反应,那么整个过程都是平衡的,就没有这个级联的效果降低错误概率. 当然我们还并没有在微观上验证过这种机制的存在性,但是这个理论在数值上是可以和实验对得上的. 下一个例子是 hsp70 蛋白 (Heat Shock Protein),它的作用是找到错误折叠的蛋白,然后将它们剪切为正确的蛋白. 根据平衡态的观点,我们只要把这个蛋白和它的底物的亲和力做得很高就行了. 但是问题在于:亲和力太高我们就无法进行下一步反应了. 所以我们想要「控制磁铁的磁性」. hsp70 有四个可能态:HADPH_{\text{ADP}}HADP​、S⋅HADPS\cdot H_{\text{ADP}}S⋅HADP​、HATPH_{\text{ATP}}HATP​、S⋅HATPS\cdot H_{\text{ATP}}S⋅HATP​. 每绕着这个环路走一圈,就水解了一个 ATP 分子. 但是因为溶液中的 ATP 远远多于 ADP,所以这个反应并不是平衡的,而是会沿着某个方向一直进行. 通过不可逆的 S⋅HATP⟶S⋅HADPS\cdot H_{\text{ATP}}\longrightarrow S\cdot H_{\text{ADP}}S⋅HATP​⟶S⋅HADP​,结合和解离的两个过程被分开来,通过消耗 ATP 让整个反应获得了优势:反应在结合 SSS 和解离 SSS 的两个过程中的可能性都更高,整个反应都由 ATP 所驱动,HHH 和 SSS 之间的亲和力是可控的. 以上就是二态系统的全部内容. 高分子链 我们接下来要研究的是被称为高分子的那些物质,它们的分子具有很多很多的小单元,但是和固体不同,高分子不存在平移对称性,而是有可能出现各种形变. 我们首先提到的例子是细胞骨架和分子马达,细胞骨架由比较刚性的蛋白质结构形成,分子马达在其上运动,就像「高速公路」一样. 另外还有微管结构、真核细胞的纤毛等等. 从物理的角度来看,它们都有同样的特征:重复的单元、可变的结构. 极端地说,如果熵是主导,那么整个排布应当是一个随机行走; 另一个极端是能量主导,排布只能落在能量最低的点,这对应着结构固定的蛋白质; 当然还存在中间态. 考虑长链,每一个链节为矢量 l⃗i\vec{l}_il i​,最终的终点为 r⃗\vec{r}r ,则 r⃗⋅r⃗=(∑i=1∞l⃗i)2\vec{r}\cdot\vec{r}=\left(\sum_{i=1}^\infty\vec{l}_i\right)^2 r ⋅r =(i=1∑∞​l i​)2 如果链节之间完全无关,则 ⟨R⟩=0 ,⟨R2⟩=Na2\braket{R}=0\,,\quad\braket{R^2}=Na^2 ⟨R⟩=0,⟨R2⟩=Na2 (aaa 是每个链节 l⃗\vec{l}l 的长度 ∣l⃗∣|\vec{l}|∣l ∣) 提示 稍微想一下,会发现这就是正态分布;另外,这也是一个 Brown 运动,和 Einstein - Smoluchowski 方程给出的是一致的. 衰减的幂律:⟨R2⟩∼N−α\sqrt{\braket{R^2}}\sim N^{-\alpha}⟨R2⟩ ​∼N−α α=1/2\alpha=1/2α=1/2 时这是完全无关的分布,根据大数定理来演化; α=1/3\alpha=1/3α=1/3 是球状的; …… 但是对于 DNA 来说,碱基和碱基之间有强烈的关联,所以它们不是独立分布;但是前面 500 个和后面 500 个的关联很弱,也就是说是否独立分布和问题的 scale 有关. 在受力下,长链的劲度可以通过能量来计算,得到 k=3kBTNa2k=\frac{3k_BT}{Na^2} k=Na23kB​T​ 长度变为 ⟨L⟩=Natanh⁡fakBT\braket{L}=Na\tanh\frac{fa}{k_BT} ⟨L⟩=NatanhkB​Tfa​

2025/10/21
articleCard.readMore

Cosmic Baryons

The Composition of the Universe 宇宙由暗物质、暗能量和重子物质组成. 我们不能只研究暗物质和暗能量,实际上我们能够观测到的大多数都是重子物质,我们需要对它们有足够的了解. Most Baryons are still in gas phase in the local Universe, but the gas is not forming stars. 按照时间,星系中的气体物质占比越来越小,但是气体物质一直都是占比最高的物质状态. 虽然我们观测到 H\text{H}H 等元素的质量密度占比减少,但是我们的星体密度也在降低,所以这些气体并不是因为形成星体而减少. Q1:Why does gas stop forming stars? 不同的星系类型: Spiral Galaxies:盘状的星系,有旋臂,富有气体和尘埃. Elliptical Galaxies:椭圆星系,含有比较古老的星体,气体比较少. Irregular Galaxies:混沌的形状,富有气体和尘埃,一般是正在经历星体的形成. Lenticular Galaxies:没有大型的旋臂,但是也是盘状的,只有少部分形成星体的气体. Peculiar Galaxies:奇怪的形状和拓扑,一般是有复杂的引力作用或者是两个星系碰撞形成. Q2:What drives the diversity of galaxies? 在大尺度上,星体的质量曲线和我们所预期的均匀分布不一样,而是在两端都有一个「feedback」现象. 另外,我们找到大型螺旋星系中气体出现堆积现象 (accretion). feedback 和 accretion 效应给出了上面两个问题的一种可能答案,但是也产生了第三个疑问,Q3:How does gas shape galaxy evolution? 一开始气体是球形聚集的,但是在引力作用下气体球逐渐收缩、角动量占据主导作用,将球形逐渐压缩为盘状,同时引力势能在这个过程中逐渐丢失,最后得到堆积在中心盘面上的大量气体、密度比之前高很多. 在星系演化过程中,气体不仅合成了星体,同时也是黑洞生长的重要燃料. 星体也在气体的循环过程中起到 feedback 作用. 老年的星体产生超新星爆炸等,将气体交还给星系;大型的爆炸给出一个巨大的球状气体晕,使得气体的分布回到早期星系的状态. 大型黑洞的作用更为强烈,它们的喷流可以给出很大的动能,使得气体获得能够逃出暗物质晕的速度,逃逸到宇宙空间. 上面三个问题的回答: Q1:气体要形成星体,我们需要引力、需要 collapse. 但是黑洞喷流、超新星爆炸,很多因素在阻碍气体的压缩. Q2:初始条件不同、形成过程中可能受到撞击等等,很多时候我们很难得到相同类型的星系. Q3:就像我们上面说的,「宇宙生态系统」中需要气体来进行循环. 但是我们现在遇到的问题是,星系正在丢失它们的重子. 这个问题和我们之前的三个 open question 是相关的:实际上并没有重子物质消失,而是被抛射到了我们无法观测的地方. Observations of Multiphase Diffuse Gas 我们在实际的观测中,需要用不同的方式来得到不同 phase 气体的信息. 虽然现在观测的误差比较大,但是我们还是获得了不少有用的信息. Cool Neutral Gas: 我们使用大型的射电望远镜来观测冷原子气体,比如著名的天眼 (FAST). 这里的探测精度取决于著名的 Rayleigh 判据,正比于 λ/D\lambda / Dλ/D. H I\text{H I}H I (电离氢原子,也就是质子) 可以作为一个 galaxy and CGM interface 的追踪方式. 离子气体和冷原子气体有比较强的辐射,我们也可以使用无线电阵列来进行探测,实际上 FAST 周围也将要建造很多小型的射电望远镜. 对于冷离子气体,可以通过光谱来检测;另一个方式是我们所说的 Integral Field Spectrograph in Optical (集成视场摄谱仪),它通过将画面分割、分别采集光谱、最后积分合成的方式得到比较精确的图像. hot gas 会产生 X-ray,我们能够用这种方式探测温度较高的气体.

2025/10/21
articleCard.readMore

Lesson 10 多极展开

对于 Coulomb 特解做展开: φ(x)=∫Cρ(x′)4πε∣x′−x∣d3x′\varphi(x)=\int_C\frac{\rho(x')}{4\pi\varepsilon|x'-x|}\text{d}^3x' φ(x)=∫C​4πε∣x′−x∣ρ(x′)​d3x′ 展开考虑的是 ∣x′∣/∣x∣|x'|/|x|∣x′∣/∣x∣ 为小量. 令 r′=∣x⃗−x⃗′∣r'=|\vec{x}-\vec{x}'|r′=∣x −x ′∣,固定 xxx (场点) 不变,把 x′x'x′ 在原点附近展开,则 1r=1r∣x⃗′=0+[x′∂∂x′(1r)∣x⃗′=0+y′∂∂y′(1r)∣x⃗′=0+z′∂∂z′(1r)∣z⃗′=0]+⋯=rx⃗′=0=R1R+(x⃗′⋅∇)1R+12x⃗′x⃗′:∇∇1R+⋯\begin{aligned} \frac{1}{r}&=\left.\frac{1}{r}\right|_{\vec{x}'=0}+\left[x'\left.\frac{\partial}{\partial x'}\left(\frac{1}{r}\right)\right|_{\vec{x}'=0}+y'\left.\frac{\partial}{\partial y'}\left(\frac{1}{r}\right)\right|_{\vec{x}'=0}+z'\left.\frac{\partial}{\partial z'}\left(\frac{1}{r}\right)\right|_{\vec{z}'=0}\right]+\cdots\\\\ &\overset{r_{\vec{x}'=0}=R}{=}\frac{1}{R}+(\vec{x}'\cdot\nabla)\frac{1}{R}+\frac{1}{2}\vec{x}'\vec{x}':\nabla\nabla\frac{1}{R}+\cdots \end{aligned} r1​​=r1​ ​x ′=0​+[x′∂x′∂​(r1​) ​x ′=0​+y′∂y′∂​(r1​) ​x ′=0​+z′∂z′∂​(r1​) ​z ′=0​]+⋯=rx ′=0​=RR1​+(x ′⋅∇)R1​+21​x ′x ′:∇∇R1​+⋯​ 偶极项: φ=14πεp⃗⋅x⃗R3\varphi = \frac{1}{4\pi\varepsilon}\frac{\vec{p}\cdot\vec{x}}{R^3} φ=4πε1​R3p ​⋅x ​ 四极项: φ=q4πε(x⃗0′x⃗1′+x⃗1′x⃗0′)(3x⃗x⃗−R2I)2R5\varphi=\frac{q}{4\pi\varepsilon}\frac{(\vec{x}_0'\vec{x}_1'+\vec{x}_1'\vec{x}_0')(3\vec{x}\vec{x}-R^2\bold{I})}{2R^5} φ=4πεq​2R5(x 0′​x 1′​+x 1′​x 0′​)(3x x −R2I)​ 这是双偶极子共线对顶的这种情况的领头阶,实际上也可以用四电荷方框的电荷分布来计算领头阶. 如果定义四极矩 D=∑m,nqnx⃗nx⃗mD = \sum_{m,n}q_{n}\vec{x}_n\vec{x}_mD=∑m,n​qn​x n​x m​,可以改写四极项. 对于连续电荷分布,有 φ=14πε∫V′ρ(x⃗′)[1R−x⃗′⋅∇1R+12!x⃗x⃗:∇∇1R+⋯ ]dτ′\varphi=\frac{1}{4\pi\varepsilon}\int_{V'}\rho(\vec{x}')\left[\frac{1}{R}-\vec{x}'\cdot\nabla\frac{1}{R}+\frac{1}{2!}\vec{x}\vec{x}:\nabla\nabla\frac{1}{R}+\cdots\right]\text{d}\tau' φ=4πε1​∫V′​ρ(x ′)[R1​−x ′⋅∇R1​+2!1​x x :∇∇R1​+⋯]dτ′ 令: Q=∫V′ρ(x⃗′)dτ′ ,p⃗=∫V′ρ(x⃗′)x⃗′dτ′ ,D=∫V′3x⃗′x⃗′ρ(x⃗′)dτ′Q=\int_{V'}\rho(\vec{x}')\text{d}\tau'\,,\quad\vec{p}=\int_{V'}\rho(\vec{x}')\vec{x}'\text{d}\tau'\,,\quad\bold{D}=\int_{V'}3\vec{x}'\vec{x}'\rho(\vec{x}')\text{d}\tau' Q=∫V′​ρ(x ′)dτ′,p ​=∫V′​ρ(x ′)x ′dτ′,D=∫V′​3x ′x ′ρ(x ′)dτ′ 上式改写为 φ=14πε∫[QR−p⃗⋅∇1R+16D:∇∇1R+⋯ ]dτ′\varphi=\frac{1}{4\pi\varepsilon}\int\left[\frac{Q}{R}-\vec{p}\cdot\nabla\frac{1}{R}+\frac{1}{6}\bold{D}:\nabla\nabla\frac{1}{R}+\cdots\right]\text{d}\tau' φ=4πε1​∫[RQ​−p ​⋅∇R1​+61​D:∇∇R1​+⋯]dτ′ 一个小区域内连续分布的电荷在远处激发的电场等于一系列多极子在远处激发的场的叠加.

2025/10/21
articleCard.readMore

Lesson 9 Hilbert 空间

这节课讲完要考期中考试了. 期中考试的主要内容都是我们布置的第二章作业. Hilbert 空间 我们现在学的量子力学研究的都是纯态,可以通过一个波函数来描述这个系统的物理. 我们定义: ∣α⟩=(α1α2⋮αn) ,∣β⟩=(β1β2⋮βn)\ket{\alpha}=\begin{pmatrix} \alpha_1\\\alpha_2\\\vdots\\\alpha_n \end{pmatrix}\,,\quad\ket{\beta}=\begin{pmatrix} \beta_1\\\beta_2\\\vdots\\\beta_n \end{pmatrix} ∣α⟩= ​α1​α2​⋮αn​​ ​,∣β⟩= ​β1​β2​⋮βn​​ ​ 定义内积为 ⟨α∣β⟩=αiβi\braket{\alpha|\beta} = \alpha_i\beta_i⟨α∣β⟩=αi​βi​. 平方可积的函数 (Square-Integrate) 生活于 Hilbert 空间里. /Example/ 对于函数 f(x)=xνf(x)=x^\nuf(x)=xν,在 0∼10\sim10∼1 的区间上平方可积: ∫01∣xν∣2dx=12ν+1\int_0^1|x^\nu|^2\text{d}x=\frac{1}{2\nu+1} ∫01​∣xν∣2dx=2ν+11​ 当然要求 ν>1/2\nu>1/2ν>1/2. Observables 什么样的量被认为是可观测的? Hermite 算符:能够作用在两边,也就是 ⟨f∣Q^f⟩=⟨Q^f∣f⟩\braket{f|\hat{Q}f}=\braket{\hat{Q}f|f}⟨f∣Q^​f⟩=⟨Q^​f∣f⟩. 我们说可观测量能够被 Hermite 算符所表示. Determinant State: σ2=⟨(Q^−⟨Q^⟩)2⟩=⟨Q^2⟩+⟨Q^⟩2−2⟨Q^⟩2=⟨Q^2⟩−⟨Q^⟩2\sigma^2 = \braket{(\hat{Q}-\braket{\hat{Q}})^2}=\braket{\hat{Q}^2}+\braket{\hat{Q}}^2-2\braket{\hat{Q}}^2=\braket{\hat{Q}^2}-\braket{\hat{Q}}^2 σ2=⟨(Q^​−⟨Q^​⟩)2⟩=⟨Q^​2⟩+⟨Q^​⟩2−2⟨Q^​⟩2=⟨Q^​2⟩−⟨Q^​⟩2 是被测量的可观测量的本征态,这个被测量量不存在量子涨落. 简并:多个态有同一个本征值.

2025/10/21
articleCard.readMore

Lesson 4 分离变量法 (三)

两端固定弦的受迫振动 /Example/ 求解定解问题 ∇2u=xyu∣x=0=u∣x=a=0u∣y=0=ϕ(x) ,u∣y=b=ψ(x)\begin{aligned} &\nabla^2u=xy\\\\ &u|_{x=0}=u|_{x=a}=0\\\\ &u|_{y=0}=\phi(x)\,,\quad u|_{y=b}=\psi(x) \end{aligned} ​∇2u=xyu∣x=0​=u∣x=a​=0u∣y=0​=ϕ(x),u∣y=b​=ψ(x)​

2025/10/17
articleCard.readMore

Lesson 5 Model Selection

提示 Quizzes 概率论的乘法规则是什么? P(AB∣I)=P(A∣BI)P(B∣I)=P(B∣AI)P(A∣I)P(AB|I)=P(A|BI)P(B|I)=P(B|AI)P(A|I) P(AB∣I)=P(A∣BI)P(B∣I)=P(B∣AI)P(A∣I) (我们再次再次回顾这个规则) 概率论的加法规则是什么? P(A∣I)+P(Aˉ∣I)=1P(A|I)+P(\bar{A}|I)=1 P(A∣I)+P(Aˉ∣I)=1 加法规则的推广? P(A+B∣I)=P(A∣I)+P(B∣I)−P(AB∣I)P(A+B|I)=P(A|I)+P(B|I)-P(AB|I) P(A+B∣I)=P(A∣I)+P(B∣I)−P(AB∣I) 如果 AAA 和 BBB 互斥,最后一项就没有了. 给出表达式: Prior (先验)? P(H∣I)P(H|I) P(H∣I) Likelihood (似然)? P(D∣HI)P(D|HI) P(D∣HI) Posterior (后验)? P(H∣DI)P(H|DI) P(H∣DI) Evidence (证据)? P(D∣I)P(D|I) P(D∣I) Bayes' Theorem? P(H∣DI)=P(D∣HI)P(H∣I)P(D∣I)P(H|DI) = \frac{P(D|HI)P(H|I)}{P(D|I)} P(H∣DI)=P(D∣I)P(D∣HI)P(H∣I)​ 在一个合理的先验下,更多的数据对后验造成什么影响? 后验更接近真相了. 后验变宽,包含了真值. 后验的峰值更窄,接近真值. 取决于先验,无法分辨. 答案应该选 a. 和 c.,因为后验应该是变窄的、向真值集中,而且数据越多我们了解的程度一定更深;但是如果真值有两个峰值,c. 也有可能是错的. 有哪些估计真值的方式?这几种方法分别如何估计误差? 我们可以用均值、中位数或者峰值来估计. 均值估计的误差是用标准差来估计的. 中位数估计的误差是用百分位数估计的. 峰值估计的误差可以用「作水平线划定 68%68\%68% 的方法」估计. 但是峰值估计没有其他两个那么好的性质. 什么方法能够最好地呈现一个复杂的后验? 直接上图! 怎么算一个后验 p(θ)p(\theta)p(θ) 的均值和标准差? μ=∫θp(θ)dθ ,σ=∫(θ−μ)2p(θ)dθ\mu=\int\theta p(\theta)\text{d}\theta\,,\quad\sigma=\sqrt{\int(\theta-\mu)^2p(\theta)\text{d}\theta} μ=∫θp(θ)dθ,σ=∫(θ−μ)2p(θ)dθ ​ 找到下述表述对应的概念: 能够最小化误差平方的估计方式:均值估计. 能够最小化绝对误差的估计方式:中值估计. 能够最大化后验密度的估计方式:MAP (Maximum a Posteriori),峰值估计. 重参数化不影响结果的估计方式:中值估计 (任意百分位数估计). 判断题: 三种估计在对称且单峰的先验下,得到的真值等价. 标准差 = 16 / 84 百分位数的对称且单峰的先验,均值估计和中值估计等价. (×\times×) ... 一个长尾的后验,排序三种估计值. MAP<median<mean\text{MAP}<\text{median}<\text{mean} MAP<median<mean 对于独立的数据点 D={di}D=\{d_i\}D={di​},给定模型 HHH 和背景知识 III,似然怎么写? P(D∣HI)=∏iP(di∣H,I)P(D|HI) = \prod_i P(d_i|H,I) P(D∣HI)=i∏​P(di​∣H,I) 判断:如果样本分布没有有限的均值和标准差,那么统计不可做. 并非,因为在真值处的概率仍然可观. 这节课我们说模型选择,这是比较难而且「坑」很多的一个部分. 我们在上节课学会了数学公式之后,我们这节课回到自己的常识,用合适的数学工具处理数据并验证是否符合自己的常识. 我们最经常处理的问题是,哪个数学模型 (一次函数、二次函数还是指数函数) 更好地拟合某一串数据点? 假设检验 从 Bayes' Theorem 开始: P(H∣DI)=P(D∣HI)P(H∣I)P(D∣I)P(H|DI)=\frac{P(D|HI)P(H|I)}{P(D|I)} P(H∣DI)=P(D∣I)P(D∣HI)P(H∣I)​ 如果我们有两种互补的假设,HHH and Hˉ\bar{H}Hˉ,Bayes 定理告诉我们, P(H∣DI)=P(D∣HI)P(H∣I)P(D∣I) ,P(Hˉ∣DI)=P(D∣HˉI)P(Hˉ∣I)P(D∣I)P(H|DI)=\frac{P(D|HI)P(H|I)}{P(D|I)}\,,\quad P(\bar{H}|DI)=\frac{P(D|\bar{H}I)P(\bar{H}|I)}{P(D|I)} P(H∣DI)=P(D∣I)P(D∣HI)P(H∣I)​,P(Hˉ∣DI)=P(D∣I)P(D∣HˉI)P(Hˉ∣I)​ 如果把这两者做比,应当得到 OH≡P(H∣I)P(Hˉ∣I)=P(H∣I)1−P(H∣I) ,OHˉ=OH−1O_{H}\equiv\frac{P(H|I)}{P(\bar{H}|I)}=\frac{P(H|I)}{1-P(H|I)}\,,\quad O_{\bar{H}}=O^{-1}_H OH​≡P(Hˉ∣I)P(H∣I)​=1−P(H∣I)P(H∣I)​,OHˉ​=OH−1​ 这样消掉了归一化常数证据. 如果 QH≪1Q_H\ll1QH​≪1,那么我们选择 Hˉ\bar{H}Hˉ,反之则选择 HHH;但是如果 OH≈1O_H\approx1OH​≈1 就无法判断. 推广一些,我们可以对任意的两个假设做后验比,来选择正确的假说. 一般我们使用的是 log⁡10OH\log_{10}O_Hlog10​OH​ 或者 ln⁡OH\ln O_HlnOH​ 来判断,这是因为人类的判断,或者说感觉,很多时候是对数的. 比如如果人类能够接受月亮的光,那么太阳光的数量比月光大了几个量级,人类的感觉必须要是对数的才能接受这样的差异; 另外,人类对时间的感知也是对数的,18 岁 (年龄对数的中值) 之前对一年的感知是缓慢的,但是到了年纪越来越大,时间会「越来越快」. 提示 真是毛骨悚然的事实啊... 继续玩硬币,假设两个硬币 AAA 和 BBB: fA=P(1∣AI)=1/2 ,P(0∣AI)=1/2fB=P(1∣BI)=1/4 ,P(0∣BI)=3/4\begin{aligned} f_A &= P(1|AI)=1/2\,,\quad P(0|AI)=1/2\\\\ f_B &= P(1|BI)=1/4\,,\quad P(0|BI)=3/4 \end{aligned} fA​fB​​=P(1∣AI)=1/2,P(0∣AI)=1/2=P(1∣BI)=1/4,P(0∣BI)=3/4​ 这两个硬币混在一起,我们想要区分它们,就拿出一个硬币做实验. 这里, 先验: P(H∣I)=P(Hˉ∣I)=12P(H|I)=P(\bar{H}|I)=\frac{1}{2} P(H∣I)=P(Hˉ∣I)=21​ 似然: P(D∣HI)=∏iP(di∣AI) ,P(D∣HˉI)=∏iP(di∣BI)P(D|HI)=\prod_iP(d_i|AI)\,,\quad P(D|\bar{H}I)=\prod_iP(d_i|BI) P(D∣HI)=i∏​P(di​∣AI),P(D∣HˉI)=i∏​P(di​∣BI) 后验比: OH=∏iP(di∣AI)P(di∣BI)⟹ln⁡QH=∑iln⁡P(di∣AI)P(di∣BI)O_H=\prod_i\frac{P(d_i|AI)}{P(d_i|BI)}\Longrightarrow\ln Q_H=\sum_i\ln\frac{P(d_i|AI)}{P(d_i|BI)} OH​=i∏​P(di​∣BI)P(di​∣AI)​⟹lnQH​=i∑​lnP(di​∣BI)P(di​∣AI)​ 我们发现,每一次实验都让后验比的对数变化一个常数: Δln⁡QH(1)=ln⁡∣P(1∣AI)P(1∣BI)∣=ln⁡2 ,Δln⁡QH(0)=ln⁡∣P(0∣AI)P(0∣BI)∣=ln⁡2/3\Delta\ln Q_H^{(1)}=\ln\left|\frac{P(1|AI)}{P(1|BI)}\right|=\ln2\,,\quad\Delta\ln Q_H^{(0)}=\ln\left|\frac{P(0|AI)}{P(0|BI)}\right|=\ln2/3 ΔlnQH(1)​=ln ​P(1∣BI)P(1∣AI)​ ​=ln2,ΔlnQH(0)​=ln ​P(0∣BI)P(0∣AI)​ ​=ln2/3 所以随着实验数据的增长,ln⁡QH\ln Q_HlnQH​ 线性变化,到达某个值时,我们可以开始下判断. 这个概率影响的是 ln⁡QH\ln Q_HlnQH​ 的斜率,也就影响我们需要多少次实验才能下判断. 而先验在这里影响的是图像上的截距,比如如果有 5 个好的硬币,1 个坏的硬币,那么我们一开始拿到的就更可能是好的硬币.

2025/10/16
articleCard.readMore

Lesson 9 电像法

提示 这节课没记什么笔记,主要是整节课都在讲电像法的一些推导,问题是这些大家早已烂熟,于是几乎没记. 上节课说了静电场中的一个介质球. 如果换成导体球 (ε→∞\varepsilon\to\inftyε→∞),则内部没有电场. 电像法 对于导体,我们经常使用的方法是电像法. (一) 界面为无限大平面: 电像就是直接把导体板外的点电荷镜像到另一侧来模拟导体板有电荷一侧的电场分布. (二) 界面为球面: 若球外电荷距离球心 aaa,导体球半径 R0R_0R0​,则像电荷距离球心 b=R02ab=\frac{R_0^2}{a} b=aR02​​ 像电荷电荷大小为 Q′=−R0aQQ'=-\frac{R_0}{a}Q Q′=−aR0​​Q

2025/10/16
articleCard.readMore

Lesson 8 势阱

今天主要是做几个题目. 先把上节课没讲完的说一下,自由粒子的波函数可能出现色散,具体而言是 ω(k)≈ω0+ω0′(k−k0)\omega(k) \approx \omega_0 + \omega_0'(k-k_0) ω(k)≈ω0​+ω0′​(k−k0​) 则得到波函数 ψ(x,t)≈12π∫−∞∞ϕ(k0+s)ei(k0+s)(x−ω0′t)ds\psi(x,t)\approx\frac{1}{\sqrt{2\pi}}\int_{-\infty}^\infty\phi(k_0+s)e^{\text{i}(k_0+s)(x-\omega_0't)}\text{d}s ψ(x,t)≈2π ​1​∫−∞∞​ϕ(k0​+s)ei(k0​+s)(x−ω0′​t)ds delta 势阱 势能的区分:「能到无穷远去、或者从无穷远来」称为散射态;如果是在某个势阱里做周期性的运动,是束缚态. 但是要注意的是,量子力学可能出现隧穿,有些时候会走到经典力学不允许的状态上去. 考虑一个 δ\deltaδ 吸引势,V(x)=−αδ(x)V(x)=-\alpha\delta(x)V(x)=−αδ(x) (α>0\alpha>0α>0),先来求束缚态:我们知道这个势能最大值为零,那么束缚态一定要求 E<0E<0E<0,反之为 E>0E>0E>0 的散射态. −ℏ22md2ψdx2−αδ(x)ψ(x)=Eψ(x)-\frac{\hbar^2}{2m}\frac{\text{d}^2\psi}{\text{d}x^2}-\alpha\delta(x)\psi(x)=E\psi(x) −2mℏ2​dx2d2ψ​−αδ(x)ψ(x)=Eψ(x) E<0E<0E<0,则 κ=−2mEℏ2 ,κ>0\kappa=\sqrt{\frac{-2mE}{\hbar^2}}\,,\quad\kappa>0 κ=ℏ2−2mE​ ​,κ>0 对于 x<0x<0x<0,我们只能取 ψ(x)=Beκx\psi(x)=Be^{\kappa x}ψ(x)=Beκx 的解 (否则若有 e−κxe^{-\kappa x}e−κx 项会在无穷远发散);反之 x>0x>0x>0 区域只能取 ψ(x)=Fe−κx\psi(x)=Fe^{-\kappa x}ψ(x)=Fe−κx 的解. 在原点处,波函数连续,得到 B=FB=FB=F;但是一阶导数不连续,因为存在一个势能. 我们考虑通过归一化的方式求出 BBB,最终的解为 ψ(x)=mαℏ2e−mαℏ2∣x∣\psi(x)=\sqrt{\frac{m\alpha}{\hbar^2}}e^{-\frac{m\alpha}{\hbar^2}|x|} ψ(x)=ℏ2mα​ ​e−ℏ2mα​∣x∣ 求能量:如果对于整个 Schrödinger 方程两边在一个 000 邻域的极小区间内积分,则 −∫−εεℏ22md2ψdx2dx−∫−εεαδ(x)ψ(x)dx=∫−εεEψ(x)dx-\int_{-\varepsilon}^\varepsilon\frac{\hbar^2}{2m}\frac{\text{d}^2\psi}{\text{d}x^2}\text{d}x-\int_{-\varepsilon}^\varepsilon\alpha\delta(x)\psi(x)\text{d}x=\int_{-\varepsilon}^\varepsilon E\psi(x)\text{d}x −∫−εε​2mℏ2​dx2d2ψ​dx−∫−εε​αδ(x)ψ(x)dx=∫−εε​Eψ(x)dx 得到 Δ(dψdx)=−2mαℏ2ψ(0)⟹−2κB=−2mαℏ2B⟹E=−mα22ℏ2\Delta\left(\frac{\text{d}\psi}{\text{d}x}\right)=-\frac{2m\alpha}{\hbar^2}\psi(0)\Longrightarrow -2\kappa B = -\frac{2m\alpha}{\hbar^2}B\Longrightarrow E=-\frac{m\alpha^2}{2\hbar^2} Δ(dxdψ​)=−ℏ22mα​ψ(0)⟹−2κB=−ℏ22mα​B⟹E=−2ℏ2mα2​ E>0E>0E>0,为散射态,则对于 x<0x<0x<0,有 ψ(x)=Aeikx+Be−ikx ,k=2mEℏ2>0\psi(x)=Ae^{\text{i}kx}+Be^{-\text{i}kx}\,,\quad k=\sqrt{\frac{2mE}{\hbar^2}}>0 ψ(x)=Aeikx+Be−ikx,k=ℏ22mE​ ​>0 在 x>0x>0x>0 区间是 ψ(x)=Feikx+Ge−ikx\psi(x)=Fe^{\text{i}kx}+Ge^{-\text{i}kx} ψ(x)=Feikx+Ge−ikx 边界条件是两边波函数连续,导数满足一个跳变: A+B=F+GΔ(dψdx)=ik(F−G)−ik(A−B)=−2mαℏ2ψ(0)=−2mαℏ2(A+B)\begin{aligned} A+B&=F+G\\\\ \Delta\left(\frac{\text{d}\psi}{\text{d}x}\right)=\text{i}k(F-G)-&\text{i}k(A-B)=-\frac{2m\alpha}{\hbar^2}\psi(0)=-\frac{2m\alpha}{\hbar^2}(A+B) \end{aligned} A+BΔ(dxdψ​)=ik(F−G)−​=F+Gik(A−B)=−ℏ22mα​ψ(0)=−ℏ22mα​(A+B)​ 只有两个方程. 首先我们可以假设一个初始条件,波从左边来,所以右边没有往左的波动,直接就得到 G=0G=0G=0. 剩下的可以做比例,我们能够求反射和透射系数: β=mαℏ2k ,BA=iβ1−iβ ,FA=11−iβ\beta=\frac{m\alpha}{\hbar^2k}\,,\quad\frac{B}{A}=\frac{\text{i}\beta}{1-\text{i}\beta}\,,\quad\frac{F}{A}=\frac{1}{1-\text{i}\beta} β=ℏ2kmα​,AB​=1−iβiβ​,AF​=1−iβ1​ 能量的反射率和透射率为模平方: R=∣BA∣2=11+2ℏ2Emα2 ,T=∣FA∣2=11+mα22ℏ2ER = \left|\frac{B}{A}\right|^2=\frac{1}{1+\displaystyle{\frac{2\hbar^2E}{m\alpha^2}}}\,,\quad T=\left|\frac{F}{A}\right|^2=\frac{1}{1+\displaystyle{\frac{m\alpha^2}{2\hbar^2E}}} R= ​AB​ ​2=1+mα22ℏ2E​1​,T= ​AF​ ​2=1+2ℏ2Emα2​1​ 有限方势阱 有限方势阱的分布是 V(x)={−V0−a<x<a0∣x∣>aV(x)=\begin{cases} -V_0 &-a<x<a\\\\ 0 &|x|>a \end{cases} V(x)=⎩ ⎨ ⎧​−V0​0​−a<x<a∣x∣>a​ 先来算束缚态, −ℏ22md2ψdx2=Eψ ,∣x∣>a-\frac{\hbar^2}{2m}\frac{\text{d}^2\psi}{\text{d}x^2}=E\psi\,,\quad|x|>a −2mℏ2​dx2d2ψ​=Eψ,∣x∣>a 两边的解是 ψ(x)=Beκx\psi(x)=Be^{\kappa x}ψ(x)=Beκx (x<−ax<-ax<−a) 和 ψ(x)=Fe−κx\psi(x)=Fe^{-\kappa x}ψ(x)=Fe−κx (x>ax>ax>a). 而中间的解是 ψ(x)=Csin⁡(lx)+Dcos⁡(lx) ,l=2m(E+V0)ℏ2\psi(x)=C\sin(lx)+D\cos(lx)\,,\quad l =\sqrt{\frac{2m(E+V_0)}{\hbar^2}} ψ(x)=Csin(lx)+Dcos(lx),l=ℏ22m(E+V0​)​ ​ 方程的解应该是奇函数或者偶函数,这样我们的边界条件只用算一边,先来算偶函数的解. 那么 ψ\psiψ 的连续性和导数连续性可以合起来得到 κ=ltan⁡(la)\kappa = l\tan(la) κ=ltan(la) 令 z=la ,z0=aℏ2mEz=la\,,\quad z_0=\frac{a}{\hbar}\sqrt{2mE} z=la,z0​=ℏa​2mE ​ 方程变为 tan⁡z=(z0z)2−1\tan z=\sqrt{\left(\frac{z_0}{z}\right)^2-1} tanz=(zz0​​)2−1 ​ 奇函数的方程是 κ=−lcot⁡(la)\kappa=-l\cot(la)κ=−lcot(la).

2025/10/15
articleCard.readMore

Through Cosmic Lens Into Deep Universe —— Strong Gravitational Lensing

—— Dandan Xu 从菊石和细胞骨架出发,我们发现相似的结构出现在差距很大的两个尺度上:中心有百万倍太阳质量的超大质量黑洞的那些漩涡星系,和菊石的结构很类似;但是「细胞骨架」呢? 对 Coma Cluster (后发星系团,最近的一个星系团) 的观测:1933 年 Zwicky 认为后发星系团需要稳定存在,我们需要 400 倍于能用光学方法探测到的质量. 1974,Ostriker & Einasto 计算了 M31 和银河系的旋转曲线,也发现我们需要引入一个 unseen matter 来维持这样的旋转曲线. 1973 - 1980,Roberts & Rots; Rubin et al:测量 H\text{H}H 的 21 cm21\text{ cm}21 cm 谱线,也证明存在 dark matter. 测量 Dark matter 的激波阵面,得到的图像像一种细胞骨架,这是宇宙的细胞骨架. 我们如何探测暗物质?引力透镜! Rμν−12gμνR=8πGc4TμνR_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\frac{8\pi G}{c^4}T_{\mu\nu} Rμν​−21​gμν​R=c48πG​Tμν​ 这里有很多 tensor,这是因为我们需要协变的物理量,所以张量会用得很多. 因为光沿着测地线运动,所以上述方程也能够描述光的运动. 当我们说起光学棱镜,我们会考虑棱镜材料的色散 n(λ)n(\lambda)n(λ);而广义相对论的偏转效应不存在色散,但是有关系: n=1−2c2∣Φ∣n=1-\frac{2}{c^2}|\varPhi| n=1−c22​∣Φ∣ 当然,这个偏转效应非常微小,太阳产生的偏折约是 1.7′′1.7''1.7′′,比月亮的角宽度 30′30'30′ 小了好几个数量级. 瞄准距离为 bbb、光入射方向建立的坐标轴,坐标为 zzz 时: Φ(b,z)=−GM(b2+z2)1/2⟹∇⊥Φ(b,z)=GMb⃗(b2+z2)3/2\varPhi(b,z)=-\frac{GM}{(b^2+z^2)^{1/2}}\Longrightarrow\nabla_\bot\varPhi(b,z)=\frac{GM\vec{b}}{(b^2+z^2)^{3/2}} Φ(b,z)=−(b2+z2)1/2GM​⟹∇⊥​Φ(b,z)=(b2+z2)3/2GMb ​ 积分角度,得到 α=2c2∫∇⊥Φdz=4GMc2b\alpha = \frac{2}{c^2}\int\nabla_\bot\varPhi\text{d}z=\frac{4GM}{c^2b} α=c22​∫∇⊥​Φdz=c2b4GM​ 太阳产生的偏角 1.7′′1.7''1.7′′ 最早在 1919 年由 Einstein 计算得到,并在 1920 年的一次日蚀中被 Eddington 验证. 我们在考虑引力透镜效应时,源的距离一般是 100 kpc100\text{ kpc}100 kpc 量级 (对于单星体的折射) 或者是 1 Gpc1\text{ Gpc}1 Gpc 量级 (对于星系和星系团造成的折射),而光被强烈偏折的区域是单星体的直径 106 km10^6\text{ km}106 km 量级或者 1 Mpc1\text{ Mpc}1 Mpc 量级,因此这个效应其实并不算很强. 在旋转对称性很好的情况下,我们可以得到 θE=[4GM(θE)c2DdsDdDs]1/2\theta_E=\left[\frac{4GM(\theta_E)}{c^2}\frac{D_{ds}}{D_dD_s} \right]^{1/2} θE​=[c24GM(θE​)​Dd​Ds​Dds​​]1/2 这是所谓的 Einstein 圆环对应的角宽方程. Zwicky 在 1930s 就提出,星系质量应该比当时认为的 109M⊙10^9M_{\odot}109M⊙​ 要大一百倍以上,也就是用 gravitational lensing 测量得到的 1011M⊙10^{11}M_\odot1011M⊙​ 量级. 这在 1950s 第一次观测到的类星体透镜事件中被验证. 下面我们讲三种引力透镜: Microlensing 微引力透镜,这一般是一个点质量 (单个星体) 造成的,在像移动时,我们能够观测到背景图像中的一个光度变化曲线. 微引力透镜只能通过这个光度变化曲线来探测. Galaxy Strong Lensing 强引力透镜,比如星系的暗物质晕产生的引力透镜效应. 考虑不同位置的光到达观者的时间延迟,最长距离的光线反而速度最快,因为它绕开了强引力透镜中心的大势场,而经过引力透镜中心的那一条光线虽然路程更短,但是并不是最快的. 这种效应被称为时间延迟透镜. Weak Lensing 弱引力透镜,这个我们不细说,但是这种透镜会造成相干的图像形状扭曲,这样的效果可以用来反推引力场分布. 标准宇宙学模型 每一个星系中都存在暗物质晕,它们是星系的底层结构. 但是我们遇到的困难是 (小尺度上的),如果仅考虑冷暗物质 (CDM),星系将会变得比现在更大,观测到的矮星系不符合这个预测结果;卫星的数量也会更多. 可能的解决方案是重子物质也参与了星系的主要构建过程,并以某种机制限制了星系的增长;另外,我们可以考虑 Warm DM / Self Interacting DM / Fussy or Wave DM;最后的方案是建立超出 GR 的引力理论,比如 MOND、f(R)f(R)f(R) 或者 Emergent Gravity. 目前的模型达到的效果是:

2025/10/15
articleCard.readMore

Lesson 4 粒子物理学与高能实验

—— Zhen Hu 什么是物理? 大约 135 亿年前,物质、能量、时间、空间诞生于所谓的宇宙大爆炸. 有关宇宙的这些基本特性的故事称为物理. ——《人类简史》 物理学的「极大」是广义相对论,在上面是宇宙学的标准模型;「极小」是粒子物理,在这之下是粒子物理的标准模型. 粒子物理具体而言解决的是一个人类在历史的早期就提出的哲学问题:「物质由什么组成 (基本组成单元是什么)?怎样组成?」 1964 年,Quark 模型提出,将已经发现的 200 多种强子列入「元素周期表」中,并预言了 Ω\OmegaΩ 粒子 (sss) 的存在,当年就直接在实验上发现了这种粒子,验证了标准模型. 1974 年 J/ψJ/\psiJ/ψ 粒子发现,让 quark 从三代变成四代,之前的 SU(3)\text{SU}(3)SU(3) 模型变成了 SU(4)\text{SU}(4)SU(4) 的,大幅扩展了标准模型. 一个成年人身上大约有多少个 quark? mp≈mn≈1.7×10−27 kgm_p\approx m_n\approx 1.7\times10^{-27}\text{ kg}mp​≈mn​≈1.7×10−27 kg,一个质子 / 中子对应 3 个 quark,所以约 103010^{30}1030 个 quark.

2025/10/15
articleCard.readMore

Lesson 8 Laplace 方程

上节课我们说了静电唯一性定理,静电唯一性定理需要什么条件? 两类边界条件: 边界上的电势; 边界上电势的法向导数 / 边界上电场的法向分量. 如果对于导体边界,我们也有两种边界条件: 导体上的电势 (导体等势); 导体上的电荷分布 (导体的法向电场). Laplace 方程与分离变量法 在空间中存在电荷的时候,我们得到的是 Poisson 方程而不是 Laplace 方程: ∇2φ=−ρε\nabla^2\varphi = -\frac{\rho}{\varepsilon} ∇2φ=−ερ​ 为了应用 Laplace 方程和分离变量法,我们要把这个方程化为 Laplace 方程. 考虑将电势分为两个部分,φ=φ′+φa\varphi=\varphi'+\varphi_aφ=φ′+φa​,其中 φa\varphi_aφa​ 是一个 Poisson 方程的特解 (不一定满足边界条件),于是关于 φ′\varphi'φ′ 的方程变成 Laplace 方程、边界条件是 φa\varphi_aφa​ 去掉后的边界条件. 提示 其实就是数理方程里面讲到的「非齐次稳定方程化为齐次方程」的方法. 一般我们研究的问题,边界都是人为可控制的,所以能够保证齐次. 我们以球坐标系为主要的研究对象,通解为 φ(r,θ,ϕ)=∑n,m(Anmrn+Bnmrn+1)Pnm(cos⁡θ)cos⁡(mϕ)+∑n,m(Cnmrn+Dnmrn+1)Pnm(cos⁡θ)sin⁡(mϕ)\begin{aligned} &\varphi(r,\theta,\phi)= \\\\ & \sum_{n,m}\left(A_{nm}r^n+\frac{B_{nm}}{r^{n+1}}\right)P_n^m(\cos\theta)\cos(m\phi)+\sum_{n,m}\left(C_{nm}r^n+\frac{D_{nm}}{r^{n+1}}\right)P_n^m(\cos\theta)\sin(m\phi) \end{aligned} ​φ(r,θ,ϕ)=n,m∑​(Anm​rn+rn+1Bnm​​)Pnm​(cosθ)cos(mϕ)+n,m∑​(Cnm​rn+rn+1Dnm​​)Pnm​(cosθ)sin(mϕ)​ 如果电荷分布绕着 zzz 轴球对称,那么函数将和 ϕ\phiϕ 无关,磁量子数 m=0m=0m=0. 这时我们的解变成了 φ(r,θ)=∑n=0(Anrn+Bnrn+1)Pn(cos⁡θ)\varphi(r,\theta)=\sum_{n=0}\left(A_nr^n+\frac{B_n}{r^{n+1}}\right)P_n(\cos\theta) φ(r,θ)=n=0∑​(An​rn+rn+1Bn​​)Pn​(cosθ) Legendre 函数的前面几个需要记住: n=0P0=1n=1P1=cos⁡θn=2P2=12(3cos⁡2θ−1)n=3P3=12(5cos⁡3θ−3cos⁡θ)\begin{aligned} &n=0\quad P_0=1\\\\ &n=1\quad P_1=\cos\theta\\\\ &n=2\quad P_2=\frac{1}{2}(3\cos^2\theta-1)\\\\ &n=3\quad P_3=\frac{1}{2}(5\cos^3\theta-3\cos\theta) \end{aligned} ​n=0P0​=1n=1P1​=cosθn=2P2​=21​(3cos2θ−1)n=3P3​=21​(5cos3θ−3cosθ)​ 它们是正交的,归一性可以用修改待定系数的方式达到. /Example/ 一个介电常数 ε\varepsilonε 的均匀线性介质球放入均匀外场 E⃗0\vec{E}_0E 0​ 中,球外为真空,求电势分布.

2025/10/14
articleCard.readMore

Lesson 7 自由粒子

什么是波矢?是波动传播时,在波动方向上波的空间频率. 自由粒子的稳态 Schrödinger 方程是 d2ψdx2=−k2ψ ,k=2mEℏ\frac{\text{d}^2\psi}{\text{d}x^2}=-k^2\psi\,,\quad k=\frac{\sqrt{2mE}}{\hbar} dx2d2ψ​=−k2ψ,k=ℏ2mE ​​ 一般解是 ψ(x)=Aeikx+Be−ikx\psi(x)=Ae^{\text{i}kx}+Be^{-\text{i}kx} ψ(x)=Aeikx+Be−ikx 加入时间解,得到 Ψ(x,t)=Aei(kx−ℏk22mt)+Be−i(kx+ℏk22mt)\varPsi(x,t)=Ae^{\text{i}(kx-\frac{\hbar k^2}{2m}t)}+Be^{-\text{i}(kx+\frac{\hbar k^2}{2m}t)} Ψ(x,t)=Aei(kx−2mℏk2​t)+Be−i(kx+2mℏk2​t) 对于单一的一个 kkk, Ψk(x,t)=Aei(kx−ℏk22mt)\varPsi_k(x,t)=Ae^{\text{i}(kx-\frac{\hbar k^2}{2m}t)} Ψk​(x,t)=Aei(kx−2mℏk2​t) 如果 k>0k>0k>0,这是一个向 +x+x+x 方向传播的波动. 如果归一化,那么会得到 ∣Ψ∣2=∣A∣2|\varPsi|^2=|A|^2∣Ψ∣2=∣A∣2 积分为 ∞\infty∞. 所以我们要取一个 kkk 的范围,因为有正交归一性: 12π∫−∞∞e−ikxeik′xdx=δ(k−k′)\frac{1}{2\pi}\int_{-\infty}^\infty e^{-\text{i}kx}e^{\text{i}k'x}\text{d}x=\delta(k-k') 2π1​∫−∞∞​e−ikxeik′xdx=δ(k−k′) 为了将 Ψ\varPsiΨ 分解为本征态,我们考虑 Ψ(x,0)=∑ncnϕn(x) ,Ψ(x,t)=∑ncnϕn(x)e−iEnt/ℏ\varPsi(x,0)=\sum_n c_n\phi_n(x)\,,\quad \varPsi(x,t)=\sum_nc_n\phi_n(x)e^{-\text{i}E_nt/\hbar} Ψ(x,0)=n∑​cn​ϕn​(x),Ψ(x,t)=n∑​cn​ϕn​(x)e−iEn​t/ℏ 则为了求出 cnc_ncn​,对于初态两边同时乘以 ϕm∗(x)\phi_m^*(x)ϕm∗​(x),并积分, ∫ϕm∗(x)Ψ(x,0)dx=∑ncnδmn=cm\int\phi_m^*(x)\varPsi(x,0)\text{d}x=\sum_nc_n\delta_{mn}=c_m ∫ϕm∗​(x)Ψ(x,0)dx=n∑​cn​δmn​=cm​ 于是波函数是 Ψ(x,t)=12π∫−∞∞ϕ(k)ei(kx−ℏk22mt)dk\varPsi(x,t)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^\infty\phi(k)e^{\text{i}(kx-\frac{\hbar k^2}{2m}t)}\text{d}k Ψ(x,t)=2π ​1​∫−∞∞​ϕ(k)ei(kx−2mℏk2​t)dk 其中, ϕ(k)=12π∫−∞∞Ψ(x,0)e−ikxdx\phi(k)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^\infty\varPsi(x,0)e^{-\text{i}kx}\text{d}x ϕ(k)=2π ​1​∫−∞∞​Ψ(x,0)e−ikxdx 也就是初态波函数对 xxx 的 Fourier 变换 (到谱函数). 明天下午四点,一个 Italy 的科学家会来物理楼做报告,讲单光子源.

2025/10/13
articleCard.readMore

Lesson 4 二态系统

上节课我们最重点讲的是化学势,这是因为在生命过程中需要进行很多化学反应. 我们说到化学平衡时有平衡常数等等,另外,如果想要研究系统的演化,我们可以来考虑系统的 kinetic 效应. 平衡态是一种特殊的稳态,不仅使得系统稳定,而且还要能够找到一种能量函数在这个状态下达到极值. 一个例子是我们上节课说到的细致平衡,在一个 A,B,CA,B,CA,B,C 三种物质的环形反应链中,每一对反应都达到平衡才是所谓的细致平衡,这要求 k1k2k3k−1k−2k−3=1\frac{k_1k_2k_3}{k_{-1}k_{-2}k_{-3}}=1 k−1​k−2​k−3​k1​k2​k3​​=1 这种情况下能够找到一种势能函数. 反之,如果这个体系有所谓的「旋度」,也就是有静流,那么就一定无法找到这样的势能函数. 如果大家学过图论,我们会知道一个「好的」图在每一个环路中都满足类似上面的平衡条件. 如何破坏这种平衡?我们举 ATP 的例子,在生物体内的 ATP 浓度很高,它在一个循环的反应中不断地加入,用渗透压来驱动反应向某一个特定方向旋转. Michaelis-Menten 反应,这是一种酶催化反应:酶不参与反应,自由的酶 + 结合的酶 = 总量, [E]+[ES]=Etot[E]+[ES]=E_{\text{tot}} [E]+[ES]=Etot​

2025/10/12
articleCard.readMore

Lesson 6 Nobel Prize

鉴于 Nobel Prize for Physics 刚刚颁布,和我们量子力学关系很大,所以我们花点时间来说一说. 我们对于宏观和微观量子效应的区分有一个概念,叫做 catness:用来标度自由度的大小. 对于宏观的生命体,比如说「Schrödinger 的猫」,它具有非常大的自由度,这是宏观的物体. 对于自由度极多的系统,我们还是可以说: [x(i),p^x(j)]=iℏδij[x^{(i)}, \hat{p}_x^{(j)}] = \text{i}\hbar\delta_{ij} [x(i),p^​x(j)​]=iℏδij​ 已经有人在 102310^{23}1023 量级的系统上实现了量子效应. 但是真的在宏观上实现量子效应还是非常困难. 事情的转机来源于一个叫做 Brian Josephson 的人,当时 P.W.Anderson (这个人是凝聚态物理至今最伟大的物理学家之一) 在 Josephson 的学校那里做访问学者,Josephson 已经知道了 Bose - Einstein 凝聚的事情,最简单的宏观量子效应就是 Boson 的 Bose - Einstein 凝聚,所有的全同 Boson 聚集在谐振子的基态上、波函数非常简单. Bose - Einstein 凝聚的波函数怎么写呢? ψ0(x1)ψ0(x2)⋯ψ(xn)\psi_0(x_1)\psi_0(x_2)\cdots\psi(x_n) ψ0​(x1​)ψ0​(x2​)⋯ψ(xn​) (所有粒子都有同样的波函数,但是自由度极高,来自于总的粒子数) Cooper 等人做的超导 BCS 理论和上述波函数其实很相似,只是 ψ0\psi_0ψ0​ 换成了 ψpair↑↓(R⃗c,r⃗)\psi_{\text{pair}}^{\uparrow\downarrow}(\vec{R}_c,\vec{r})ψpair↑↓​(R c​,r ),这里 R⃗c=12(r⃗1+r⃗2) ,r⃗=r⃗2−r⃗1\vec{R}_c=\frac{1}{2}(\vec{r}_1+\vec{r}_2)\,,\quad\vec{r}=\vec{r}_2-\vec{r}_1 R c​=21​(r 1​+r 2​),r =r 2​−r 1​ 分别表示质心坐标和相对位移. Cooper 对中的两个自旋相反的粒子耦合之后合成了一个类似于 Boson 的体系,产生一种凝聚,达到所谓 s 波超导;当然,我们可以预料到这样的耦合也能产生自旋 ±1\pm1±1 的 pair,这是之后得了 Nobel Prize 的 p 波超导. Josephson 知道了 Cooper 他们的理论,他想到宏观量子效应应该通过类似 Bose - Einstein 凝聚的效果来实现,于是设计两个超导体 + 中间一小层绝缘体的一种电路结,来观测电流在中间的一些量子效果. 美国的高校会在教授每工作六年时,给教授们一个带半薪休假一年的机会,很多学者利用这个机会来到别的学校做访问. Anderson 很欣赏 Josephson 结的思路,给了很多资源来研究这件事情. 在电路中引入 Josephson 结得到环路后,电路系统也可以被量子化,共轭变量有 [Q,e−i∂∂Q]=iℏ\left[Q,e^{-\text{i}\frac{\partial}{\partial Q}}\right]=\text{i}\hbar [Q,e−i∂Q∂​]=iℏ 等等,它和原子系统的区别在于这是人工的,我们能够调整这个系统的各个参数,进行各种实验. 比如我们可以在一个环路中得到这样的叠加态: ∣↺⟩+∣↻⟩\ket{\circlearrowleft}+\ket{\circlearrowright} ∣↺⟩+∣↻⟩ 这意味着我们可能观测到两个方向的环流. 下课的时候老师说他曾经的老师得了 Nobel Prize,叫 Carl Wieman,他甚至是学而思网校聘请的高级教研员 ( 这一次 Nobel Prize 利用上面的很多想法,做了一些和超导量子计算有关系的工作. 为什么电路体系可以用 Lagrange 和 Hamilton 的力学来描述? 这些理论是一般性的. 为什么电荷的共轭变量是相位? 现在我们已经学到的知识只能支持我们说,这样的共轭变量选择是自洽的. 自由粒子 对于自由粒子,不含时 Schrödinger 方程就是一个自由的行波. 问题在于,我们的波函数没办法归一化,这时候要引入波包的概念: Ψ(x,t)=12π∫−∞∞ϕ(t)ei(kx−ℏk22mt)dk\varPsi(x,t)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^\infty\phi(t)e^{\text{i}(kx-\frac{\hbar k^2}{2m}t)}\text{d}k Ψ(x,t)=2π ​1​∫−∞∞​ϕ(t)ei(kx−2mℏk2​t)dk 相当于很多不同频率的平面波叠加. 色散的波包都是会散开的,我们需要使用非线性的 Schrödinger 方程来生成孤子解 (不色散的波包).

2025/10/11
articleCard.readMore

Lesson 3 宇宙学和粒子物理

弯曲时空量子场论 —— 鲜于中之 我起晚了所以前半段没听到.

2025/10/11
articleCard.readMore

Lesson 3 分离变量法 (二)

分离变量法 (一) 接着上节课的内容. 检验解的适定性 对于一段质元,动能为 ∫12(ρdx)(∂u∂t)2\int\frac{1}{2}(\rho\text{d}x)\left(\frac{\partial u}{\partial t}\right)^2 ∫21​(ρdx)(∂t∂u​)2 势能为 ∫T⋅[1+(∂u∂x)2−1]dx≈∫12T(∂u∂x)2dx\int T\cdot\left[\sqrt{1+\left(\frac{\partial u}{\partial x}\right)^2}-1\right]\text{d}x\approx\int \frac{1}{2}T\left(\frac{\partial u}{\partial x}\right)^2\text{d}x ∫T⋅ ​1+(∂x∂u​)2 ​−1 ​dx≈∫21​T(∂x∂u​)2dx 直接把 uuu 通解代入上面的表达式: u=∑n=1∞[Cnsin⁡(nπlat)+Dncos⁡(nπlat)]sin⁡(nπlx)u=\sum_{n=1}^\infty\left[C_n\sin\left(\frac{n\pi}{l}at\right)+D_n\cos\left(\frac{n\pi}{l}at\right)\right]\sin\left(\frac{n\pi}{l}x\right) u=n=1∑∞​[Cn​sin(lnπ​at)+Dn​cos(lnπ​at)]sin(lnπ​x) 其实因为三角函数的正交性 (虽然我们没有算过余弦函数的正交性,但是可以随便算一下来验证,就是用积化和差公式),所以积分后的式子并没有那么复杂,得到 Ek=12ρ∑n=1∞n2π2l2a2[Cncos⁡−Dnsin⁡]2⋅l2=14ρa2l∑n=1∞n2π2[Cn2cos⁡2+Dn2sin⁡2−2CnDnsin⁡cos⁡]Ep=12T∑n=1∞n2π2l2[Cnsin⁡+Dncos⁡]⋅l2=14Tl∑n=1∞n2π2[Cn2sin⁡2+Dn2cos⁡2+2CnDnsin⁡cos⁡]\begin{aligned} E_k&=\frac{1}{2}\rho\sum_{n=1}^\infty\frac{n^2\pi^2}{l^2}a^2[C_n\cos-D_n\sin]^2\cdot\frac{l}{2}\\\\ &=\frac{1}{4}\frac{\rho a^2}{l}\sum_{n=1}^\infty n^2\pi^2[C_n^2\cos^2+D_n^2\sin^2-2C_nD_n\sin\cos]\\\\ E_p&=\frac{1}{2}T\sum_{n=1}^\infty \frac{n^2\pi^2}{l^2}[C_n\sin+D_n\cos]\cdot\frac{l}{2}\\\\ &=\frac{1}{4}\frac{T}{l}\sum_{n=1}^\infty n^2\pi^2[C_n^2\sin^2+D_n^2\cos^2+2C_nD_n\sin\cos] \end{aligned} Ek​Ep​​=21​ρn=1∑∞​l2n2π2​a2[Cn​cos−Dn​sin]2⋅2l​=41​lρa2​n=1∑∞​n2π2[Cn2​cos2+Dn2​sin2−2Cn​Dn​sincos]=21​Tn=1∑∞​l2n2π2​[Cn​sin+Dn​cos]⋅2l​=41​lT​n=1∑∞​n2π2[Cn2​sin2+Dn2​cos2+2Cn​Dn​sincos]​ 因为我们知道 T=ρa2T=\rho a^2T=ρa2,所以上面两个能量的系数完全相等;另外,相加可以得到能量守恒: E=π2ρa24l∑n=1∞n2[Cn2+Dn2]E=\frac{\pi^2\rho a^2}{4l}\sum_{n=1}^\infty n^2[C_n^2+D_n^2] E=4lπ2ρa2​n=1∑∞​n2[Cn2​+Dn2​] 对于积分形式,验证能量守恒 dEdt=∫0lρ∂u∂t∂2u∂t2dx+∫0lT∂u∂x∂2u∂t∂xdx\frac{\text{d}E}{\text{d}t}=\int_0^l\rho\frac{\partial u}{\partial t}\frac{\partial^2u}{\partial t^2}\text{d}x+\int_0^lT\frac{\partial u}{\partial x}\frac{\partial^2u}{\partial t\partial x}\text{d}x dtdE​=∫0l​ρ∂t∂u​∂t2∂2u​dx+∫0l​T∂x∂u​∂t∂x∂2u​dx 自然的想法是对后面一个积分做分部积分,同时利用 T=ρa2T=\rho a^2T=ρa2,得到 dEdt=∫0lρ∂u∂t∂2u∂t2dx+ρa2∂u∂t∂u∂x∣0l−∫0lρa2∂u∂t∂2u∂x2dx\begin{aligned} \frac{\text{d}E}{\text{d}t}&=\int_0^l\rho\frac{\partial u}{\partial t}\frac{\partial^2u}{\partial t^2}\text{d}x+\rho a^2\frac{\partial u}{\partial t}\left.\frac{\partial u}{\partial x}\right|_0^l-\int_0^l\rho a^2\frac{\partial u}{\partial t}\frac{\partial^2u}{\partial x^2}\text{d}x \end{aligned} dtdE​​=∫0l​ρ∂t∂u​∂t2∂2u​dx+ρa2∂t∂u​∂x∂u​ ​0l​−∫0l​ρa2∂t∂u​∂x2∂2u​dx​ 积分的部分直接是波动方程. 波动方程的能量守恒保证了其解的适定性 (唯一性和稳定性). 分离变量法得到的结果其实是把波动分解为很多驻波的叠加. 如果把驻波解利用积化和差写成两个行波解,并完成解析延拓 (驻波解只能在一小段范围成立,而行波解可以向远处传播),可以建立起驻波解和行波解的关系.

2025/10/10
articleCard.readMore