Skip to content

狄利克雷卷积与莫比乌斯反演入门

学之前感觉很神秘啊,但其实类似于容斥。

符号与约定

约定 $a\mid b$ 表示存在整数 $k$,使得 $ak=b$,同理有 $a\nmid b$,表示不存在那样的整数 $k$。

通常用 $\prod_i p_i^{c_i}$ 表示一个数的质因数分解,如果同时使用 $p,c$ 而不表示质因数分解会特殊说明。

狄利克雷卷积与数论函数相关概念

数论函数指定义域是正整数域 $\mathbb{Z}^+$,陪域(大概能理解为值域的超集)是复数域 $\mathbb{C}$ 的函数(但常见的的数论函数值域一般都是整数集合的子集)。它们叫数论函数貌似是因为数论非常喜欢研究这样的函数。

狄利克雷卷积

狄利克雷卷积是一种定义在数论函数上的运算,$f$ 和 $g$ 的狄利克雷卷积通常用 $f\ast g$ 来表示(就是星号 \ast,不是点 \cdot)。有 $(f\ast g)(n)=\sum_{xy=n}f(x)g(y)$,或者写作 $(f\ast g)(n)=\sum_{d\mid n}f(d)g(\frac{n}{d})$。

它有几乎和乘法一样的性质:

  • 交换律:$f\ast g=g\ast f$,显然。
  • 结合律:$(f\ast g)\ast h=f\ast (g\ast h)$,证明非常简单,因为 $\left((f\ast g)\ast h\right)(n)=\sum_{xyz=n}f(x)g(y)h(z)$,与运算顺序无关。
  • 分配率:$(f+g)\ast h=f\ast h+g\ast h$,其中加法表示单点函数值相加。证明也考虑套定义,略过。

以及一个神秘性质(虽然乘法也有这个性质,但证明方法不太一样):

  • $f=g\Leftrightarrow f\ast h=g\ast h$,其中数论函数 $h(x)$ 要满足 $h(1)\ne 0$。

证明

充分性显然,考虑证必要性。假设 $f\ne g$,那么必定存在一个最小的正整数 $x$,使得 $f(x)\ne g(x)$。

设 $r=f\ast h-g\ast h=(f-g)\ast h$,那么 $r(x)=\sum_{d\mid x}(f(d)-g(d))h(\frac{x}{d})$。

由于 $x$ 最小,所以所有小于 $x$ 的 $d$ 均满足 $f(d)=g(d)$,于是上式 $=(f(x)-g(x))h(1)\ne 0$,说明 $(f\ast h)(x)\ne (g\ast h)(x)$,则 $f\ast h\ne g\ast h$,与条件矛盾。故必要性成立。

然后你也能看出为什么要求 $h(1)\ne 0$。

积性函数与狄利克雷逆

在狄利克雷卷积意义下,有很多特殊函数:

  • 元函数:通常用 $\varepsilon$(\varepsilon)表示,$\varepsilon(n)=[n=1]$,对于任意数论函数 $f$ 均有 $\varepsilon\ast f=f$,原因带入定义证即可。
  • 恒等函数:通常用大写字母 $I$ 表示,$I(n)=1$。
  • 单位函数:$id(n)=n$,其实是幂函数($id^x(n)=n^x$)的特殊情况,但也就它比较常用。

这些函数都是完全积性函数

$f$ 是完全积性函数当且仅当对于任意整数 $a,b$,均有 $f(ab)=f(a)f(b)$。

那么既然有完全积性函数,那显然会定义有积性函数

$f$ 是积性函数当且仅当对于任意整数 $a,b$ 满足 $\gcd(a,b)=1$,有 $f(ab)=f(a)f(b)$。

显然地,完全积性函数是积性函数的子集。

另外,由于单位元的存在,我们可以对数论函数定义狄利克雷逆。通常用 $f^{-1}$ 表示 $f$ 的狄利克雷逆,意义是 $f\ast f^{-1}=f^{-1}\ast f=\varepsilon$,根据 $f=g\Leftrightarrow f\ast h=g\ast h$ 的性质,同一个数论函数的狄利克雷逆唯一。

有一个性质,当且仅当 $f(1)\ne 0$ 时 $f$ 存在狄利克雷逆 $f^{-1}$。

证明

首先必要性比较简单,考虑否命题(即逆命题的逆否命题,若它为真那么逆命题为真,必要性成立)是当 $f(1)=0$,不存在狄利克雷逆。因为 $\varepsilon(1)=(f\ast f^{-1})(1)=f(1)f^{-1}(1)=1$,当 $f(1)=0$,这个方程无解。

然后考虑充分性,考虑从小到大构造 $f^{-1}$,注意到 $(f\ast f^{-1})(x)=\sum_{d\mid x}f(d)f^{-1}(\frac{x}{d})$ 中,除了 $d=1$ 都是确定的,那么构造如下:

$$ f^{-1}(x)=\frac{\varepsilon(x)-\sum_{d\mid x}^{d\ne 1}f(d)f^{-1}(\frac{x}{d})}{f(1)} $$

这样就满足 $(f\ast f^{-1})(x)=\varepsilon(x)$ 了。显然当 $f(1)\ne 1$ 时均能构造出来,并且直接暴力跑复杂度甚至是 $O(n\log n)$(调和级数)的。

积性函数的性质

若 $f$ 是一个积性函数:

  • $f(1)=1$ 或 $f(1)=0$。

证明简单,因为 $f(1)=f(1)f(1)$,但是若 $f(1)=0$ 那么整个函数全是 $0$,就没什么讨论的价值了。下文默认 $f(1)=1$。

  • $f(n)=\prod_i f(p_i^{c_i})$。

显然,因为所有质因子均互质,套定义即可。

  • 若 $f,g$ 均为积性函数,那么 $h=f\ast g$ 为积性函数。

证明考虑套定义,对于任意两个正整数 $a,b$ 满足 $\gcd(a,b)=1$,均有:

$$ \begin{aligned} h(a)h(b) &=\sum_{c\mid a}f(c)g(\frac{a}{c})\sum_{d\mid b}f(d)g(\frac{b}{d})\\ &=\sum_{c\mid a}\sum_{d\mid b}f(cd)g(\frac{ab}{cd})\\ &=\sum_{e|ab}f(e)g(\frac{ab}{e})\\ &=h(ab) \end{aligned} $$

  • 若 $f$ 为积性函数,则 $f^{-1}$ 是积性函数。

考虑数学归纳法。首先对于 $xy=1$,显然有 $f^{-1}(1)=f^{-1}(1)f^{-1}(1)$。对于 $xy>1,\gcd(x,y)=1$,假设对于所有 $\gcd(n,m)=1,nm<xy$ 均有 $f^{-1}(nm)=f^{-1}(n)f^{-1}(m)$,那么:

$$ \begin{aligned} f^{-1}(nm) &=\frac{\varepsilon(nm)-\sum_{d\mid nm}^{d\ne 1}f(d)f^{-1}(\frac{nm}{d})}{f(1)}\\ &=-\sum_{d\mid nm}^{d\ne 1}f(d)f^{-1}(\frac{nm}{d})\\ &=-\sum_{a\mid n,b\mid m}^{ab\ne 1}f(ab)f^{-1}(\frac{nm}{ab})\\ &=-\sum_{a\mid n,b\mid m}^{ab\ne 1}f(a)f(b)f^{-1}(\frac{n}{a})f^{-1}(\frac{m}{b})\\ &=f(1)f(1)g(n)g(m)-\sum_{a\mid n,b\mid m}f(a)f(b)f^{-1}(\frac{n}{a})f^{-1}(\frac{m}{b})\\ &=f(1)f(1)g(n)g(m)-\sum_{a\mid n}f(a)f^{-1}(\frac{n}{a})\sum_{b\mid m}f(b)f^{-1}(\frac{m}{b})\\ &=f(1)f(1)g(n)g(m)-(f\ast f^{-1})(n)(f\ast f^{-1})(m)\\ &=f^{-1}(n)f^{-1}(m)-\varepsilon(n)\varepsilon(m)\\ &=f^{-1}(n)f^{-1}(m) \end{aligned} $$

其中最后一步能直接去掉 $\varepsilon(n)\varepsilon(m)$ 是因为 $n,m$ 中至少一个不为 $1$。

得证。

现在我们已经对狄利克雷卷积以及积性函数有了一点点了解了,我们来讨论一些非常特殊的积性函数。

莫比乌斯反演

芜湖!进入正题。

考虑很多时候可能存在 $F=f\ast I$ 的关系,并且 $F$ 是好求的而 $f$ 不好求。通过 $f$ 求 $F$ 是简单的,可以 $O(n\log n)$ 暴力,那根据 $F$求 $f$ 呢?根据反演的套路,可以考虑用 $f=F\ast I^{-1}$ 来求出 $f$。因为 Möbius 把 $I^{-1}$ 命名为 $\mu$(莫比乌斯函数),所以这样的反演叫莫比乌斯反演(虽然有时候用其它函数的狄利克雷逆做的反演也叫莫比乌斯反演)。

首先显然地,$\mu$ 是一个积性函数。对于积性函数通常先考虑它在质数的次幂时的表现,那么我们先考虑 $\mu(p^k)$,其中 $p$ 是质数。

对于 $k=0$ 是平凡的,$\mu(1)=1$。

当 $k=1$ 时,$\varepsilon(p)=\sum_{d\mid p}I(d)\mu(\frac{p}{d})=I(1)\mu(p)+I(p)\mu (1)=0$,则 $\mu(p)=-1$。

当 $k>1$ 时,$\sum_{i=0}^kI(p^i)\mu(p^{k-i})=0$,其中有两个值已经确定了,即 $I(p^{k-1})\mu(p)=-1,I(p^k)\mu(1)=1$,用数学归纳法易证当 $k>1$ 时,$\mu(p^k)=0$,具体细节略。

那么对于其他 $\mu(n)$,考虑把 $n$ 拆成 $\prod_i p_i^{c_i}$,由于 $\mu$ 时积性函数可以直接把对应函数值相乘,于是有:

$$ \mu(n)=\begin{cases} 0&,\exists p,p^2\mid n\\ (-1)^k&,\text{$k$ 是 $n$ 的质因子个数} \end{cases} $$

于是就能用欧拉筛 $O(n)$ 地求 $\mu$,或者 $O(\sqrt{n})$ 地单点求 $\mu$ 了。

然后我们能得到两组简单的反演关系:

$$ F(n)=\sum_{d\mid n}f(d) $$ $$ f(n)=\sum_{d\mid n}\mu(d)F(\frac{n}{d}) $$

这个显然。

以及:

$$ F(n)=\sum_{k}f(k) $$ $$ f(n)=\sum_{k}\mu(k)F(nk) $$

(其实就是把因数换成了倍数)

这个也比较好证,仿照子集反演的证法:

$$ \begin{aligned} f(n) &=\sum_{i}\mu(i)F(ni)\\ &=\sum_{i}\mu(i)\sum_{j}f(nij)\\ &=\sum_{k}f(nk)\sum_{d\mid k}\mu(k)\\ &=\sum_{k}f(nk)\varepsilon(k)\\ &=f(n) \end{aligned} $$

但这两个其实都没啥用,不如下面这个:

$$ \sum_{d\mid n}\mu(d)=[n=1] $$

证明非常显然,左边是 $\mu \ast I=\varepsilon$,右边就是 $\varepsilon$。

常用变形:

$$ [n\mid m]\sum_{d\mid \frac{m}{n}}\mu(d)=[n=m] $$

显然。

$$ \sum_{d\mid gcd(i,j)}\mu(d)=[\gcd(i,j)=1] $$

这个就很常用了。

例题:UVA12888 Count LCM

简单推一下:

$$ \begin{aligned} &\sum_{i=1}^n\sum_{j=1}^m[\mathrm{lcm}(i,j)=ij]\\ =&\sum_{i=1}^n\sum_{j=1}^m[\gcd(i,j)=1]\\ =&\sum_{i=1}^n\sum_{j=1}^m\sum_{d\mid gcd(i,j)}\mu(d)\\ =&\sum_{d=1}^{\min(n,m)}\sum_{d\mid i}^{i\le n}\sum_{d\mid j}^{j\le m}\mu(d)\\ =&\sum_{d=1}^{\min(n,m)}\mu(d)\sum_{d\mid i}^{i\le n}\sum_{d\mid j}^{j\le m}1\\ =&\sum_{d=1}^{\min(n,m)}\mu(d)\left\lfloor\frac{n}{d}\right\rfloor\left\lfloor\frac{m}{d}\right\rfloor\\ \end{aligned} $$

然后就能整除分块 $O(\sqrt{\min(n,m)})$ 做了。

参考代码
#include<bits/stdc++.h>
#define mem(a,b) memset(a,b,sizeof(a))
#define forup(i,s,e) for(i64 i=(s);i<=(e);i++)
#define fordown(i,s,e) for(i64 i=(s);i>=(e);i--)
#ifdef DEBUG
#define msg(args...) fprintf(stderr,args)
#else
#define msg(...) void()
#endif
using namespace std;
using i64=long long;
#define gc getchar()
inline i64 read(){
    i64 x=0,f=1;char c;
    while(!isdigit(c=gc)) if(c=='-') f=-1;
    while(isdigit(c)){x=(x<<3)+(x<<1)+(c^48);c=gc;}
    return x*f;
}
#undef gc
const i64 N=1e6+5;
i64 n,m,mu[N],vv[N],sum[N];
vector<i64> pri;
void init(i64 n){
    mu[1]=1;
    forup(i,2,n){
        if(!vv[i]){
            mu[i]=-1;
            pri.push_back(i);
        }
        for(auto j:pri){
            if(1ll*i*j>n) break;
            vv[i*j]=1;
            if(!(i%j)){
                mu[i*j]=0;
                break;
            }else{
                mu[i*j]=-mu[i];
            }
        }
    }
    forup(i,1,n){
        sum[i]=sum[i-1]+mu[i];
    }
}
signed main(){
    i64 t=read();
    init(1000000);
    while(t--){
        n=read();m=read();
        i64 res=0;
        for(i64 l=1,r=1;l<=min(n,m);l=r+1){
            r=min(n/(n/l),m/(m/l));
            res+=1ll*(sum[r]-sum[l-1])*(m/l)*(n/l);
        }
        printf("%lld\n",res);
    }
}

然后用类似的套路还能过 P2158 [SDOI2008] 仪仗队(下标从 $0$ 开始,容易发现除去 $(0,1),(1,0)$ 两个点以外和那个问题是等价的)P3455 [POI2007] ZAP-Queries(只算 $d$ 的倍数即可)。

欧拉函数

欧拉函数 $\varphi$(\varphi)也是一个重要的数论函数函数,$\varphi(n)=\sum_{i=1}^{n-1}[\gcd(n,i)=1]$。通项公式为 $\varphi(n)=n\prod_i\frac{p_i-1}{p_i}$,感性理解考虑每 $p_i$ 个数就有一个与 $n$ 不互质,理性证明网上很好找就不展开了。

显然 $\varphi$ 是一个积性函数,因为若 $a,b$ 互质,那么 $a,b$ 没有共同质因子,带一下通项公式容易发现 $\varphi(ab)=\varphi(a)\varphi(b)$。

然后如果要求 $\varphi$,可以 $O(\sqrt{n})$ 暴力带通项公式或者线性筛求出,此处不展开。

有一个显然的结论,$\sum_{i=1}^n\sum_{j=1}^n[\gcd(i,j)=1]=2\left(\sum_{i=1}^n\varphi(i)\right)-1$,容易发现 $\sum_{i=1}^n\sum_{j=1}^i[\gcd(i,j)=1]=\sum_{i=1}^n\varphi(i)$,这就枚举了所有 $i\ge j$ 的情况。直接互换 $i,j$ 位置会多算所有 $i=j$ 的情况,只有 $i=j=1$ 会有贡献,于是 $-1$。

然后有一个非常厉害的结论:$\varphi \ast I=id$。

证明

由于 $id$ 是积性函数,只需要考虑 $n=p^c$ 的情况。

那么 $(\varphi \ast I)(p^c)=\sum_{k=0}^c\varphi(p^k)$。

由于 $\varphi(p^c)=p^c\cdot \frac{p-1}{p}=p^{c-1}\cdot (p-1)$,那么后面就是一个等比数列求和。

于是有:

$$ \begin{aligned} \sum_{k=0}^c\varphi(p^k) &=1+\sum_{k=1}^c p^{k-1}\cdot (p-1)\\ &=1+\sum_{k=0}^{c-1} p^k\cdot (p-1)\\ &=1+\frac{(p-1)(p^c-1)}{p-1}\\ &=p^c \end{aligned} $$

得证。

既然已经看到了 $I$,那么就应该反应出 $\mu$,于是有 $\varphi=\mu \ast id$。

这东西就非常有用了,比如可以用来求 $\sum_{i=1}^n\sum_{j=1}^m\gcd(i,j)$(假设 $n\le m$)。

$$ \begin{aligned} \sum_{i=1}^n\sum_{j=1}^m\gcd(i,j) &=\sum_{t=1}^nt\sum_{i=1}^{\left\lfloor\frac{n}{t}\right\rfloor}\sum_{i=1}^{\left\lfloor\frac{m}{t}\right\rfloor}[\gcd(i,j)=1]\\ &=\sum_{t=1}^nt\sum_{d=1}^{\left\lfloor\frac{n}{t}\right\rfloor}\mu(d)\left\lfloor\frac{n}{dt}\right\rfloor\left\lfloor\frac{m}{dt}\right\rfloor\\ &=\sum_{t=1}^nt\sum_{t\mid T}^{T\le n}\mu(\frac{T}{t})\left\lfloor\frac{n}{T}\right\rfloor\left\lfloor\frac{m}{T}\right\rfloor\\ &=\sum_{T=1}^{n}\left\lfloor\frac{n}{T}\right\rfloor\left\lfloor\frac{m}{T}\right\rfloor\sum_{t\mid T} id(t)\mu(\frac{T}{t})\\ &=\sum_{T=1}^{n}\left\lfloor\frac{n}{T}\right\rfloor\left\lfloor\frac{m}{T}\right\rfloor\varphi(T) \end{aligned} $$

这真是太酷了。

然后还有一些比较显然的,此处不展开了。

Comments