第三章 Farey级数
1、The definition and property of Farey series(法里序列的定义与性质)
本章我们将考虑有关 vulgar fractions(真分数) 的性质
分数可以看成两个整数的相除关系,所以分数的性质大多体现了整数的性质
Farey 序列 Fn 表示将 [0,1] 之间的分母不超过 n 的所有最简分数按数值升序排列得到的序列,例如:
F5=10,51,41,31,52,21,53,32,43,54,11
根据定义,分数 kh∈Fn 的条件是
0≤h≤k≤n,(h,k)=1
Farey 序列最基本的性质如下:
Theorem 28
如果 kh,k′h′ 是 Fn 中相邻的两项,那么有
kh′−hk′=1
Theorem 29
如果 kh,k′′h′′,k′h′ 是 Fn 中相邻的三项,那么有
k′′h′′=k+k′h+h′
我们随后会证明这两个定理是等价的,并且给出它们的三个证明
在此之前,我们先来证明两个关于 Fn 的更为简单的性质
Theorem 30
如果 kh,k′h′ 是 Fn 中相邻的两项,那么有
k+k′>n
我们发现
kh<k+k′h+h′<k′h′
如果 k+k′≤n,那么这两项之间存在另一个数,不可能相邻,证毕
Theorem 31
Fn(n>1) 中没有两个相邻的数拥有相同的分母
假设 kh,kh′(k>1) 是相邻的两项,那么 h+1≤h′<k,故有
kh<k−1h<kh+1≤kh′
那么 k−1h 在两项之间,与相邻矛盾,证毕
2、The equivalence between Theorem 28 and 29(两定理间的等价性)
我们现在来证明 Theorem 28 和 Theorem 29 的等价性
(1)Theorem 28 ⇒ Theorem 29
对于 Fn 中相邻的三项 kh,k′′h′′,k′h′,根据 Theorem 28,我们有
{kh′′−hk′′=1k′′h′−h′′k′=1⇒{h′′=kh′−hk′h+h′k′′=kh′−hk′k+k′
相除即得到 Theorem 29
(2)Theorem 29 ⇒ Theorem 28
我们假设 Theorem 28 对于 Fn−1 成立,且有相邻的两项 kh,k′h′∈Fn−1
那么 Fn 相当于在 Fn−1 中插入了
n1,n2,⋯,nn−1
且由 Theorem 31,kh,k′h′ 之间最多插入了一个数
如果没有插入数,那么不改变原有的性质,Theorem 28 照样成立
如果插入了数,不妨设这个数为 k′′h′′(k′′=n),由 Theorem 29 ,
k′′h′′=k+k′h+h′
不妨设
{h′′=λ(h+h′)k′′=λ(k+k′)(λ为整数)
由 Theorem 30,k′+k>n−1,故
λ=k′+kk′′≤nn=1
所以 λ=1,即
{h′′=h+h′k′′=k+k′
因此
kh′′−hk′′=k(h+h′)−h(k+k′)=kh′−hk′=1
k′′h′−h′′k′=h′(k+k′)−k′(h+h′)=kh′−hk′=1
由数学归纳法即可得证
我们沿用上面的方法,使用数学归纳法来证明 Theorem 28
当 n=1 时,即对 F1 定理显然成立
假设定理对 Fn−1 成立,假设 kh,k′h′ 是 Fn−1 中相邻的两项
且 k′′h′′ 是生成 Fn 时插入这两项之间的分数,设
{r=kh′′−hk′′>0s=k′′h′−h′′k′>0
结合 kh′−hk′=1 解出
{h′′=sh+rh′k′′=sk+rk′
并且由于 (h′′,k′′)=1,所以 (r,s)=1
考虑由下列分数组成的集合 S:
KH=μk+λk′μh+λh′
这里 λ,μ 是正整数且 (λ,μ)=1,显然 k′′h′′∈S,且 S 中的每一个分数都在 (kh,k′h′) 之间
由于
{k(μh+λh′)−h(μk+λk′)=λh′(μk+λk′)−k′(μh+λh′)=μ
根据 Theorem 25 可知
(H,K)∣λ,(H,K)∣μ
而 (λ,μ)=1,故 (H,K)=1,即 S 中的所有分数都是最简分数
原文中最简分数的英文表述(令我费解了好久):The fraction is in its lowest terms
因此 KH 首次出现是在 FK 中,故 S 中的分数按出现顺序排序前三项为
kh,k′h′,k+k′h+h′
所以在 kh,k′h′ 之间的数必为 k+k′h+h′,这样就证明了 Theorem 29,证毕
下面我们介绍一种不是归纳性质的证明方法
通过该方法,我们可以能解决求 kh 在 Fn 中的后继(后面一项)的方法
设 kh∈Fn,由于 (h,k)=1,根据 Theorem 25,方程
kx−hy=1
有整数解,若 x0,y0 是该方程的解,那么
x0+rh,y0+rk(r∈Z)
也是该方程的解,我们可以钦定一个 r 值使得
n−k<y0+rk≤n
因此方程存在一个解 (x,y) 满足
(x,y)=1,0≤n−k<y≤n
由于 yx 是最简分数,且 y≤n,因此 yx∈Fn,且有
yx=ky1+hy=kh+ky1>kh
所以 yx 在 Fn 中的出现位置在 kh 之后
假设 yx 不是我们所求的后继 k′h′,那么 yx 必在 k′h′之后,故有
yx−k′h′=k′yk′x−h′y≥k′y1
k′h′−kh=kk′kh′−hk′≥kk′1
因此
ky1=yx−kh≥k′y1+kk′1=kk′yk+y>kk′yn≥ky1
这样就导出了一个矛盾式,所以假设不成立,即我们求出的 yx 就是 kh 在 Fn 中的后继
(感觉我可以把这个出到 OI/ACM 中,又是一道毒瘤题)
我们的第三种证明是基于一个重要的几何学方法
如下图所示:
假设我们在平面中给出了原点 O,以及不与 O 三点共线的两点 P,Q
我们作平行四边形 OPQR,把它的边无限延长,然后作等距的平行线,这样整个平面被分割成了无穷多个相同的平行四边形
我们把这样的图形称为 lattice(网格)
一个网格是由若干条直线组成的图形,它确定了若干个点,即直线两两确定的交点
这些交点组成的系统称为 point-lattice(点阵),点阵中的点我们称为 lattice point(格点)
两个不同的网格可以确定同一个点阵,例如在上图中,网格 OP,OQ 与网格 OP,OR 确定的点阵是相同的
确定同一个点阵的两个网格我们称之为 equivalent(等价)
特别地,如果 OP⊥OP 且 OP=OQ=1,即平面被分割成了单位正方形
那么这种网格称为 fundamental lattice(常用网格),记做 L
常用网格确定的点阵称为 fundamental point-lattice(常用点阵),记做 Λ
值得一提的是,网格上每一个点都可以看成原点,原点的选择与网格的性质是独立的
确定原点之后,我们可以写出点阵中每一个格点的坐标,它们都是整数
点阵可以看作数或向量的运算系统,这个系统满足模系统的要求
如果 P(x1,y1),Q(x2,y2) 是点阵中的点,那么点阵中其它的点 (x,y) 可以表示为
{x=mx1+nx2y=my1+ny2(m,n∈Z)
(1)我们考虑变换
x′=ax+by,y′=cx+dy
其中 a,b,c,z∈Z且ad−bc=0,那么 Λ 中的点 (x,y) 变换为了 Λ 的另一个点 (x′,y′)
我们解出 x,y 得到
x=ad−bcdx′−by′,y=−ad−bccx′−ay′
若
Δ=∣∣∣∣∣acbd∣∣∣∣∣=ad−bc=±1
那么所有 Λ 中的点 (x′,y′) 都能由 (x,y) 变换得到
也就是说,变换前的点 (x,y) 与变换后的点 (x′,y′) 一一对应
我们把这样的情况称为 Λ 的自身变换
反过来,如果 Λ 的变换为自身变换,那么每一个 (x′,y′) 必须有一个 (x,y) 与之对应
取 (x′,y′) 的两个特殊点 (1,0),(0,1),得到
Δ∣a,Δ∣b,Δ∣c,Δ∣d
故有
Δ2∣ad−bc,Δ2∣Δ
因此 Δ=±1,这样我们就得到了下述定理
Theorem 32
Λ 的变换为自身变换的充要条件是
Δ=ad−bc=±1
我们把这样的变换称为 unimodular(单模变换)
(2)考虑 Λ 中的不与原点共线的两点 P(a,c),Q(b,d),那么 OP,OQ 确定的平行四边形的面积为
δ=∣ad−bc∣
考虑变换
x′=ax+by,y′=cx+dy
变换后的网格就是由 OP,OQ 生成的网格
变换后的 Λ′ 中的点为 (x′,y′),那么 Λ=Λ′ 的条件就是 δ=1
Theorem 33
由 OP,OQ 生成的网格 L′ 与 常用网格 L 等价的充要条件是 OP,OQ 确定的平行四边形面积 δ=1
(3)设 P∈Λ,若 OP 间不存在其它的 Λ 中的点,那么称 P 为 visible(可视的)
显然如果 (x,y) 是可视的点,那么 yx 必定是最简分数,即 (x,y)=1
Theorem 34
设 P,Q 是 Λ 中的两个可视的点,OP,OQ 确定的平行四边形 J 的面积为 δ
(1)若 δ=1,则 J 内部不存在 Λ 中的点
(2)若 δ>1,则 J 内部至少有一个 Λ 中的点,如果该点不是对角线的交点,则至少存在两个
这几种情况如下图所示:
设 OP,OQ 生成的网格为 L′,对应的点阵为 Λ′
若 δ=1,L′ 与 L 等价,Λ=Λ′,故 J 内部不存在点
若 δ>1,L′ 与 L 不等价,Λ′ 中的点少于 Λ,故 J 内部至少存在一点,若该点不是对角线交点,则三角形 OPQ 与 PQR 内部各有一点
设分数 kh∈Fn,那么
0≤k≤h≤n,(h,k)=1
那么 kh 表示 Λ 中区域 ⎩⎪⎨⎪⎧y≥0x≤yx≤n 中的可视点
我们从原点 O 作一条射线,将其从 x 轴开始逆时针旋转
射线的斜率就是射线上的点表示的分数的值,逆时针旋转保证了射线斜率递增
故射线扫过的点表示的分数值是递增的
当射线先后扫过两个可视点 (k,h),(k′,h′) 时,这两个分数在 Fn 中是相邻的
且确定的平行四边形内部没有可视点,故由 Theorem 34
δ=kh′−hk′=1
证毕,这种证明方法将 Fn 用几何图形直观地表示了出来,更显本质
我们常用圆环来表示实数,而不是直线,目的是消除首位关系的影响
在圆环上确定一个原点 O 表示 0,用点 Px 表示实数 x,点到原点的距离表示数的大小
现在我们考虑法里序列 Fn,以及所有邻项 kh,k′h′ 的 mediant(中间值)
μ=k+k′h+h′
第一个中间值和最后一个中间值分别为
1+n0+1=n+11,n+1n−1+1=n+1n
我们现在用点 Pμ 表示中间值 μ,那么圆环被这些点分割成了若干条弧
这些弧我们称为 Farey arcs(法里弧)
每一段法里弧表示 Fn 的一项,该项在弧上的位置称为 Farey point(法里点)
显然,弧 (n+1n,n+11) 包含了法里点 O
这个分割法里弧的过程我们就称为 Farey dissection(法里分割)
现在我们假设 n>1,Pkh 是一个法里点,且 k1h1,k2h2 分别是其在 Fn 中的前一项与后一项
那么包含 Pkh 的法里弧被 Pkh 分成了两部分,长度分别为
{D1=kh−k+k1h+h1=k(k+k1)1D2=k+k2h+h2−kh=k(k+k2)1
由 Theorem 31 与 Theorem 30 可知
n<k+k1<2n
因此我们得到了下述定理
Theorem 35
对于 Fn(n>1) 的法里分割,包含 kh 的法里弧被该法里点分成的两部分长度在 k(2n−1)1 与 k(n+1)1 之间
事实上,法里分割的重要性在于其拥有某种 uniformity(统一性)
接下来,我们用法里分割来证明一个实数有理估值方面的定理,而且我们在第十一章会继续深入探讨这个话题
Theorem 36
若 ξ 是任一实数,n 是正整数,那么存在一个最简分数 kh 满足
0<k≤n,∣ξ−kh∣≤k(n+1)1
不妨设 ξ∈(0,1),那么 ξ 位于 Fn 中的两项 kh,k′h′ 之间
即 ξ 位于下面两区间之一:
(kh,k+k′h+h′),(k+k′h+h′,k′h′)
这两个区间都是一段法里弧被法里点分成的两部分中的一个
因此根据 Theorem 35,其区间长度都小于 k(n+1)1,所以分数 kh,k′h′ 中必有一个满足要求
如果 P,Q∈Λ,P′,Q′ 是P,Q 关于原点的对称点
那么 OP,OP′ 与 OQ,OQ′ 两两生成了四个平行四边形,我们把这四个平行四边形合在一起组成了一个大平行四边形 K,其中心是原点 O,面积是 4δ
若 δ=1,那么 K 内部除了 O 以外没有其它 Λ 中的点
若 δ>1,那么 K 内部除了 O 以外存在其它 Λ 中的点
这是闵可夫斯基定理的一个特殊情况,事实上,上述内容不仅对于平行四边形成立,对于任何关于原点对称的 convex region(凸区域) 都成立
想必诸位读者看到凸区域这个名词会一脸懵逼,我们先来介绍一点基础知识
满足下列条件的点集 R 称为 open region(开区域):
(1)若 P∈R,那么与 P 充分近的点都在 R 内
(2)R 中的任意两点都能被一条完全在 R 内的连续曲线连接起来
从定义可以看出,圆的内部区域以及平行四边形的内部区域都是开区域
R 的 boundary(边界) C 指的是 R 中的极限点组成的点集,但是这些点本身不属于 R
因此,圆的边界就是圆周
开区域 R 加上它的边界组成的点集就是 closed region(闭区域),记做 R∗
注意:以上的定义中我们仅考虑有界区域
convex region(凸区域) 的定义有两种,它们是等价的
(1)如果 R 中的所有弦(连接 R 内两点的线段)上的任意一点都属于 R,那么 R 就是凸区域
(2)如果 R 边界上的所有点都能引一条直线 l 使得 R 仅位于直线 l 的一侧,那么 R 就是凸区域
由定义可知,圆和平行四边形都是凸区域
证明两种定义的等价性并不困难
(1)若 R 是由第二种定义确定的凸区域
假设 P,Q∈R,且直线 P,Q 上一点 S∈/R,那么边界上存在一点 T 在线段 PS 上
由于过 T 存在直线 l 使得 R 仅位于直线一侧,但是 l 必然与线段 PQ 相交
P,Q 两点及与距它们充分近的点不可能被划分到同一侧,这就矛盾了
(2)若 R 是由第一种定义确定的凸区域
假设 P 是边界上任意一点,且 R 中所有弦的集合记为 L
那么以 P 为顶点,存在一个尽量小的角 ∠APB 使得 L 中的所有线段都在 ∠APB 内部
若 ∠APB>π,则边界上存在两点 D,E 使得 P 位于线段 DE 上,这与 P 在边界上矛盾
若 ∠APB=π,那么 APB 共线,该直线满足条件
若 ∠APB<π,那么任何过点 P 且不经过 ∠APB 内部的直线满足条件
这样我们就证明了两个定义是等价的
而且现已证明,变换或放缩不改变区域的凸性
Theorem 37(闵可夫斯基定理)
任何面积大于 4 且关于原点对称的凸区域 R,其内部除了 O 还有其他 Λ 中的点
首先我们先来证明一个更为简单的定理
Theorem 38
设 RO 是包含原点 O 的一个开区域,P 是 Λ 中的任意点,RP 表示将 RO 沿线段 OP 平移至 P 点的区域,如果所有的 RP 及 RO 两两没有重叠区域,那么 RO 的面积 Δ≤1
如果 RO 是一个以 x=±21,y=±21 为边界的方形区域,那么该定理显然成立
更一般的,设 RO 的面积为 Δ,A 表示 RO 边界上的点到 O 的最大距离
我们考虑 Λ 中所有横纵坐标绝对值不超过 n 的点 P,以及对应的 (2n+1)2 个 RP
我们发现这些区域不会超出以 O 为中心边长为 2(n+A) 的正方形区域,因此
(2n+1)2Δ≤(2n+2A)2
得到
Δ≤(1+n+21A−21)2
令 n→∞,即 Δ≤1,证毕
值得一提的是,Theorem 38 对区域的凸性与对称性没有要求
接下来是时候证明闵可夫斯基定理了,基于凸性的两种定义,他本人给出了两种证明
(1)采用第一定义,设 RO 是 R 关于 O 点的 21 倍线性放缩,那么 RO 的面积大于 1,根据 Theorem 38,存在 RP 与 RO 有重叠部分,如图所示:
设 Q 是重叠区域中的一点,作 Q′ 使得 OQ′ 平行且等于 PQ
由于 RO 与 PP 全等,所以 Q′∈RO
作 Q′ 关于 O 的对称点 Q′′,由区域的对称性,Q′′∈RO
由凸性第一定义,QQ′′ 的中点必在 RO 中
而这个中点同时也是 OP 的中点,那么还原放缩后得到 P∈R,证毕
(2)采用第二定义,假设 R 中除了 O 外没有其它格点,我们把 R 关于 O 点线性放缩,直至一格点 P 出现在边界上,放缩后的区域记作 R′,如图所示:
由凸性第二定义,过点 P 存在一条直线 l′ 使得 R′ 仅位于 l′ 一侧
将 R′ 关于 O 点作 21 倍线性放缩得到 RO,那么过 OP 中点存在一条直线 l//l′ 把 RO,RP 置于 l 两侧,因此 RO,RP 没有重叠部分
而 RO 的面积大于 1,这与 Theorem 38 矛盾,证毕
除了闵可夫斯基本人给出的证明,还有其它的有趣的可供选择的证明,其中最为简单的一个应该是 Mordell(莫德尔) 给出的证明
(3)设 R 是关于 O 对称的凸区域,P1(x1,y1),P2(x2,y2)∈R,设 P2 关于 O 的对称点为 P2′(−x2,−y2),那么 P1P2′ 中点 M(21(x1−x2),21(y1−y2)),且 M∈R
我们假设有无限多条直线 x=t2p,y=t2q,其中 p,q 是任意整数,t 是可以变化的参数
这些直线把平面分成了无限多个正方形,每个正方形面积为 t24,顶点坐标为 (t2p,t2q)
设 N(t) 表示位于区域 R 内的顶点个数,A 表示区域 R 的面积,那么显然有
t→∞limt24N(t)=A
若 A>4,那么对于足够大的 t,有 N(t)>t2,由于数对 (x,y) 除以 t 的余数数对 (x%t,y%t) 最多有 t2 对,根据鸽巢原理,R 中存在两点 P1(t2p1,t2q1),P2(t2p2,t2q2) 使得
t∣(p1−p2),t∣(q1−q2)
因此 P1,P2 对应的点 M(tp1−p2,tq1−q2)∈Λ,证毕
值得一提的是,该证明属于构造性证明,不依赖于 Theorem 38,因此更为精妙
我们把 Theorem 37 推广到任意网格上,得到的结果将会在第二十四章用到
之前我们研究的都是常用网格 L 及常用点阵 Λ 的性质,接下来我们把这些性质推广到一般的网格 L′ 及对应点阵 Λ′,假设 L′ 由 OP,OQ 生成,我们把其确定的平行四边形 OPRQ 称为 fundamental parallelogram(基平行四边形),那么推广如下:
(1)我们以 OP,OQ 为轴建立笛卡尔斜坐标系,且 P(1,0),Q(0,1),那么对应的基平行四边形面积记作
δ=∣OP∣∣OQ∣sinω
其中 ω 是 OP,OQ 的夹角,那么用和之前同样的方法可以证明:
Theorem 39
Λ′ 的变换为自身变换的充要条件为 Δ=±1
Theorem 40
设 Λ′ 中的两点 P,Q,那么 OP,OQ 生成的网格 L′′ 与 L′ 等价的充要条件是 O,P,Q 确定的平行四边形的面积等于 Λ′ 中基平行四边形的面积
(2)变换
x′=ax+by,y′=cx+dy
(其中a,b,c,d是任意实数)将常用网格 L 变换为了由 O,(a,c),(b,d) 三点生成的网格
我们考察该变换的性质,设变换前的一个三角形 P1(x1,y1),P2(x2,y2),P3(x3,y3),其面积为
±21∣∣∣∣∣∣∣x1x2x3y1y2y3111∣∣∣∣∣∣∣
变换之后其面积为
±21∣∣∣∣∣∣∣ax1+by1ax2+by2ax3+by3cx1+dy1cx2+dy2cx3+dy3111∣∣∣∣∣∣∣=±21(ad−bc)∣∣∣∣∣∣∣x1x2x3y1y2y3111∣∣∣∣∣∣∣
我们发现变换后面积乘上了一个常数因子 ∣ad−bc∣,事实上不仅是三角形区域,任意形状的一个区域面积变化都是如此(用微积分的思想很容易证明)
因此,我们可以推广常用网格在线性变换中的性质,Theorem 38 的推广如下
Theorem 41
设 Λ′ 是以 O 为原点的任意点阵,RO 满足 Theorem 38 中的条件,那么 RO 的面积 Δ 不超过基平行四边形的面积 δ
我们从头开始再次详细地证明这个定理,假设直线
x=±n,y=±n
注意,由于我们建立的是斜坐标系,因此这四条直线确定了一个大平行四边形,其面积为 4n2δ,内部及边界上含有 (2n+1)2 个格点
同样设 (x,y) 是 RO 边界上一点,定义
A=max(∣x∣,∣y∣)
注意这里 A 的定义与 Theorem 38 中的定义有异曲同工之妙
我们考虑这些格点对应的区域 RP,它们全部位于由直线
x=±(n+A),y=±(n+A)
确定的平行四边形内部,这个平行四边形面积为 4(n+A)2δ
故我们有不等式
(2n+1)2Δ⩽4(n+A)2δ,Δ≤2n+12n+2Aδ
令 n→∞ 得到
Δ⩽δ
接下来我们需要考虑边界情况 Δ=δ,假设 RO 是平行四边形区域,由此得到的结论可满足第二十四章的要求
我们定义 L′ 中的两个点 (x,y),(x′,y′) 等价(不一定是格点)当且仅当这两个点在对应的平行四边形中有相同的位置
具体一点,设 P(x1,y1),Q(x2,y2),由 OP,OQ 生成的网格 L′ 中两点 (x,y),(x′,y′) 等价的条件是(r,s∈Z)
x′−x=rx1+sx2,y′−y=ry1+sy2
很容易发现,所有的格点都等价,据此,我们有
Theorem 42
如果 RO 是平行四边形,且面积 Δ=δ,且 RO 内部不存在两个等价点,那么对于平面上任意一点, RO 及其边界上必定存在一点与之等价
RO 内部不存在等价点的条件意味着不存在两个 RP 相交
我们把闭区域记为 RP∗,那么结论意味着所有的 RP∗ 覆盖了整个平面
因此我们要证明的东西就是:
如果 Δ=δ 且所有的 RP 都不相交,那么所有的 RP∗ 覆盖了整个平面
假设定理不成立,即存在一个 Q 不在任何一个 RP∗ 内,那么对于 Q 所在的平行四边形中存在区域 D 不属于任何 RP∗,设其面积为 η
在 L′ 中所有的平行四边形中,都有一个与 D 全等的区域
因此所有 RP∗ 的面积不超过
4(δ−η)(n+A+1)2
即
(2n+1)2δ⩽4(δ−η)(n+A+1)2
令 n→∞ 得到:
δ⩽δ−η
这显然是一个矛盾式,证毕
最后,值得一提的是所有的这些定理都可以推广到更高维的空间,我们第二十四章会谈到