On Lattices, Learning with Errors, Random Linear Codes, and Cryptography

是什么

On Lattices, Learning with Errors, Random Linear Codes, and Cryptography 提出：LWE 困难性归约：格密码现代基石。

日常类比：像把最难的锁匠题变成普遍随机线性方程，大家都解不动。

读论文时先抓「威胁模型/假设→核心构造→复杂度/开销」三件事。

为什么重要

Kyber/Dilithium 安全根
后量子密码必修
链 bos-kyber-2018
FHE 噪声假设

核心要点

问题设定：作者要解决什么不可能三角（安全/性能/易用）。
关键技巧：一个构造或定理把难题拆成可实现步骤。
安全假设：信任根、敌手能力、失败概率。
工程映射：开源库与 RFC 如何落地论文思想。
局限：已知攻击面、参数选取、未来工作。

核心算法细节

LWE 问题定义

搜索 LWE：给定 m 个样本 (a_i, b_i) 其中 b_i = <a_i, s> + e_i mod q，恢复秘密向量 s in Z_q^n。

判定 LWE：区分 LWE 样本与均匀随机样本 (a_i, u_i)（u_i 均匀分布在 Z_q）。

参数说明：

n：维数（安全参数），通常 512-2048
q：模数，通常 O(n^2) 量级的素数
e_i：误差，从离散高斯分布 D_{Z,alpha*q} 采样，alpha 为噪声率（通常 1/sqrt(n) 量级）

Worst-case to Average-case 归约

Regev 的核心贡献是证明：随机 LWE 实例的困难性 可以归约到格上最坏情况的困难问题（GapSVP 和 SIVP）。

具体地：若存在算法在随机 LWE 上以不可忽略概率成功，则存在量子算法在任意 n 维格上高效解决 GapSVP（间隙最短向量问题）。这意味着：

“破解 LWE” 等价于 “解最坏格问题” —— 量子计算机也无法高效完成

这种最坏情况-平均情况归约是格密码安全性的核心依据，而非基于具体实例的启发式假设。与 RSA/ECC 的困难性假设相比，LWE 有更坚实的理论支撑。

离散高斯分布与采样

误差分布 D_{Z^n, sigma} 的概率质量函数正比于 exp(-||x||^2 / (2*sigma^2))，采样通常使用 Knuth-Yao 算法或 CDT（Cumulative Distribution Table）：

# 离散高斯采样示意（sigma = q * alpha）
def sample_discrete_gaussian(sigma, bound=6):
    while True:
        x = random.randint(-bound*int(sigma), bound*int(sigma))
        import math
        if random.random() < math.exp(-x**2 / (2*sigma**2)):
            return x

实现注意：采样必须使用恒定时间算法，防止 timing 侧信道攻击泄漏误差信息。

Ring-LWE 扩展

Lyubashevsky-Peikert-Regev（2010）将 LWE 推广到多项式环 R_q = Z_q[x]/(x^n+1)，即 Ring-LWE：

样本形如 (a, b = a*s + e) in R_q × R_q
密钥/误差为多项式，每次操作处理 n 个系数
安全性归约到 RLWE 困难性（可归约到理想格上的 SIVP）
性能提升 n 倍：单次 NTT（数论变换）替代矩阵乘，复杂度从 O(n^2) 降到 O(n log n)

CRYSTALS-Kyber（NIST PQC 标准 KEM）和 CRYSTALS-Dilithium（签名）均基于 Module-LWE，介于 LWE 和 RLWE 之间。

量子攻击下的参数选取

针对 LWE 的最佳已知攻击是 BKZ 算法（格基规约），量子加速后复杂度约为 2^{0.265*beta}（经典：2^{0.292*beta}）。NIST PQC 安全等级与推荐参数：

安全等级	经典安全	量子安全	Kyber 参数
Level 1	AES-128	128 量子位	n=256, k=2, q=3329
Level 3	AES-192	192 量子位	n=256, k=3, q=3329
Level 5	AES-256	256 量子位	n=256, k=4, q=3329

LWE 加密方案构造

基于 LWE 的 Regev 公钥加密：

密钥生成：随机矩阵 A，秘密 s，误差 e，公钥 = (A, b = As + e)
加密 1-bit 消息 m：随机子集和 u = A^T r，v = b^T r + m*floor(q/2)
解密：计算 v - s^T u ≈ m*floor(q/2) + small_error，根据与 0 或 q/2 的距离判断 m

工程实现要点

NTT 友好模数：Kyber 选 q=3329（= 2^8 * 13 + 1），满足 NTT 友好条件（存在 2n 次本原单位根），可用蝴蝶运算高效实现。
常数时间实现：所有操作须避免依赖秘密数据的条件分支，防止 timing 攻击。参考 SUPERCOP 中的汇编实现。
压缩与解压：Kyber 对密文多项式系数做有损压缩（丢弃低位），减少传输开销，需仔细分析噪声预算是否仍满足正确性。
混合加密：LWE/Kyber 仅用于封装 AES 密钥（KEM 模式），实际数据用 AES-256-GCM 加密，避免直接在格上加密大数据。

实践案例

案例 1：画威胁模型表

列：资产、敌手、能力、目标；对照论文假设勾选覆盖项。

案例 2：找开源实现

# 搜索论文标题 + library 名称，读 README 的 security note

案例 3：与邻居论文对照

阅读 bos-kyber-2018，画时间线：哪篇解决 setup/性能/证明长度。

案例 4：面试复述

用「类比 + 三要点」在 2 分钟内讲清；准备一条「为什么不用更简单方案」。

案例 5：与双千 atlas 交叉阅读

在 papers-atlas 找同子类 1 篇，对比实践案例是否覆盖实验/参数/失败模式。

踩过的坑

把理想模型当产品默认：论文参数在工业界常被放宽。
忽略组合开销：多个原语组合时安全界不是简单相加。
误读实验规模：小数据集上的 ε 不可直接外推。
混淆相似缩写：如 DP/LDP、SNARK/STARK 场景不同。
行数与模板：交付前用 quality-gate 扫一遍。

适用 vs 不适用场景

适用：

安全/系统/architecture 面试深挖
选型隐私或密码组件前的理论扫盲
读源码前的概念地图

不适用：

不做威胁建模直接上生产
替代官方标准文本（FIPS/RFC）
数学证明细节（请读原文附录）

历史小故事（可跳过）

论文常是多年社区实践的第一次形式化。
标准机构（NIST/IETF）往往在论文后收敛算法名。
开源实现与论文版本存在参数漂移，以 release 为准。
近年与 ML、TEE、区块链场景强交叉。

学到什么

安全方案先问威胁模型，再问漂亮数学。
工程落地看常量与实现漏洞，不只看渐近复杂度。
论文链式阅读比单篇精读更高效。
与站内 neighbors 互链能形成可复习的知识图。

关联

bos-kyber-2018 —— 同路线前后文
ducas-dilithium-2018 —— 同路线前后文
brakerski-bgv-2012 —— 同路线前后文

维护备注

引用格式保持单引号包裹 来源 字段。

反向链接

bohme-aflfast-2016 —— AFLFast — 灰盒 Fuzz 的马尔可夫调度
bos-kyber-2018 —— CRYSTALS-Kyber: A CCA-Secure Module-Lattice-Based KEM
brakerski-bgv-2012 —— Fully Homomorphic Encryption without Bootstrapping
cadar-klee-2008 —— KLEE — 符号执行自动生成高覆盖测试
ducas-dilithium-2018 —— CRYSTALS-Dilithium — 量子计算机来了也签不掉的数字签名
gentry-fhe-2009 —— Gentry FHE — 全同态加密开山