跳转到内容

论文全景索引

本页由 scripts/regen-atlas.mjs 自动生成(每次 build 前重跑)。 分类 SSOT:data/taxonomy.json + 各笔记 frontmatter 分类 / 子分类。批量更新:node scripts/classify-notes.mjs --apply

总览

  • 总数:948 篇
  • 已分类:948

按一级主题分布

主题数量
编程语言109
分布式系统75
数据库67
操作系统63
机器学习215
后端 API9
基础设施12
网络协议66
图形学122
形式化方法51
通信1
信息检索52
Agent22
CLI1
NLP9
编译器3
数据可视化4
安全与隐私54
其他13

编程语言

共 109 篇。

编程语言

论文质量描述
Adapton — 增量计算✅ v3
ALGOL 60 — BNF 与块结构🗄 存量
双向类型检查 — 推断和检查两个方向交替前进✅ v3
DSPy — 把 prompt 写成签名,让编译器替你调✅ v3
代数效应(Algebraic Effects)✅ v3
Generational GC — 把全堆扫描换成”频繁扫小区,偶尔扫整堆”✅ v3
Hindley-Milner — 编译器自己猜变量类型🗄 存量
McCarthy LISP 1960✅ v3
Push-Pull FRP — Functional Reactive Programming 实用化✅ v3
Salsa / Adapton — 让程序只重算”真的变了”的那一小块✅ v3
Self-Adjusting Computation — 输入小幅变化时只重算受影响的那部分✅ v3
SIMULA 67 — 面向对象的诞生🗄 存量
Smalltalk-80✅ v3
Standard ML — 让编译器替你把类型补完✅ v3
Tofte-Talpin Regions — 让类型系统替你管内存生命周期✅ v3
Trees that Grow — 可扩展的语法树设计✅ v3
Wadler Prettier — 函数式优雅打印器✅ v3
ZGC — 让 GC 停顿与堆大小解耦的低延迟回收器✅ v3

计算理论

论文质量描述
Cook-Levin 定理 — NP-完全性的诞生✅ v3
Karp 21 — 21 个 NP-完全问题✅ v3
Turing 1936 可计算性✅ v3

类型与 PL 理论

论文质量描述
Agda — 让你写代码的同时把数学也证明了✅ v3
Andersen 指针分析 — 让编译器自己算出 p 可能指向谁✅ v3
ASTRÉE 分析器 — 让飞机控制代码的静态分析做到零警告✅ v3
CakeML — 从源码到机器码每一步都被数学证明的 ML 编译器✅ v3
Calculus of Constructions — 让程序和数学证明共用一种语言✅ v3
Call-by-Need Lambda Calculus — 给惰性求值一套真正的演算✅ v3
Chaitin 图染色寄存器分配 — 把硬件资源问题翻译成数学问题✅ v3
Coeffects — 让类型系统追踪「需要多少上下文」✅ v3
CompCert — 每条优化都被数学证明保持语义的 C 编译器✅ v3
Cousot 抽象解释 — 给静态分析一套统一数学框架✅ v3
CSP — 进程之间只许喊话不许共用内存✅ v3
DDlog (Differential Datalog) — 输入只改一条,引擎只算受影响的那一小块✅ v3
Doligez-Leroy GC — OCaml 多线程并发垃圾回收✅ v3
Earley Parser — 一个表能解析任何 CFG 的通用解析器✅ v3
Feautrier 多面体调度 — 把循环并行化变成解几何方程✅ v3
Frank — 让 effect handler 写得就像普通函数✅ v3
F* — 把依赖类型、SMT 自动化、副作用追踪揉到一门语言里✅ v3
G1 Garbage-First — 给暂停时间设个预算的垃圾回收器✅ v3
GADT — 让构造子告诉编译器”我返回的是更精确的类型”✅ v3
博弈论语义与 PCF — 把程序解释成两个人轮流下的对话棋✅ v3
GraalVM Truffle — 写一棵会自我特化的语法树就能自动得到 JIT✅ v3
渐进类型 — 让动态和静态类型在同一份代码里共存✅ v3
Granule — 让类型系统同时数次数、看安全级、追副作用✅ v3
Halide — 把”算什么”和”怎么算”分开写✅ v3
Helium — 让类型错误说人话的教学版 Haskell✅ v3
Herlihy-Moss 事务内存 — 把数据库事务搬进 CPU✅ v3
Hewitt Actor 模型 — 把计算拆成一群只会发消息的小邮筒✅ v3
HotSpot Server Compiler — JVM 在运行时把热点 Java 代码翻译成飞快的本地码✅ v3
Why FP Matters — 函数式真正赢在能拆能粘✅ v3
Idris — 让依赖类型从证明助理变成通用编程语言✅ v3
Immix — 把”扫”和”搬”两种垃圾回收揉成一个✅ v3
Bi-Abduction — 让静态分析自动猜出函数缺什么前提✅ v3
Kahn 自然语义 — 用一棵推理树说清楚程序求值✅ v3
Kildall 数据流框架 — 用一套格论统一所有全局编译优化✅ v3
Knuth LR(k) — 编译器自己读懂语法的算法✅ v3
DeRemer LALR(1) — 把 LR 表压到能用大小✅ v3
Landin SECD — 第一台机械求值 lambda 表达式的抽象机器✅ v3
Lean 4 — 用 Lean 重写的 Lean,让数学家和程序员共用一种语言✅ v3
Lean Tactics — 让证明助手把”写证明”当成写程序✅ v3
Lerner 组合数据流 — 让小优化互相喂招✅ v3
Lieberman-Hewitt 1983 — 把对象寿命统计偏斜兑换成有界停顿✅ v3
Linear Scan 寄存器分配 — 把图染色换成单趟扫描,给 JIT 用✅ v3
线性类型(Linear Types)✅ v3
Liquid Types — 让编译器自己推导出”哪些值才合法”✅ v3
Local Type Inference — 编译器只看相邻节点也能推出类型✅ v3
Martin-Löf 直觉主义类型论 — 让”证明”和”程序”变成同一件事✅ v3
MetaML — 让你显式地写”先生成代码、再跑代码”✅ v3
π-演算 — 让通道名本身能在通道里流动✅ v3
MLIR — 给编译器一套乐高,每层抽象都能搭自己的方言✅ v3
Mycroft 严格性分析 — 编译器替你判定哪些参数能”先算”✅ v3
Jones-Gomard-Sestoft 1993 — Partial Evaluation 与自动程序生成✅ v3
PEG / Packrat — 用’有序选择’+‘记忆化’写线性时间解析器✅ v3
Peyton Jones STG — 让 Haskell 的 lazy 在普通 CPU 上跑得快✅ v3
Plotkin SOS — 用规则讲清楚程序”走一步”是什么✅ v3
Pottier LR(1) Reachability — 让 LR 解析器的错误消息覆盖完整✅ v3
Prolog 的诞生 — 让逻辑式子直接当程序跑✅ v3
PyPy meta-tracing JIT — 给解释器加一次 JIT,所有用它的语言一起加速✅ v3
Refinement Types for ML — 让程序员告诉编译器”哪些子集才合法”✅ v3
Reps-Horwitz-Sagiv IFDS — 把跨过程分析变成图上找路✅ v3
Reynolds Definitional Interpreters — 用一种语言去定义另一种语言✅ v3
Separation Logic — 把 Hoare 逻辑扩到带指针的程序✅ v3
Row Polymorphism — 让记录类型可扩展又不丢类型安全✅ v3
Sagiv 参数化形状分析 — 用三值逻辑证明链表树仍是链表树✅ v3
Scala Macros — 让 Scala 在编译期把方法调用替换成任意代码✅ v3
Scott-Strachey 指称语义 — 给程序找一个独立于实现的数学含义✅ v3
SELF Customization — 给每种”调用者类型”现场打一份方法✅ v3
SLAM — 让 Windows 驱动 bug 自己撞到工具上✅ v3
Soufflé — 把 Datalog 编译成 C++ 让程序分析跑得动✅ v3
Steensgaard 指针分析 — 用等价合并把指针分析压到几乎线性✅ v3
STM Shavit-Touitou — 把”加锁”改成”事务”的源头✅ v3
Strongtalk — 可以装可以卸的 Smalltalk 类型系统✅ v3
System F — 让类型也能像参数一样被传递✅ v3
Template Haskell — 让 Haskell 在编译期把代码当数据玩✅ v3
Theorems for Free — 类型签名直接给定理✅ v3
Tomita GLR — 让 LR 解析器扛得住歧义文法✅ v3
TraceMonkey — 只编”真的走过的那一条路”✅ v3
Triton — 让 Python 程序员也能写出贴近 cuBLAS 的 GPU kernel✅ v3
Turchin Supercompilation — 让编译器把程序模拟一遍再写回去✅ v3
TVM — 让一份模型能在所有硬件上跑得快✅ v3
Vellvm — 在 Coq 里给 LLVM IR 写一份机器证明的语义✅ v3
WAM — 让 Prolog 跑得像编译型语言的抽象机器✅ v3
XLA — 给 TensorFlow / JAX 装一台真正的张量编译器✅ v3

其他子类

论文质量描述
Compiler Error Messages — 让编译报错有用✅ v3
Dijkstra 最短路径 — 一杯咖啡时间想出来的贪心算法✅ v3
Erlang OTP — 容错并发系统设计✅ v3
Hoare Logic — 把”程序对不对”变成”数学证明对不对”🗄 存量
Knuth TAOCP — 计算机程序设计艺术✅ v3
λ-演算 — 用三条规则表达所有可计算函数🗄 存量

分布式系统

共 75 篇。

分布式系统

论文质量描述
Borg — Google 把一万台机器假装成一台✅ v3
Chubby — 给凡人用的分布式锁服务✅ v3
CRDT JSON — 协同编辑 JSON 数据结构✅ v3
Dynamo — 让购物车永远能写入的分布式存储✅ v3
GFS — 编译器决定不做哪些事✅ v3
MapReduce — 用户只写两个函数,框架替你扛千节点✅ v3
Paxos — 分布式共识算法✅ v3
Raft — 易理解的共识算法🗄 存量

共识与复制

论文质量描述
Akamai 2002 — 把网站搬到离用户 10 毫秒的地方✅ v3
Apollo — 让两万台机器自己决定谁跑哪个任务✅ v3
Bayou — 离线先改本地,再回来和别人合并✅ v3
Borg / Omega / Kubernetes — Google 调度器三代同源✅ v3
拜占庭将军问题 — 节点能撒谎时怎么达成一致✅ v3
CAP 十二年后 — Brewer 自己承认”三选二”是误读✅ v3
Chain Replication — 把多副本排成流水线,简单且强一致✅ v3
Chandy-Lamport 1985 — 分布式系统不停机也能拍一张全家福✅ v3
Consistent Hashing — 加机器只搬一小部分数据的哈希环✅ v3
COPS — 大规模跨地域存储如何用得起的代价拿到因果一致✅ v3
CRAQ — 让链复制每个节点都能读,吞吐线性扩展✅ v3
CRDT JSON 2017 — 给嵌套 JSON 一套有数学证明的合并算法✅ v3
CRDT — 让多副本各改各的,最终自动合一✅ v3
CRDT 形式定义 — SSS 2011 八页浓缩版✅ v3
Dapper — Google 大规模分布式系统链路追踪基础设施✅ v3
Drizzle — 让 micro-batch 也能跑出 100ms 延迟✅ v3
EPaxos — 没有 leader 的 Paxos,让每个副本平起平坐✅ v3
f4 — Facebook 把 90 天前的旧图片搬到一个省 40% 存储的仓库✅ v3
Fast Paxos — 给 Paxos 加一条乐观快车道✅ v3
Fidge 1988 — 给每个进程一份”账本向量”,让因果关系变成可判定✅ v3
Flexible Paxos — 两阶段不一定都要多数派✅ v3
Flink 异步快照 — 不停机给流处理拍一致照片✅ v3
FLP 1985 — 一个坏节点就能让异步共识永不终止✅ v3
Gilbert-Lynch 2002 — 把 CAP 从口号写成数学定理✅ v3
Gray 1978 — 数据库操作系统讲义,事务/2PL/2PC/恢复一次讲完🗄 存量
Life Beyond Distributed Transactions — 大规模系统下放弃跨机事务的宣言✅ v3
HLC 2014 — 把逻辑时钟和物理时钟合一,让普通服务器也能拍一致快照✅ v3
HotStuff — 让换领导也只花线性消息的 BFT 共识✅ v3
Janus 2016 — 把并发控制和共识捏成一个协议✅ v3
Jupiter — 把 OT 简化成 client-server,让协同编辑能上工业✅ v3
Linearizability 1990 — 让并发对象看起来像一次只执行一个操作✅ v3
Logoot — 给每个字符发一张”永不过期的座位号”✅ v3
Mattern 1989 — 虚拟时间与全局状态:把分布式时钟变成 N 维笛卡尔积✅ v3
Megastore — 把数据切成”小数据库”换跨地域同步复制✅ v3
Scaling Memcache at Facebook — 万台缓存怎么不被踩塌✅ v3
Mencius — 让多台服务器轮流当 Paxos 的 leader✅ v3
Naiad — 一套引擎同时跑批处理、流处理和迭代计算✅ v3
Narwhal & Tusk — 把 BFT 共识拆成『谁说过』和『谁先说』两件事✅ v3
NTP 1991 — 用四个时间戳和一组滤波器,让全网服务器的钟差几毫秒✅ v3
OT — 多人同时改一份文档,操作随上下文自动改坐标✅ v3
PBFT — 让拜占庭容错从理论变成能跑的工程✅ v3
Percolator 2010 — 给 Bigtable 加分布式事务的客户端库✅ v3
Pivot Tracing — 让运维事后想测什么就测什么✅ v3
PNUTS — 介于强一致与最终一致之间的实用一致性✅ v3
Presumed Abort/Commit — 让 2PC 少写日志少发消息的两个默认共识✅ v3
Parameter Server — 多机训练前 AllReduce 时代的工业标准✅ v3
Quincy — 把”派活给机器”变成一道最小费用流题✅ v3
Sagas — 长事务拆成一串能”反向走回去”的小事务✅ v3
Sequential Consistency 1979 — 多处理器内存模型的第一个正确性标准✅ v3
Sinfonia 2007 — 把分布式协议降级成数据结构操作✅ v3
Skeen 1981 三阶段提交 — 给 2PC 的阻塞缺陷打补丁✅ v3
Sparrow — 让毫秒级任务也能被精准调度的去中心化调度器✅ v3
TAO — Facebook 给十亿人好友列表造的专用图数据库✅ v3
Tendermint — 把拜占庭共识塞进开放区块链的工程模板✅ v3
TensorFlow — 把神经网络拆成数据流图再跑到任何机器上✅ v3
Eventually Consistent 2009 — 给互联网规模存储一套’放弃强一致’的官方词汇✅ v3
VR 1988 — 用”主备 + 换届”做共识的另一脉✅ v3
VR Revisited 2012 — VR 协议的”工程化重写版”✅ v3
X-Trace — 比 Dapper 早 3 年的跨层跨协议追踪框架✅ v3
ZeRO 2020 — 把训练状态切成 N 份让万亿参数成为可能✅ v3

其他子类

论文质量描述
Bitcoin 白皮书✅ v3
DeepSpeed ZeRO — 微软优化大模型训练显存✅ v3
Kafka — 把消息系统降维成只追加的日志文件✅ v3
Lamport 1978 — 分布式系统里没有”绝对的同时”🗄 存量
Lampson Hints — 把做系统的隐式品味写成 27 条经验法则✅ v3
Megatron-LM — NVIDIA 大规模训练框架✅ v3
Spanner — 全球分布式 SQL 数据库✅ v3

数据库

共 67 篇。

存储与查询

论文质量描述
ARIES 1992 — 数据库崩溃后怎么把账目对回来✅ v3
ART 自适应基数树 — 内存数据库为主索引重新选材✅ v3
Windows Azure Storage 2011 — 云对象存储第一次在工业界做到强一致✅ v3
B-Tree 1972 — 磁盘友好的索引结构✅ v3
Berenson 1995 — ANSI SQL 隔离级别的漏洞与快照隔离✅ v3
Bernstein 1981 并发控制综述 — 把分布式数据库的 20+ 算法整成两条主线✅ v3
Bigtable 2006 — Google 把行级随机读写做到 PB 级的存储系统🗄 存量
Brewer CAP — 网络一断电,一致性和可用性只能留一个✅ v3
Calvin 2012 — 先排好顺序再执行,让跨分区事务不再走 2PC✅ v3
Cascades 1995 — 用规则 + Memo 拼装一个可扩展查询优化器✅ v3
Cassandra 2010 — 把 Dynamo 的 P2P 骨架和 Bigtable 的列族数据模型拼成一个东西✅ v3
Ceph — 让分布式文件系统不靠中心查表✅ v3
ClickHouse — 把列存 OLAP 推到硬件极限✅ v3
CockroachDB 2020 — 没原子钟也能做全球强一致 SQL 数据库✅ v3
Codd 1970 — 关系模型奠基✅ v3
Codd 1979 — 给关系模型补上”语义”✅ v3
Comer 1979 — B-Tree 综述:为什么这棵树到处都有✅ v3
C-Store — 把数据按列存,分析查询直接快十倍✅ v3
Dataflow Model — 流处理的四问框架✅ v3
DeWitt-Gray 1992 — 并行数据库取代专用机的宣言✅ v3
DiskANN — 单机十亿向量近邻检索(图存 SSD)✅ v3
D-Streams — 把流处理伪装成一串很小的批✅ v3
DuckDB — 把 OLAP 数据库塞进你的 Python 进程✅ v3
Eswaran 1976 — 串行化与谓词锁的源头✅ v3
F1 2013 — 把 Spanner 包成 SQL,扛起 AdWords 全部账单✅ v3
FAISS 2017 — 用 GPU 在十亿向量里找最近邻✅ v3
Apache Flink — 流批一体的单引擎✅ v3
FoundationDB 2021 — 把数据库拆成五个角色,再用一个 seed 烧十年 bug✅ v3
Gray 1981 — 把”事务”提升为通用抽象✅ v3
Haystack — Facebook 十亿张照片怎么存✅ v3
HDFS — 把 GFS 用 Java 重写一遍并撑到 25 PB✅ v3
HNSW — 多层近邻图让向量检索从 O(N) 降到近似 O(log N)✅ v3
INGRES 1976 — Berkeley 平行实现的关系数据库✅ v3
Kafka NetDB 2011 — 把消息中间件砍成”会写文件的水管”✅ v3
Leis 2015 — 用真实数据打脸所有数据库的查询优化器✅ v3
LMDB 2011 — 把数据库直接 mmap 进内存的嵌入式 KV 存储✅ v3
LSM-Tree 1996 — 写优化存储引擎✅ v3
MillWheel 2013 — Google 给互联网级流处理装上不漏不重的发动机✅ v3
Milvus — 为向量检索而生的数据库✅ v3
MonetDB/X100 — 让数据库一次处理一向量行而不是一行✅ v3
Adaptive Optimization of Very Large Join Queries — 100 张表也敢精确求解✅ v3
Paxos 1998 — 古希腊议会寓言里藏的共识协议🗄 存量
Paxos Made Simple — Lamport 用平直英语把共识协议推导一遍✅ v3
Product Quantization — 把向量切碎再压成几个字节✅ v3
RocksDB 2017 — 把 LSM-Tree 的”空间放大”压到极低的工业经验✅ v3
Selinger 1979 — 基于代价的查询优化✅ v3
SEQUEL 1974 — 让数据库”听懂”近似英语的查询✅ v3
SILT — 0.7 字节内存索引一条记录的 flash 键值存储✅ v3
Skip List — 用抛硬币代替平衡树✅ v3
SMR 1990 — 把”容错服务”还原成”多副本一起跑同一台状态机”✅ v3
Snowflake 2016 — 把数仓拆成 storage / compute / services 三层✅ v3
Spanner 2012 — 用原子钟和 GPS 给全球数据库发时间戳✅ v3
SQLite — 嵌入式数据库 30 年怎么活下来的✅ v3
Stonebraker 2010 SQL vs NoSQL — 慢的是老实现,不是 SQL✅ v3
System R 1976 — 第一个跑起来的关系数据库✅ v3
Tachyon — 把集群存储推到内存速度,丢了再算回来✅ v3
TiDB 2020 — 给 Raft 加一个”旁听生”,让一份数据同时跑事务和分析✅ v3
Trill — 一个引擎同时跑流、批、交互三种分析✅ v3
Vertica 2012 — C-Store 论文走向产品的七年改造账✅ v3
Volcano 1994 — 把 SQL 执行写成 next() 拉式数据流✅ v3
Zab — ZooKeeper 怎么把客户端写入按顺序复制到所有副本✅ v3

数据库

论文质量描述
CouchDB — 把 HTTP + 多版本 + 多主复制揉成离线优先数据库✅ v3
LSM-tree 与 RocksDB — 把所有写都变成顺序写✅ v3
TigerBeetle — 只能记账但把记账做到极致的金融数据库✅ v3
Volcano — 把’算子可组合’与’并行可分离’拼成执行器范式✅ v3

其他子类

论文质量描述
Aurora — 把数据库的下半身换成日志机✅ v3
BadgerDB — 把键和值分开存的 Go 原生 KV 库✅ v3

操作系统

共 63 篇。

内核与虚拟化

论文质量描述
AFS 1988 — 客户端缓存 + 回调失效让分布式文件系统真正能扩展✅ v3
Amoeba — 把整个机房当一台操作系统✅ v3
Arrakis 2014 — 让操作系统只管规则、硬件直接服务应用✅ v3
Barrelfish / Multikernel — 把多核机器当成一个小型网络来设计 OS✅ v3
Belady 1966 — 缓存替换的理论最优与 FIFO 异常✅ v3
Btrfs — Linux 上”写时复制 B-tree”的工业级文件系统✅ v3
BVT 1999 — 让一份调度器同时照顾”急性子”和”老黄牛”✅ v3
Capsicum: Practical Capabilities for UNIX✅ v3
Coda 1990 — 笔记本拔网线照样写文件,重连后自动合并✅ v3
Demikernel — 微秒级数据中心的 datapath OS 架构✅ v3
Denali — 在一台机器上同时跑上千个轻量 VM 的早期实验✅ v3
Dijkstra 1965 — N 个进程怎么轮流上厕所而且谁也别卡死✅ v3
Disco — 让没改过的商用 OS 在 64 核大机器上一起跑✅ v3
EROS — 让 capability 内核跑得跟 Linux 一样快✅ v3
ESX Memory 2002 — 让一台机器假装比自己更大的四个魔术✅ v3
Exokernel — 把抽象推到用户态的极致设计✅ v3
Farsite — 把一群不可信桌面 PC 拼成一台可信文件服务器✅ v3
FFS — 把磁盘几何写进文件系统✅ v3
Firecracker 2020 — 给 serverless 量身定做的极简 microVM✅ v3
FlexSC — 把系统调用从同步陷入改成异步队列✅ v3
Frangipani — 把分布式文件系统盖在共享虚拟磁盘上✅ v3
ghOSt — 把 Linux 调度策略搬到用户态去写✅ v3
Haven — 把整个应用装进 CPU 黑盒,让云服务商也看不见✅ v3
Hazard Pointers — 多线程下安全释放共享节点✅ v3
HYDRA — 用 capability 把整个内核重做成对象 + 票据✅ v3
IX 数据面操作系统 — 用虚拟化把高吞吐和低延迟同时塞进内核✅ v3
jemalloc — 多 arena 让多线程 malloc 不再互相等✅ v3
Kubernetes — 为什么选声明式 API 加协调环✅ v3
KVM 2007 — 把 Linux 内核本身变成 hypervisor✅ v3
L4 — Liedtke 用 12KB 内核反驳”微内核必然慢”✅ v3
LFS 1991 — 把整个磁盘当日志写✅ v3
LOCUS 1980 — 让一群机器看起来像同一台机器✅ v3
彩票调度 — 用抽奖代替优先级的资源分配✅ v3
Mach — 把内核拆成消息互通的小服务✅ v3
Mach VM — 把虚拟内存抽象成”对象”,与硬件解耦✅ v3
MCS 锁 — 让每个线程自旋在自己的缓存行上✅ v3
Mesos 2011 — 把数据中心切成资源 offer 发给框架自己挑✅ v3
MirageOS Unikernels — 应用即内核,把操作系统编译掉✅ v3
Hoare Monitors 1974 — 把锁藏进对象里,让并发代码读起来像普通函数✅ v3
MULTICS 1965 — 把计算机做成像电力一样的公共服务✅ v3
NFS 1985 — 让远程磁盘看起来像本地磁盘✅ v3
Omega 2013 — 让多个调度器同时改一份 cluster 状态✅ v3
Plan 9 — 把”一切皆文件”真的做到极致的下一代 UNIX✅ v3
RCU 2001 — 让”读”的代价归零的并发数据结构✅ v3
Saltzer-Schroeder 1975 — 8 条至今教科书还在引的安全设计原则✅ v3
seL4 — 第一个被数学证明”代码和规范完全一致”的操作系统内核✅ v3
SELinux 2001 — 给每扇门都装上门卫,而不是给管理员一把万能钥匙✅ v3
Innovative Instructions and Software Model for Isolated Execution✅ v3
Shenango — 每 5 微秒重新分一次核的中央调度器✅ v3
Slab Allocator 1994 — 内核按对象类型开缓存,不是按字节切✅ v3
Snap 2019 — Google 把网络栈搬进用户空间的微内核实践✅ v3
Soft Updates — 不写 journal 也能保证文件系统元数据一致✅ v3
Soltesz 2007 — 容器:比虚拟机轻一档的隔离方案✅ v3
Sprite 1988 — 把一屋子工作站伪装成一台大主机✅ v3
THE 1968 — Dijkstra 用分层 + 信号量造出第一个可证明的 OS✅ v3
Twine — Facebook 把整个数据中心当一台机器调度✅ v3
UNIX 1974 — 用极小内核做出能用的分时系统✅ v3
V 分布式系统 — 把局域网当成一台机器,内核只剩进程加 IPC✅ v3
Xen 2003 — 让操作系统配合虚拟化,性能直接接近原生✅ v3
ZFS — 把磁盘当成水池,每滴水都贴标签✅ v3

其他子类

论文质量描述
Boehm-Weiser 保守式垃圾回收 — 不改编译器也能给 C 加 GC✅ v3
eBPF — 用户写小程序,内核证明安全后再跑✅ v3
io_uring — Linux 让 N 次 IO 摊销到 1 次 syscall✅ v3

机器学习

共 215 篇。

多模态 LLM

论文质量描述
Gemini 1.5 — 百万 token 多模态长上下文✅ v3
MLLM Benchmark Survey — 200+ 多模态评测基准地图✅ v3
MME Benchmark — 开源 MLLM 评测的事实起点✅ v3
MME-Survey — 多模态 LLM 怎么评才靠谱✅ v3
SigLIP — 用 Sigmoid 损失训练图文对齐✅ v3

机器人与 VLA

论文质量描述
机器人世界模型综述 — 预测未来再动手✅ v3

模型与训练

论文质量描述
A3C — 多个 CPU 同时跑游戏,让 RL 不再吃 GPU✅ v3
Adafactor — 把 Adam 的优化器内存从 O(d) 压到 O(√d)✅ v3
Adam — 让深度学习自己挑步长的优化器✅ v3
AdamW — 把 weight decay 从梯度里拆出来✅ v3
ALIGN — 用 18 亿条脏图文对训练,证明数据规模能压住噪声✅ v3
Atlas — 把检索器和生成器一起训练,11B 打 540B✅ v3
AWQ — 看激活脸色给权重打折✅ v3
Batch Normalization — 把每层激活值规整到 0 均值 1 方差,深网训练时间砍成 1/14✅ v3
BIG-bench — 204 道题给大模型出考卷✅ v3
BigGAN — 把 GAN 暴力放大到 ImageNet 512×512✅ v3
BLIP-2 — 用 188M 小桥接器把冻结的视觉模型和大语言模型拼起来✅ v3
Chatbot Arena — 让真人盲投,给 LLM 排出公允座次✅ v3
Chronos — 把时间序列当语言来训练大模型✅ v3
Classifier-Free Guidance — 让扩散模型自己听懂条件✅ v3
CoCa — 把对比和生成两种多模态训练目标合到一个模型里✅ v3
Code Llama — 开源代码模型的完整训练配方✅ v3
Codex — 让 GPT 学会写 Python,并造一把尺子量它✅ v3
Consistency Models — 把 50 步扩散压成 1 步出图✅ v3
DDIM — 把扩散模型 1000 步采样压到 50 步✅ v3
AI safety via debate — 让两个 AI 互辩,人类只当评委✅ v3
DeBERTa — 把”内容”和”位置”拆成两路独立看的 BERT✅ v3
Decision Transformer — 把强化学习当成”文字接龙”✅ v3
DeepSeek-Coder — 按整个仓库喂代码的开源 SOTA✅ v3
DeepSeek R1 — 强化学习推理模型✅ v3
Double Descent — 模型越大越准,过参数化时代的反常识曲线✅ v3
DreamFusion — 用 2D 扩散模型当老师,把 NeRF 教成 3D✅ v3
Dropout — 训练时随机关掉一半神经元,反而学得更好✅ v3
EAGLE — 让大模型先在”特征层”猜下一步而不是猜 token✅ v3
EDM — 把扩散模型的训练配方一次拆清楚✅ v3
ELECTRA — 把猜词题改成判真假题,训练效率 4 倍✅ v3
ELMo — 让词向量随上下文变化✅ v3
Flamingo — 让冻结的大模型学会看图,几张样例就上手✅ v3
FLAN — 用自然语言指令教模型学会”听话”✅ v3
GAT — 让图神经网络的邻居自带权重✅ v3
GCN 2017 — 把卷积搬到图结构上的最简版本✅ v3
GIN — 把图神经网络的表达力顶到理论天花板✅ v3
GLUE — 给 NLU 模型出一张包含 9 道题的统考卷✅ v3
Goal Misgeneralization — 奖励函数完全正确,AI 还是可能学歪✅ v3
Graphormer — 标准 Transformer 直接刷爆 GNN✅ v3
GraphSAGE 2017 — 给没见过的节点也能算嵌入✅ v3
Grokking — 训练 loss 早归零,几千步后才突然学会✅ v3
GRU 2014 — 用两个门替代 LSTM 三个门,编码-解码范式登场✅ v3
Imagen — 文生图真正的引擎是语言模型✅ v3
Instant-NGP — 秒级训练 NeRF 的多分辨率哈希编码✅ v3
InternVL — 6B 视觉基座 + QLLaMA 对齐开源多模态✅ v3
Label Smoothing — 别让模型对正确答案过度自信✅ v3
Layer Normalization — 把归一化方向从 batch 转到 feature,让 RNN/Transformer 也能稳定训✅ v3
Lion — 让程序自己搜出来的优化器,比 AdamW 内存少一半✅ v3
Longformer — 滑窗加少数全局 token,把长文档喂进 Transformer✅ v3
彩票假设 — 大网里藏着一张能独立训出来的小网✅ v3
LSTM — 用门控让神经网络记得住上一段话✅ v3
Magic3D — 把 DreamFusion 的 NeRF 拆成”先粗后精”两阶段✅ v3
MAML — 学一个”好起点”,几步就能学会新任务✅ v3
Mesa-Optimization 2019 — 训出来的模型自己也是个优化器✅ v3
MiniCPM-V — 手机能跑的 GPT-4V 级多模态模型✅ v3
mixup — 把两张图按比例叠成一张,标签也一起叠✅ v3
MMLU — 用 57 个学科的多选题考一考语言模型✅ v3
Mode Connectivity — 神经网络的两个最优解之间有低洼走廊✅ v3
mPLUG-Owl — 模块化拼装多模态大模型✅ v3
N-BEATS — 纯前馈网络在时序预测上打败统计派✅ v3
NTK — 把无限宽的神经网络变成一个可解的核方法✅ v3
NVILA — 先放大分辨率再压缩 token 的高效 VLM✅ v3
Orca — 让一批 LLM 请求随到随走,不再排队等最长那个✅ v3
Parti — 把文生图当作翻译,用自回归 Transformer 一像素接一像素地写✅ v3
Performer — 用随机特征把 softmax attention 拉成线性复杂度✅ v3
Prototypical Networks — 每类算个均值,比距离就够了✅ v3
Reformer — 用哈希分桶把 attention 从 O(L²) 压到 O(L log L)✅ v3
REPLUG — 不动 LLM 一根毛,只把检索器调到它的”口味”上✅ v3
RoBERTa — 把 BERT 重训一遍就能拿 SOTA✅ v3
RWKV — 让 RNN 拿到 Transformer 那张训练并行的入场券✅ v3
Soft Actor-Critic — 让强化学习既会拿分又愿意多试✅ v3
Self-Consistency — 让模型把同一道题做 40 遍再投票✅ v3
Self-RAG — 让模型自己决定何时该查资料✅ v3
Self-Refine — 让同一个模型自己改自己写的东西✅ v3
Seq2Seq — 把翻译变成端到端神经网络✅ v3
Sophia — 让二阶优化器第一次在 LLM 预训练里跑得动✅ v3
StarCoder — 把训练数据完整公开的 15B 代码模型✅ v3
StyleGAN2 — 把 StyleGAN 的水滴瑕疵和潜空间纠葛一起修掉✅ v3
Sycophancy 2023 — RLHF 模型为什么爱顺着用户说✅ v3
T0 — 让 50 个人各写各的提示词,模型反而更会听新指令✅ v3
TabPFN — 一秒解决小表格分类的 Transformer✅ v3
TD3 — 给 DDPG 装两副刹车,连续控制终于稳了✅ v3
Transformer-XL — 让 Transformer 像 RNN 那样把上下文滚动传下去✅ v3
Tree of Thoughts — 让 LLM 像下棋一样多想几步再答✅ v3
VALL-E — 3 秒样本零样本语音克隆✅ v3
Whisper — 68 万小时弱监督训出的语音识别✅ v3
XLNet — 把句子打乱顺序读,借此同时拿到 AR 和双向✅ v3

强化学习

论文质量描述
DQN — Deep Q-Network✅ v3
MuZero — 不用规则也能下棋🗄 存量
PPO — Proximal Policy Optimization✅ v3

生成模型

论文质量描述
DDPM — Denoising Diffusion Probabilistic Models🗄 存量
DiT — Diffusion Transformer✅ v3
Stable Diffusion — 开源文生图引爆✅ v3

视频理解

论文质量描述
2D-TAN — 用二维时间图做自然语言时刻检索✅ v3
Chapter-Llama — 语音引导采帧,一小时视频一次前向切章节✅ v3
Chat-UniVi — 动态视觉 token 统一图像与视频对话✅ v3
CounterVQA — 因果图驱动的反事实视频 VQA✅ v3
COVER — 四象限反事实视频推理 benchmark✅ v3
Dense360 — 全景 ERP 密集理解与 ERP-RoPE✅ v3
EgoSchema — 三分钟第一视角长视频理解的诊断探针✅ v3
Flash-VStream — STAR 双进程记忆的低延迟长流理解✅ v3
Grounded-VideoLLM — 双流编码 + 时间 token,把「何时发生」写进 Video LLM✅ v3
HawkEye — 用递归缩窗把文本查询钉在长视频时间轴上✅ v3
Hour-LLaVA — 记忆增强,让 LLaVA 读懂一小时视频✅ v3
InternVideo2 — 三阶段渐进训练,把视频基础模型扩到 6B✅ v3
InternVideo2.5 — 长富上下文 + HiCo 层次压缩✅ v3
LiveVLM — 免训练流式视觉 token 压缩✅ v3
LLaMA-VID — 每帧两枚 token,把小时级视频塞进 LLM✅ v3
LLaVA-OneVision — 单图、多图、视频一个模型全搞定✅ v3
LLaVA-Video — LLaVA-NeXT 视频主线,合成数据 + SlowFast 采帧✅ v3
LLMVS — 用 LLM 语义裁判给视频帧打分做摘要✅ v3
R-VLM — 长视频不靠均匀采帧,靠可学习检索选片段✅ v3
LongVA — 把语言模型的长上下文能力「搬」到视频上✅ v3
LongVideoBench — 一小时交织字幕视频的长上下文理解考卷✅ v3
LongVILA — 把 VILA 从 8 帧扩到 2048 帧的长视频全栈方案✅ v3
LVBench — 平均 68 分钟、六维能力的长视频极限考✅ v3
MLVTG — MambaAligner + 冻结 LLM 提纯的多模态视频时序定位✅ v3
MLVU — 九类任务、多时长分层的长视频理解大考✅ v3
MovieChat — 从稠密帧到稀疏记忆,小时级电影也能聊✅ v3
MVBench — 二十道题拆穿视频大模型真懂还是装懂✅ v3
OmAgent — 长视频分治 Agent 与回退检索✅ v3
全景空间推理 — MLLM 准备好面对 360° 了吗✅ v3
OmniSTVG — 按句子把视频里所有相关物体都框出来✅ v3
QVHighlights — 用自然语言查询在视频里找精彩瞬间✅ v3
Qwen2.5-VL — 绝对时间编码 + 动态分辨率,小时级视频原生理解✅ v3
Qwen2-VL — 动态分辨率 + M-RoPE,工业级视频理解的里程碑✅ v3
ShareGPT4Video — 用 GPT-4V 级密集字幕,喂饱视频理解与生成✅ v3
SpaceVLLM — 一个 MLLM 同时做时序定位、图像指代与时空管定位✅ v3
ST-LLM — 把所有时空 token 交给 LLM,让它自己学时序✅ v3
StreamingBench — 流式视频理解的 18 任务在线大考✅ v3
TA-STVG — 解耦「找谁 / 何时 / 何地」的时空视频定位✅ v3
TempCompass — 专门拆穿 Video LLM 有没有真懂时间✅ v3
TimeChat — 带时间戳的多轮视频助手,长视频也能精确定位✅ v3
TimeMarker — 时间分隔符 + 任意长度采帧的视频定位大模型✅ v3
TRACE — 用因果事件链同时输出时间、精彩度与描述✅ v3
TraveLER — 四段式多 Agent,帧级问答看懂长视频✅ v3
UniVTG — 把视频时刻定位、高光检测、摘要合成一套框架✅ v3
UniTime — 生成式 MLLM 做通用视频时序定位✅ v3
Vid-LLM Survey — 用大语言模型理解视频的全景地图✅ v3
Video-ChatGPT — 让大语言模型看懂视频并聊起来✅ v3
Video-LLaMA — 把音频和视频同时塞进大语言模型✅ v3
Video-LLaVA — 投影之前先对齐,图像和视频共用一个 LLM✅ v3
VideoAgent (Wang) — LLM Agent 迭代选帧理解长视频✅ v3
VideoAgent(Fan)— 双记忆 + 四工具,长视频逼近 Gemini✅ v3
VideoChat — 把视频、指令微调、多轮对话第一次放进同一个系统✅ v3
VideoChat-Flash — 分层压缩,让长视频理解又快又准✅ v3
VideoLLaMA 2 — 时空卷积连接器 + 音视频联合理解✅ v3
VideoLLaMA 3 — 动态分辨率视觉编码 + 视频 token 压缩✅ v3
VideoLLM-online — 流式视频对话的 LIVE 框架✅ v3
Video-MME — 视频多模态大模型的「高考卷」✅ v3
VideoPrism — 冻结一个模型就能搞定所有视频理解任务✅ v3
VidSTG — 用自然语言在长视频里框出「谁在何时何地」✅ v3
Vinoground — 时序反事实短视频探针✅ v3
VSI-Bench — 用室内漫游视频考视频大模型的空间智商✅ v3
VSLNet — 用 span-based QA 做自然语言视频定位✅ v3
VTG-LLM — 绝对时间 token + VTG-IT-120K,让 Video LLM 精确定位时刻✅ v3
VTimeLLM — 让 Video LLM 学会标出事件起止时间✅ v3
WorldSense — 真实世界同步音视频理解 benchmark✅ v3

信息论

论文质量描述
Hamming 纠错码✅ v3
Polar 极化码 — 把好坏不一的信道整成”完美/全错”两组✅ v3
Reed-Solomon 编码✅ v3
Shannon 1948 — 信息论的诞生✅ v3

智能体与 LLM

论文质量描述
AutoGen — 多智能体对话框架✅ v3
MetaGPT — 多智能体软件公司✅ v3
OpenHands — 开源 AI 软件工程师✅ v3
ReAct — Reasoning and Acting✅ v3
Reflexion — 让 LLM 自我反思✅ v3
SWE-Agent — Princeton SWE-bench 解法🗄 存量
Toolformer — 教 LLM 自主调用 API🗄 存量
Voyager — LLM 终身学习智能体✅ v3

AI / NLP

论文质量描述
GraphRAG — 微软的知识图谱 + RAG🗄 存量
RAG (Lewis 2020) — 检索增强生成奠基✅ v3
RETRO — DeepMind 的检索增强 LLM✅ v3

AI 可解释性

论文质量描述
Activation Patching — 因果干预可解释性方法✅ v3
Anthropic Circuits — 把 Transformer 当电路逆向✅ v3
Causal Abstraction — 神经网络与算法的因果对齐✅ v3
Induction Heads — Transformer 的 in-context learning 引擎✅ v3
Sparse Autoencoders — 把 superposition 解出来🗄 存量
Toy Models of Superposition✅ v3

其他子类

论文质量描述
Agentless — 反 Agent 派的 SWE-bench 解法✅ v3
AlphaGo — 击败围棋世界冠军✅ v3
Anthropic Prompt Caching — 让长 prompt 只算一次,后续只付 10%✅ v3
Attention Is All You Need🗄 存量
BentoML — 把模型 + 依赖 + API 打包成一个能直接跑的盒子✅ v3
ClearML — 实验跟踪 + 远程执行 + 数据管理三合一✅ v3
CLIP — Contrastive Language-Image Pre-training✅ v3
Constitutional AI — Anthropic 的对齐方法✅ v3
Chain-of-Thought Prompting✅ v3
DALL-E 2 — 基于 CLIP + 扩散的图像生成✅ v3
DINO 自监督视觉 transformer✅ v3
DistServe — 把 prefill 和 decode 拆到不同 GPU 上跑✅ v3
Huffman 编码✅ v3
LLaMA — Meta 开源大语言模型✅ v3
LLaVA — 开源多模态对话模型✅ v3
MAE — Masked Autoencoders🗄 存量
Mamba — 选择性状态空间模型✅ v3
MCP — 让一个 LLM 客户端能插任何外部能力的 USB 协议✅ v3
Mixture of Experts (MoE)✅ v3
MLflow — 给机器学习实验装上”记账本和身份证”✅ v3
MMMU — 大学级多学科多模态推理基准✅ v3
Optuna — 让超参搜索像写普通 Python 代码一样自然✅ v3
ResNet — 残差连接✅ v3
RLHF Christiano 2017 — 人类偏好做奖励✅ v3
SAM — Segment Anything✅ v3
Sarathi-Serve — 让长 prompt 不再卡住所有人的流式回复✅ v3
Sleeper Agents — 故意藏后门的 LLM✅ v3
SWE-bench — 真实 GitHub Issue 评测✅ v3
ViT — Vision Transformer✅ v3
vLLM — 把操作系统的分页搬进 GPU KV cache✅ v3

后端 API

共 9 篇。

后端

论文质量描述
JWT RFC 7519 — 把身份证装进一段可校验的字符串✅ v3
OAuth 2.1 — 把十年 OAuth 实战经验收口成一份能直接用的规范✅ v3
REST — Fielding 2000 给 Web API 写下的设计宪法✅ v3
SKIP LOCKED — 让 Postgres 当任务队列用✅ v3

其他子类

论文质量描述
Islands Architecture — 静态页面里只让需要交互的小块加载 JS✅ v3
nvm — 在同一台机器上轻松切换 Node 版本✅ v3
React Server Components — 让组件自己决定在哪台机器跑✅ v3
Server-Sent Events — 服务器单向推送的标准协议✅ v3
Stripe Rate Limiters — 工业级令牌桶长什么样✅ v3

基础设施

共 12 篇。

基础设施

论文质量描述
coturn — 帮 WebRTC 穿越 NAT 的开源中转服务器✅ v3
k3s — 把整个 Kubernetes 装进一个 70 MB 的二进制✅ v3
Kustomize — 不写模板也能给 K8s 配置分环境🗄 存量
OpenSearch — AWS 主导的 Apache 2.0 搜索引擎分叉✅ v3
TimelineJS — 一张 Google Sheet 直接变成交互时间轴✅ v3
Weights & Biases — 几行 init 把指标系统代码自动入库✅ v3

infrastructure

论文质量描述
EMQX — Erlang 写的 MQTT broker,单集群扛千万 IoT 长连接✅ v3
ShellCheck — 帮你抓 Bash 脚本里那些”半夜才发作”的坑✅ v3
StarRocks — Doris 分叉出来的向量化 CBO 国产 OLAP✅ v3

其他子类

论文质量描述
Cheney 1970 — 把活对象复制走,原地丢弃整片堆✅ v3
Mermaid — 用文本写图,让代码评审能 diff 流程图✅ v3
Scoop — Windows 上像 Homebrew 一样装命令行工具✅ v3

网络协议

共 66 篇。

网络协议

论文质量描述
Akamai 2010 — 从内容分发网络长成全球应用平台✅ v3
Amplification Hell 2014 — 把家用宽带放大成几百 Gbps 的反射攻击✅ v3
Andromeda — Google Cloud 网络虚拟化的高速通道✅ v3
B4 — Google 用 SDN 把跨数据中心 WAN 利用率拉到 95%+✅ v3
BBR 2017 — 用瓶颈带宽和最小 RTT 替代丢包当拥塞信号✅ v3
BitTorrent — 用”以牙还牙”逼大家都上传✅ v3
Caesar-Rexford 2005 — 你的包为什么绕了大半个地球✅ v3
Calder 2015 — Anycast CDN 在生产环境真的能用吗✅ v3
Cerf-Kahn 1974 — 用网关把异构网络拼成一个互联网✅ v3
Chaum Mix Network — 把匿名通信从理论变成工程✅ v3
Chord — 让上万台机器排成圈,查任何 key 都只走 log N 步✅ v3
Clark 1988 — TCP/IP 七大目标的优先级,决定了 Internet 长成今天这样✅ v3
CoDoNS — 用 P2P 哈希表替代分层 DNS 的实验✅ v3
CUBIC 2008 — Linux 默认拥塞控制,三次曲线把千兆带宽喂饱✅ v3
New Directions 1976 — 给协议世界写下公钥宪法✅ v3
DNS — 把全球域名解析切成一棵可分布维护的树✅ v3
DONAR 2010 — 把 DNS 全球调度写成一道可解的优化题✅ v3
DoT/DoH 性能 — 给 DNS 加密之后网页变快还是变慢✅ v3
Ethane 2007 — 把企业网安全策略集中到一台中央电脑上✅ v3
Fat-Tree 2008 — 用一堆便宜交换机搭出现代数据中心✅ v3
Fielding 2000 — 用约束推导法把 Web 的成功讲成了一门方法✅ v3
Frenetic 2011 — 把 OpenFlow 流表换成函数式程序✅ v3
Gao 2001 — 用算法猜出互联网上 AS 之间谁给谁付钱✅ v3
Analysis and Design of the Google Congestion Control for Web Real-time Communication (WebRTC)✅ v3
Heartbleed — 一个忘了写边界检查的 bug 让全网 1/3 的 HTTPS 站点漏内存✅ v3
HTTP/2 — 把 HTTP 从文本协议改造成二进制多路复用✅ v3
Interactive Connectivity Establishment (ICE): A Protocol for Network Address Translator (NAT) Traversal✅ v3
IPFS — 把”地址”换成”内容本身”的 P2P 文件系统✅ v3
Jacobson 1988 — 让互联网不再被自己塞死✅ v3
Jupiter Rising — Google 数据中心网络十年怎么做到带宽涨百倍✅ v3
Kademlia — 用 XOR 当距离的 P2P 路由表✅ v3
Karger 1997 一致性哈希 — 加机器不用全员搬家✅ v3
Krishnamurthy 1999 — HTTP/1.0 到 1.1 究竟改了什么✅ v3
Logjam 2015 — 全世界共用一把锁,国家级窃听者一次撬完✅ v3
Lucky 13 — 用毫秒级时间差把 TLS 加密看穿✅ v3
Mahajan 2002 — 三周看互联网,1% 的路由更新是手滑✅ v3
Metcalfe-Boggs 1976 — 一根线上几百台电脑怎么不打架✅ v3
NTP 1991 — 用四个时间戳和一棵服务器树,让全互联网的钟差几毫秒✅ v3
Triple Handshake — TLS 同一把主密钥被复用,黑客就能换人不换锁✅ v3
Mockapetris 1988 DNS — 设计者亲口讲为什么 DNS 长这样✅ v3
Mogul 1995 — 为什么 HTTP 必须改成”一根连接复用多次请求”✅ v3
MPTCP 2012 — 把一根 TCP 管道变成多条并行水管✅ v3
MQTT-S 2008 — 把发布/订阅消息机制装进传感器芯片✅ v3
NetKAT 2014 — 把网络转发写成可以做数学等式变换的代数式✅ v3
OpenFlow 2008 — 把交换机的『分拣规则』搬到一台中央电脑上✅ v3
P4 — 让交换机的转发逻辑像写代码一样改✅ v3
Padmanabhan-Mogul 1995 — 把 HTTP 三种提速方案放一起跑,看谁真的快✅ v3
Pastry — 用 nodeId 的前缀一位一位逼近目标✅ v3
R-BGP 2007 — 故障切换前先把备份路径塞进邻居口袋✅ v3
RED — 让路由器在队列还没塞满时就提前丢包✅ v3
RFC 3833 — IETF 第一次正式承认 DNS 不安全✅ v3
RON 2001 — 让一小撮节点自己绕开 BGP 故障✅ v3
RTP RFC 1889 — 让 UDP 也能跑实时音视频✅ v3
Salsify: Low-Latency Network Video Through Tighter Integration Between a Video Codec and a Transport Protocol✅ v3
End-to-End Arguments — 把功能尽量推到端上做✅ v3
CMT-SCTP 2006 — 让两条网络路径同时干活而不打架✅ v3
Subramanian 2002 — 用多个观察点把互联网切成 5 层✅ v3
TCP Vegas 1995 — 不等丢包,靠 RTT 早一步看见拥塞✅ v3
TLS 1.3 — 把 HTTPS 握手砍到一个来回✅ v3
Tor 洋葱路由 — 让你的网络请求穿上三层马甲✅ v3
VL2 — 让一万台服务器像在同一台交换机上✅ v3
How Speedy is SPDY — 换协议没让网页变快多少✅ v3
WebSocket RFC 6455 — 让浏览器和服务器开一条不挂断的双向电话✅ v3
WireGuard: Next Generation Kernel Network Tunnel✅ v3

其他子类

论文质量描述
QUIC — 把可靠传输从内核搬到用户空间✅ v3
TCP — 在不可靠的 IP 上凿出一条 reliable 字节流✅ v3

图形学

共 122 篇。

渲染与图形

论文质量描述
Baraff-Witkin 1998 — 让布料模拟敢走大时间步✅ v3
k-d 树 — 多维空间里的二叉搜索树✅ v3
Blinn 1977 — 用半角向量 H 把高光算量减半✅ v3
Burgess 2020 RTX ON — Turing 把光线追踪做进硅片✅ v3
Catmull 1974 Z-buffer — 用一张深度图解决谁挡谁的问题✅ v3
Catmull-Clark 1978 — 让任意拓扑网格收敛成光滑曲面✅ v3
Cohen-Greenberg 1985 Hemicube — 把渲染硬件挪去算辐射度积分✅ v3
Distributed Ray Tracing — 把所有”模糊”效果统一成随机采样✅ v3
Cook 1986 — 用噪声换掉锯齿✅ v3
Cook-Torrance 1982 — 把镜面反射拆成微面元 × 几何遮挡 × Fresnel✅ v3
Curless-Levoy TSDF — 把多次扫描融成一个干净的 3D 模型✅ v3
Debevec 1998 — 用真实世界的光照亮 CG 物体✅ v3
Deering 1988 Triangle Processor — 现代 GPU 的祖先架构✅ v3
Desbrun 1999 — 把热扩散方程隐式离散到三角网✅ v3
Disney Principled BRDF 2012 — 11 个滑块封装 Cook-Torrance 全家桶✅ v3
QEM — 给三角网格『瘦身』时算每一刀的代价✅ v3
Goldsmith-Salmon 1987 — 让计算机自己给场景搭层次包围盒✅ v3
Goral 1984 Radiosity — 把建筑工程的辐射热传导算法搬进图形学✅ v3
Lumigraph — 给 4D 光场加一层粗糙几何,让插值不再鬼影✅ v3
Hanrahan 1991 Hierarchical Radiosity — 让 radiosity 从 O(n²) 跌到 O(n)✅ v3
Heckbert 1986 — 把”贴图”这件事讲清楚的第一篇综述✅ v3
MLS-MPM — 把 MPM 重写到”几百行能跑实时”的现代版本✅ v3
Jensen 光子映射 — 先撒光子再查密度的两 pass 全局光照✅ v3
Kajiya 渲染方程 — 把所有渲染算法统一成一个积分方程✅ v3
Karis 2014 TAA — 让游戏每帧只采一次也能 4K 不锯齿✅ v3
Karis UE4 PBR — 把电影质感塞进游戏的 33 毫秒✅ v3
Karras 2012 — 让每个 BVH 内部节点独立算自己(O(N) 全并行 GPU 构建)✅ v3
Poisson Surface Reconstruction — 把点云变成水密网格的全局解法✅ v3
Lafortune-Willems 1993 — 从相机和光源同时撒光线再”接龙”✅ v3
Light Field Rendering — 把场景拍成 4D 数组,新视角靠查表✅ v3
redner — 让光线追踪能反向传播过几何边缘✅ v3
Lindholm 2008 Tesla — SM、warp、SIMT 这套词汇的官方出生证明✅ v3
DLSS 2.0 — 把 4K 实时渲染的一半工作量交给神经网络✅ v3
Loop 1987 — 三角形网格的递归光滑细分✅ v3
Position Based Fluids — 把水也塞进 PBD 同一套框架✅ v3
Marching Cubes 1987 — 把体数据切成立方体查表生成三角网格✅ v3
Meagher 1982 八叉树 — 把立方体一分为八,递归地装下一整个 3D 世界✅ v3
SPH — 把流体拆成一群带核的粒子✅ v3
Position Based Dynamics — 跳过力,直接挪位置✅ v3
Instant-NGP — 把 NeRF 训练从几小时压到 5 秒✅ v3
NeRF — 用一个 MLP 把整个场景”背”下来✅ v3
KinectFusion — 用消费级深度相机实时重建三维世界✅ v3
Nickolls-Dally 2010 — GPU 怎么从画三角形变成跑 AI✅ v3
Mitsuba 2 — 一份渲染代码同时编出 CPU / GPU / 可微版✅ v3
Owens 2007 GPGPU 综述 — CUDA 之前 GPU 通用计算的黑魔法时代✅ v3
DeepSDF — 用一个 MLP 把整类 3D 形状的距离场背下来✅ v3
Perlin Noise — 让计算机生成的图像不再有”机器味”✅ v3
Phong 1975 — 把光照拆成环境+漫反射+高光三项✅ v3
Plenoxels — 不要神经网络也能渲染辐射场✅ v3
Saito-Takahashi 1990 — 第一次提出 G-buffer 的论文✅ v3
Sorkine 2004 — 用拉普拉斯坐标编辑网格,拽把手不丢细节✅ v3
Stable Fluids — 让流体模拟时间步随便给都不爆✅ v3
MPM — 让粒子背着自己的历史,借网格算一遍力✅ v3
Taubin 1995 — 把网格平滑当成低通滤波✅ v3
Veach MIS — 用一行加权公式让多种采样策略各取所长✅ v3
Veach MLT — 用 Metropolis 在路径空间游走,专攻 BDPT 也算不动的难场景✅ v3
Wald 2007 — 把 SAH BVH 构建从分钟级砍到秒级的 binned 近似法✅ v3
Ward 1992 — 第一个能落地的各向异性反射模型✅ v3
Whitted 1980 — 让光线在场景里递归跑三种次级射线✅ v3
Williams 1983 mipmap — 提前烤好金字塔,纹理过滤变 O(1)✅ v3

GPU 架构

论文质量描述
Alpa — 把张量/流水/数据并行统一成一道搜索题✅ v3
Amdahl 定律 — 串行比例决定并行加速比的上界✅ v3
NVIDIA Ampere — 第三代 Tensor Core 加 TF32 / BF16 / FP64,结构化稀疏 + MIG 重写大模型时代硬件假设✅ v3
Aurora 2024 — 不用 NVIDIA 也能造 2 EFLOPS 超算✅ v3
AWQ 2023 — 让 70B 大模型住进 RTX 4090✅ v3
big.LITTLE — 让一颗芯片同时装快核和省电核✅ v3
NVIDIA Blackwell — 双 die NV-HBI + 第二代 Transformer Engine + FP4 让万亿参数训练日常化✅ v3
Blink — 按拓扑动态拼生成树替代 NCCL ring✅ v3
Yeh-Patt 1991 — 用最近 12 条分支的历史给 CPU 算命✅ v3
Brook for GPUs — 让显卡第一次能用人话编程✅ v3
Case for RISC 1980 — 一篇没有芯片的论文,掀起 CPU 半世纪革命✅ v3
Cell BE — 一颗 CPU 里塞 8 个加速核✅ v3
CUDA Streams 并发量化研究 — 为什么 SM 利用率拉不满✅ v3
cuDNN — 把卷积写成矩阵乘,让所有深度学习框架共享底层加速✅ v3
CUTLASS — 把 SOTA GEMM 拆成可组合的 C++ 模板层级✅ v3
Stanford DASH — 第一台真跑起来的目录式 CC-NUMA 多处理器✅ v3
FasterTransformer 2021 — NVIDIA 第一代开源 LLM 推理引擎✅ v3
NVIDIA Fermi — 把 GPU 从游戏卡推上超算✅ v3
FPGA HLS 2011 — 把 C 代码自动翻译成芯片电路的范式✅ v3
PyTorch FSDP — 把大模型切成 N 份分到 N 张卡✅ v3
GPipe — micro-batch 流水线让 GPU 排成生产线✅ v3
GPTQ — 把 175B 大模型压成 4-bit 还几乎不掉点✅ v3
GPU 缓存一致性 — 用时戳代替失效消息✅ v3
GPU 微基准 — 用秒表把闭源芯片”戳”出真相✅ v3
GPUDirect RDMA — 让网卡直接读写 GPU 显存✅ v3
GShard — 用注解让 600B 模型自动跨设备切片✅ v3
NVIDIA Hopper — Transformer Engine + FP8 + TMA + Thread Block Cluster 把硅片为 LLM 量身定制✅ v3
NVIDIA Kepler — 把 GPU 调成深度学习训练默认机型✅ v3
Kokkos — 一份 C++ 代码同时跑 CPU、GPU、Xeon Phi✅ v3
LLM.int8() — 大模型激活值里藏着几个超大异常通道✅ v3
NVIDIA Maxwell — 同一工艺节点把性能每瓦翻一倍✅ v3
McFarling 1993 — 用 XOR 把全局历史和 PC 拧在一起,再让两个预测器打擂台✅ v3
Medusa — 让大模型自己同时猜好几个 token✅ v3
MIPS 1981 — 让编译器自己安排流水线,CPU 就不用管✅ v3
Sweazey-Smith MOESI 1986 — 给多核 CPU 一份”谁手里有这块内存”的统一规则✅ v3
NVLink 2.0 + NVSwitch — 把 16 块 GPU 拼成一台机器✅ v3
NVMe — 为 SSD 重写的存储协议✅ v3
OpenCL 2010 — 一份代码同时跑 CPU/GPU/DSP/FPGA 的开放标准✅ v3
Orca — Transformer 生成模型的分布式推理调度✅ v3
NVIDIA Pascal P100 — HBM2 + NVLink + FP16 让 Tesla 真正变成 AI 卡✅ v3
PMFS — 第一个为字节寻址持久内存设计的文件系统✅ v3
PipeDream — 1F1B 调度让流水线工位别空等✅ v3
Quantum Supremacy 2019 — 量子机用 200 秒做完超算 1 万年的事✅ v3
Ring All-Reduce — 把 HPC 的环形规约搬进深度学习✅ v3
RISC I — 砍掉 90% 指令反而让 CPU 跑得更快✅ v3
SGLang — 把 LLM 程序当成共享前缀的树来跑✅ v3
SmoothQuant 2023 — 把激活的烫手山芋扔给权重✅ v3
SparseGPT — 175B 大模型一次过剪 50%,不重训✅ v3
SpecInfer — 让大模型一次”猜一棵树”再并行验证✅ v3
SYCL 2020 — 用一份标准 C++ 让 GPU/CPU/加速器一起跑✅ v3
TASO — 让机器自己发现深度学习图重写规则✅ v3
TensorRT-LLM — NVIDIA 把 FT 升级成可调度的官方推理栈✅ v3
NVIDIA Tesla — 把显卡改造成通用并行计算机✅ v3
Thrust — 让 GPU 编程像写 STL 一样一行调用✅ v3
Tomasulo 算法 — 让 CPU 自己决定指令的执行顺序✅ v3
Triton 2019 — 让 Python 写出贴近 cuBLAS 的 GPU kernel✅ v3
NVIDIA Turing — RT Core 把光追装进消费卡,Tensor Core 第二代下放 INT8✅ v3
TVM OSDI 2018 — 把 Halide 思想搬到深度学习✅ v3
CUDA Unified Memory — 让 CPU 和 GPU 共享一张内存地图✅ v3
NVIDIA Volta V100 — 第一代 Tensor Core 把 AI 训练算力一夜抬 6 倍✅ v3

其他子类

论文质量描述
3D Gaussian Splatting — 用一堆 3D 模糊光斑重建场景✅ v3
FlashAttention — 不改算法,只改数据怎么进 GPU✅ v3

形式化方法

共 51 篇。

形式化验证

论文质量描述
ACL2 — 用纯 Lisp 当数学对象,机器证明工业级硬件正确✅ v3
Apron — 把区间/八边形/多面体塞进同一个插槽✅ v3
Awodey-Warren — 把『相等的证明』看成两点之间的路径✅ v3
Bounded Model Checking — 把硬件验证翻译成一道 SAT 题✅ v3
Boogie — 写一次验证后端,多种证明语言复用✅ v3
CertiKOS — 把整个并发内核拆成 30 多层每层都被 Coq 证过✅ v3
Chaff 2001 — 把 CDCL 工程化的两个杀手锏✅ v3
Chapar — 第一个被机器证明的因果一致 KV 存储✅ v3
NuSMV 2 — 把 BDD 和 SAT 两种验证引擎装进同一个开源工具✅ v3
CEGAR — 用反例自动改进抽象,让大软件能被验证✅ v3
Clarke-Emerson 1981 — 让机器自己检查并发程序对不对✅ v3
Cousot-Halbwachs 凸多面体域 — 让分析器自己发现变量间的线性关系✅ v3
CryptoVerif — 让计算机直接证密码协议在真实计算模型下安全✅ v3
Cubical Type Theory — 让 Univalence 公理真的能算出结果✅ v3
Dafny — 把”代码该满足的条件”直接写进语法,编译器自动证明✅ v3
Davis-Putnam 1960 — 让机器自动判断一堆逻辑式能不能同时成立✅ v3
Disel — 把分布式协议拆成可独立证明、可拼装的 Coq 模块✅ v3
DPLL 1962 — 把”逻辑判定”从内存爆炸救成栈式回溯✅ v3
EasyCrypt — 让密码学家的安全证明能被机器自动检查✅ v3
Frama-C — 一个开源平台把 C 程序的多种验证方法拼到一起✅ v3
Graf-Saïdi — 用谓词把无限状态压成有限抽象✅ v3
HACL* — 用数学证明过的 C 加密代码,跑在你 Firefox 和 Linux 内核里✅ v3
HOL Light — 不到 500 行 OCaml 写出能证开普勒猜想的证明助手✅ v3
SPIN — 让计算机帮你穷举并发程序的所有可能执行✅ v3
HoTT Book — 把”相等”重定义为路径,再让数学和程序共用同一本教材✅ v3
Hyperkernel — 让 SMT 求解器一键验证操作系统内核✅ v3
Iris 2015 — 把并发推理拆成 monoid + invariant 两块积木✅ v3
IronFleet — 把分布式协议证到一行 bug 都没有✅ v3
Isabelle/HOL — 让程序证明像写数学论文一样可读✅ v3
Kami — 在 Coq 里造硬件并自动编译到 Verilog✅ v3
TLA — 把状态机和时序逻辑捏成一个公式✅ v3
GRASP 1996 — 让 SAT 求解器从冲突里学到东西✅ v3
McMillan SMV 1993 — 把状态空间从 10^6 推到 10^20 的符号模型检测✅ v3
Miné 八边形抽象域 — 在区间和多面体之间的甜点✅ v3
MiniSat 2003 — 600 行 C++ 把 CDCL 写成教科书✅ v3
Nelson-Oppen 1979 — 让多个判定程序坐下来交换”我刚发现 a=b”✅ v3
Nieuwenhuis-Oliveras-Tinelli 2006 — 给 SMT 求解器写一套数学规则书🗄 存量
Nuprl — 第一个把 Martin-Löf 类型论搬上屏幕的证明助手✅ v3
Pnueli 时序逻辑 — 给”永远不死锁""请求最终被响应”找一套数学语言✅ v3
ProVerif — 把密码协议翻成 Prolog 规则让计算机自己证安全✅ v3
Stainless — 让编译器替你证明 Scala 函数真的满足规约✅ v3
Tamarin — 让计算机自己证 Signal、TLS 1.3 这种带 DH 的协议是不是真安全✅ v3
TLC — 让 TLA+ 规范可以一键机检的模型检查器✅ v3
VAMP — 把一颗有流水线、乱序、浮点和 cache 的处理器从门电路证到指令集✅ v3
VCC — 给并发 C 加注解,让 SMT 自动证它对✅ v3
Verdi — 在 Coq 里完整证明 Raft 协议的分布式系统验证框架✅ v3
Verisoft — 把整台计算机从晶体管到邮件客户端全部用数学证完✅ v3
VST — 把 C 程序的数学证明一路带到机器码✅ v3
Why3 — 写一次程序规范,多个证明器一起来证✅ v3
Z3 2008 — 把 SMT 工程化到工业默认✅ v3

其他子类

论文质量描述
Gödel 1931 — 不完备性定理✅ v3

通信

共 1 篇。

其他子类

论文质量描述
Asterisk — 把企业总机做成一台 Linux 服务器✅ v3

信息检索

共 52 篇。

检索与排序

论文质量描述
ANCE — 让模型自己挖训练负例,对比学习的”自给自足”✅ v3
Anh-Moffat 2005 — 让倒排表压到接近熵下限还能 SIMD 解码✅ v3
Anserini — 把工业搜索引擎 Lucene 改造成学术 IR 实验台✅ v3
BERT4Rec — 把 BERT 的 MLM 搬进序列推荐做双向建模✅ v3
Block-Max WAND — 给倒排索引加分块上界,跳过算不过 top-k 的整块✅ v3
BPR — 用『i 比 j 更受欢迎』替代『i 是正例 j 是负例』✅ v3
Brill-Moore 2000 — 把拼写纠错的编辑操作从单字符扩成任意子串✅ v3
coCondenser — 让 BERT 的 [CLS] 在预训练就学会”代表整段话”✅ v3
ColBERT — 让 BERT 检索既准又能扛大规模✅ v3
Croft-Harper 1979 — 没有相关性反馈也能跑概率检索✅ v3
DCN — 在 DNN 旁边并联一条专门学特征交叉的网络✅ v3
DIN — 让推荐模型按你看的广告决定该激活你哪段历史✅ v3
DLRM — Meta 把工业推荐模型拆成 4 个标准积木✅ v3
doc2query — 让模型替文档预想”会被怎么搜”再写进倒排表✅ v3
DPR — 用 BERT 双塔把检索从 BM25 时代拉进稠密向量时代✅ v3
DRMM — 检索里的匹配是相关性不是语义相似✅ v3
DSSM — 把 query 和文档各编码成 128 维向量再算余弦✅ v3
E5 — 用海量”自然出现的文本对”训通用 embedding✅ v3
FILIP — 把 CLIP 的图文对齐细化到 token 级✅ v3
GBRank — 把决策树堆起来学排序,一棵树纠正一处错排✅ v3
Google 1998 — 把整个网络爬下来、压扁、再用一秒查到✅ v3
HITS — 给网页同时打两个分:权威页 + 索引页✅ v3
Indri 2005 — 把语言模型、推断网络、结构化查询拼成一个搜索引擎✅ v3
K-NRM — 用核函数把交互矩阵变成可微排序信号✅ v3
Koren-Bell-Volinsky 2009 — 把推荐系统的 MF 写成 8 页教科书✅ v3
LambdaRank — 跳过定义损失函数,直接把梯度写出来✅ v3
LSH — 让相似点撞同一个桶,把高维最近邻查询从线性变成亚线性✅ v3
Maron-Kuhns 1960 — 检索不是匹配,是猜”对你有用的概率”✅ v3
MinHash — 用最小哈希值估算两个集合的重叠度✅ v3
MS MARCO — 1 千万 Bing 真实查询喂饱神经检索的标准评测集✅ v3
BellKor Netflix Prize 2009 — 集成学习赢下 100 万美金的工程实录✅ v3
NeuMF — 用神经网络替掉推荐系统的内积✅ v3
Robertson-Walker 1994 — 把 2-Poisson 压成一行能算的公式✅ v3
PageRank — 用随机游走给整个网络的页面打分✅ v3
Personalized PageRank — 给每个人一份属于自己的网页排名✅ v3
RankNet — 让搜索引擎学会比较两个结果谁更好✅ v3
RM3 — 让搜索引擎自己看一眼结果再重搜一次✅ v3
RocketQA — 把稠密检索的训练拧到工业级✅ v3
Salton VSM 1975 — 把文档变成向量再用余弦比相似度✅ v3
SASRec — 用 Transformer 的 self-attention 替 RNN 做下一步推荐✅ v3
ScaNN — 让向量量化只精修「客户会看到的那一面」✅ v3
SimHash — 用随机超平面把余弦相似度变成汉明距离✅ v3
SimRank — 两个节点相似当且仅当它们的邻居相似✅ v3
SLIM — 让数据自己学一张稀疏的”看了又看”权重表✅ v3
SPANN — 内存放中心、SSD 放向量的十亿级近邻检索✅ v3
SPLADE — 让神经网络学出稀疏向量,直接复用倒排索引✅ v3
TrustRank — 用一小撮可信种子把整张 Web 的信誉算出来✅ v3
Wide & Deep — 让模型同时学会”记住”和”举一反三”✅ v3
YouTube 双塔召回 — 把 DSSM 搬进推荐并补上两件工业关键✅ v3

数据检索

论文质量描述
BM25 — 给文档打分的”老配方”✅ v3
ColBERTv2 — 让向量检索既精又能扛百万文档✅ v3
RRF — 把多个搜索结果列表合并成一个的最简单办法✅ v3

Agent

共 22 篇。

智能体与 LLM

论文质量描述
Agent-R1 — 把 LLM agent 当 RL 环境训练的模块化框架✅ v3
APEX — 给自进化 agent 配一张”策略图”防止它走老路✅ v3
ClawTrace — 把 agent 每步操作的”成本账”先算清再蒸馏✅ v3
Code as Agent Harness — 把代码当 agent 的”骨架”来重新看 agentic AI✅ v3
EffiSkill — 把代码效率优化经验抽成两层 skill 库✅ v3
EVE-Agent — 自我训练前先把证据钉在桌上✅ v3
Evo-Memory — 给”会自己长记性”的 agent 出一份统一考卷✅ v3
EXG 经验图 — 把 agent 的成败拼成一张可复用的关系图✅ v3
LLM-Wiki — 把外部知识编译成 agent 自己的”维基”✅ v3
MemCoder — code agent 跟着你 git commit 一起成长✅ v3
MIND-Skill — 用归纳和演绎双 agent 抽 skill 并保证质量✅ v3
Misevolution — 自进化 agent 也会”越改越坏”,连顶配模型也躲不过✅ v3
MMSkills — 把视觉 agent 的”操作经验”做成多模态卡片✅ v3
自进化 AI agent 综述 — 给”会自己升级”的 agent 画一张统一地图✅ v3
Self-Evolving RecSys — 让 LLM agent 自己跑超参实验上线🗄 存量
BDI-LLM Self-Evolving Agents — 让 agent 自己改自己源代码🗄 存量
SkCC — 给 LLM agent 写一个真正的 skill 编译器✅ v3
Skill-as-Pseudocode — 把 agent 笔记本写成可校验的伪代码✅ v3
Skill-Pro — 不动权重学可复用 skill 的非参数 PPO✅ v3
Skill-SD — 用 agent 自己抽出的 skill 当 dynamic teacher 自蒸馏✅ v3
WebXSkill — 给 Web agent 的可执行 skill 是参数化代码 + URL 图索引✅ v3
Zombie Agents — 自进化 agent 的长期记忆能被持久化”借尸还魂”✅ v3

CLI

共 1 篇。

其他子类

论文质量描述
Nix — 把每个软件包当成纯函数的输出✅ v3

NLP

共 9 篇。

NLP

论文质量描述
BERT — 双向 Transformer 预训练✅ v3
Chinchilla — 训练大模型的数据/参数最优比✅ v3
DPO — Direct Preference Optimization🗄 存量
GPT-3 — Language Models are Few-Shot Learners✅ v3
InstructGPT — RLHF 让 LLM 听话✅ v3
Scaling Laws — 神经语言模型的缩放规律✅ v3
T5 — Text-to-Text Transfer Transformer✅ v3
Word2Vec — 词向量奠基✅ v3

其他子类

论文质量描述
REALM — 把检索器和 BERT 一起预训练的第一篇论文✅ v3

编译器

共 3 篇。

编译器

论文质量描述
LLVM — 模块化编译器框架🗄 存量
Self / PIC — 内联缓存的诞生✅ v3
SSA — 静态单赋值形式🗄 存量

数据可视化

共 4 篇。

其他子类

论文质量描述
CesiumJS — 把会动的 3D 地球塞进浏览器✅ v3
Cytoscape.js — 浏览器里画网络图、跑图算法的 JS 库✅ v3
Panel — 把 notebook 一键变交互式 web app✅ v3
Vega-Lite — 用 JSON 三段式画复合图✅ v3

安全与隐私

共 54 篇。

安全与隐私

论文质量描述
DP-SGD — 深度学习差分隐私训练✅ v3
以太坊智能合约攻击综述 — 12 类漏洞的首次系统分类✅ v3
QL: Object-Oriented Queries on Relational Data✅ v3
Scalable, Transparent, and Post-Quantum Secure Computational Integrity✅ v3
SPHINCS — 无状态哈希签名,后量子密码的”保险”✅ v3
AFLFast — 灰盒 Fuzz 的马尔可夫调度✅ v3
Bonawitz FL System 2019 — Google 工业级联邦学习系统设计✅ v3
CRYSTALS-Kyber: A CCA-Secure Module-Lattice-Based KEM✅ v3
Halo: Recursive Proof Composition without a Trusted Setup✅ v3
Fully Homomorphic Encryption without Bootstrapping✅ v3
Bulletproofs: Short Proofs for Confidential Transactions and More✅ v3
KLEE — 符号执行自动生成高覆盖测试✅ v3
Homomorphic Encryption for Arithmetic of Approximate Numbers✅ v3
Faster Fully Homomorphic Encryption: Bootstrapping in Less Than 0.1 Seconds✅ v3
Intel SGX 详解 — 在不可信云里圈一块硬件保险箱✅ v3
Flash Boys 2.0 — 区块链上的抢跑者和共识危机✅ v3
Sphinx — mix 网络最紧凑的可证安全消息格式✅ v3
Mixminion 2003 — 让回复消息和发送消息共享同一张匿名面罩✅ v3
CRYSTALS-Dilithium — 量子计算机来了也签不掉的数字签名✅ v3
Local Privacy and Statistical Minimax Rates✅ v3
校准噪声与敏感度 — Laplace 机制奠基✅ v3
差分隐私 — ε 与邻接数据集不可区分✅ v3
分布式噪声生成 — 去掉可信管理员也能保护隐私✅ v3
RAPPOR — 本地差分隐私随机响应采集✅ v3
Somewhat Practical Fully Homomorphic Encryption✅ v3
Freedman-Nissim-Pinkas PSI 2004 — 两个人怎么找共同好友而不暴露各自通讯录✅ v3
PLONK: Permutations over Lagrange-bases for Oecumenical Noninteractive arguments of Knowledge✅ v3
Gentry FHE — 全同态加密开山✅ v3
GMW 1987 — 任何函数都能让多方安全地一起算✅ v3
FGSM — 用一行梯度让神经网络看错图片✅ v3
联邦学习综述 — 60+ 作者合写的联邦学习百科与 58 道开放题✅ v3
RowHammer — 只读内存也能把邻居的 bit 敲 flip✅ v3
Spectre 攻击 — 推测执行偷看别人的内存✅ v3
Keystone — 开源可定制 RISC-V TEE 框架✅ v3
t-Closeness — 用”分布距离”堵住匿名化的最后漏洞✅ v3
Meltdown — 乱序执行偷读内核内存✅ v3
l-多样性 — k-匿名之后的隐私保护✅ v3
Madry PGD 2017 — 用最强对手训练最强防御✅ v3
FedAvg — 联邦学习奠基算法✅ v3
Rényi 差分隐私 — 隐私会计统一框架✅ v3
Dynamic Taint Analysis for Automatic Detection, Analysis, and Signature Generation of Exploits on Commodity Software✅ v3
TrustZone — ARM 给 CPU 装上”双重人格”隔离安全世界✅ v3
Loopix — 低延迟 mix 网络实现发送方和接收方双向匿名✅ v3
Rabin 遗忘传输 — 发送方永远不知道你收到了什么✅ v3
洋葱路由 1998 — 把匿名通信从理论搬进真实互联网✅ v3
On Lattices, Learning with Errors, Random Linear Codes, and Cryptography✅ v3
MIA 成员推断攻击 — 黑盒 API 能猜出你是不是训练数据✅ v3
k-匿名 — 发布数据时让攻击者无法锁定你是谁✅ v3
Szegedy 对抗样本 2013 — 一张图片骗过神经网络的开山之作✅ v3
Yao 混淆电路 — 让两人合算函数却互不泄密✅ v3

密码学

论文质量描述
AES Rijndael 对称分组密码✅ v3
Diffie-Hellman 密钥交换✅ v3
RSA 公钥密码✅ v3
zk-SNARK 零知识证明✅ v3

其他

共 13 篇。

软件工程

论文质量描述
Beck TDD — 用红绿重构循环让设计自己长出来✅ v3
CI Effects — 持续集成不是免费午餐,价值看实现细节✅ v3
Great SWE — 资深工程师”伟大”的标准是 humble + always learning✅ v3
No Silver Bullet — 软件难度的二分手术刀✅ v3
Pair Programming — 两个人共用一台机器写代码✅ v3
Programmer Interruption — IDE 数据告诉你被打断后多久才能继续敲代码✅ v3
Sillito 44 问题 — 程序员改代码时到底在问什么✅ v3

其他子类

论文质量描述
Cognitive Load Theory — 学不会不是不努力,是工作记忆装不下✅ v3
Copilot RCT — AI 编程助手的第一个严格随机对照实验✅ v3
Debugging Dichotomy — 程序员真实 debug 行为分两轨✅ v3
Dijkstra 1968 — Go To Statement Considered Harmful✅ v31968 年 3 月 Dijkstra 写给 CACM 的不到 1000 字 letter,论证 goto 让源代码的静态文本顺序与运行时执行顺序错位、状态难以推理
FSRS — 让 Anki 知道每张卡什么时候快被你忘掉✅ v3
Program Comprehension fMRI — 程序员读代码时大脑亮的是语言区不是数学区✅ v3

全部 948 篇(字母序)

Slug论文质量一级子分类
2d-tan-20192D-TAN — 用二维时间图做自然语言时刻检索✅ v3机器学习视频理解
3d-gaussian-splatting3D Gaussian Splatting — 用一堆 3D 模糊光斑重建场景✅ v3图形学计算机图形 / 三维重建
a3c-2016A3C — 多个 CPU 同时跑游戏,让 RL 不再吃 GPU✅ v3机器学习模型与训练
abadi-dpsgd-2016DP-SGD — 深度学习差分隐私训练✅ v3安全与隐私安全与隐私
acl2-2000ACL2 — 用纯 Lisp 当数学对象,机器证明工业级硬件正确✅ v3形式化方法形式化验证
activation-patchingActivation Patching — 因果干预可解释性方法✅ v3机器学习AI 可解释性
adafactor-2018Adafactor — 把 Adam 的优化器内存从 O(d) 压到 O(√d)✅ v3机器学习模型与训练
adam-2014Adam — 让深度学习自己挑步长的优化器✅ v3机器学习模型与训练
adamw-2017AdamW — 把 weight decay 从梯度里拆出来✅ v3机器学习模型与训练
adaptonAdapton — 增量计算✅ v3编程语言编程语言
aesAES Rijndael 对称分组密码✅ v3安全与隐私密码学
afs-1988AFS 1988 — 客户端缓存 + 回调失效让分布式文件系统真正能扩展✅ v3操作系统内核与虚拟化
agda-norellAgda — 让你写代码的同时把数学也证明了✅ v3编程语言类型与 PL 理论
agent-r1-2511Agent-R1 — 把 LLM agent 当 RL 环境训练的模块化框架✅ v3Agent智能体与 LLM
agentlessAgentless — 反 Agent 派的 SWE-bench 解法✅ v3机器学习AI / 软件工程
akamai-2002Akamai 2002 — 把网站搬到离用户 10 毫秒的地方✅ v3分布式系统共识与复制
akamai-2010Akamai 2010 — 从内容分发网络长成全球应用平台✅ v3网络协议网络协议
algol-60ALGOL 60 — BNF 与块结构🗄 存量编程语言编程语言
align-2021ALIGN — 用 18 亿条脏图文对训练,证明数据规模能压住噪声✅ v3机器学习模型与训练
alpa-2022Alpa — 把张量/流水/数据并行统一成一道搜索题✅ v3图形学GPU 架构
alphagoAlphaGo — 击败围棋世界冠军✅ v3机器学习强化学习 / AI
amdahl-law-1967Amdahl 定律 — 串行比例决定并行加速比的上界✅ v3图形学GPU 架构
amoeba-1990Amoeba — 把整个机房当一台操作系统✅ v3操作系统内核与虚拟化
ampere-architecture-2020NVIDIA Ampere — 第三代 Tensor Core 加 TF32 / BF16 / FP64,结构化稀疏 + MIG 重写大模型时代硬件假设✅ v3图形学GPU 架构
amplification-hell-2014Amplification Hell 2014 — 把家用宽带放大成几百 Gbps 的反射攻击✅ v3网络协议网络协议
ance-2020ANCE — 让模型自己挖训练负例,对比学习的”自给自足”✅ v3信息检索检索与排序
andersen-pointer-analysisAndersen 指针分析 — 让编译器自己算出 p 可能指向谁✅ v3编程语言类型与 PL 理论
andromeda-2018Andromeda — Google Cloud 网络虚拟化的高速通道✅ v3网络协议网络协议
anh-moffat-2005Anh-Moffat 2005 — 让倒排表压到接近熵下限还能 SIMD 解码✅ v3信息检索检索与排序
anserini-2017Anserini — 把工业搜索引擎 Lucene 改造成学术 IR 实验台✅ v3信息检索检索与排序
anthropic-circuitsAnthropic Circuits — 把 Transformer 当电路逆向✅ v3机器学习AI 可解释性
anthropic-prompt-cachingAnthropic Prompt Caching — 让长 prompt 只算一次,后续只付 10%✅ v3机器学习AI 工程
apex-policy-explorationAPEX — 给自进化 agent 配一张”策略图”防止它走老路✅ v3Agent智能体与 LLM
apollo-2014Apollo — 让两万台机器自己决定谁跑哪个任务✅ v3分布式系统共识与复制
apron-2009Apron — 把区间/八边形/多面体塞进同一个插槽✅ v3形式化方法形式化验证
aries-1992ARIES 1992 — 数据库崩溃后怎么把账目对回来✅ v3数据库存储与查询
arrakis-2014Arrakis 2014 — 让操作系统只管规则、硬件直接服务应用✅ v3操作系统内核与虚拟化
art-2013ART 自适应基数树 — 内存数据库为主索引重新选材✅ v3数据库存储与查询
asteriskAsterisk — 把企业总机做成一台 Linux 服务器✅ v3通信通信 / 开源 PBX
astreeASTRÉE 分析器 — 让飞机控制代码的静态分析做到零警告✅ v3编程语言类型与 PL 理论
atlas-2022Atlas — 把检索器和生成器一起训练,11B 打 540B✅ v3机器学习模型与训练
attentionAttention Is All You Need🗄 存量机器学习深度学习 / NLP
atzei-eth-attacks-2017以太坊智能合约攻击综述 — 12 类漏洞的首次系统分类✅ v3安全与隐私安全与隐私
auroraAurora — 把数据库的下半身换成日志机✅ v3数据库数据库系统
aurora-exascale-2024Aurora 2024 — 不用 NVIDIA 也能造 2 EFLOPS 超算✅ v3图形学GPU 架构
autogenAutoGen — 多智能体对话框架✅ v3机器学习智能体与 LLM
avgustinov-codeql-2016QL: Object-Oriented Queries on Relational Data✅ v3安全与隐私安全与隐私
awodey-warren-2009Awodey-Warren — 把『相等的证明』看成两点之间的路径✅ v3形式化方法形式化验证
awqAWQ — 看激活脸色给权重打折✅ v3机器学习模型与训练
awq-2023AWQ 2023 — 让 70B 大模型住进 RTX 4090✅ v3图形学GPU 架构
azure-storage-2011Windows Azure Storage 2011 — 云对象存储第一次在工业界做到强一致✅ v3数据库存储与查询
b-tree-1972B-Tree 1972 — 磁盘友好的索引结构✅ v3数据库存储与查询
b4-2013B4 — Google 用 SDN 把跨数据中心 WAN 利用率拉到 95%+✅ v3网络协议网络协议
badgerBadgerDB — 把键和值分开存的 Go 原生 KV 库✅ v3数据库存储系统
baraff-witkin-1998-clothBaraff-Witkin 1998 — 让布料模拟敢走大时间步✅ v3图形学渲染与图形
barrelfish-2009Barrelfish / Multikernel — 把多核机器当成一个小型网络来设计 OS✅ v3操作系统内核与虚拟化
batchnorm-2015Batch Normalization — 把每层激活值规整到 0 均值 1 方差,深网训练时间砍成 1/14✅ v3机器学习模型与训练
bayou-1995Bayou — 离线先改本地,再回来和别人合并✅ v3分布式系统共识与复制
bbr-2017BBR 2017 — 用瓶颈带宽和最小 RTT 替代丢包当拥塞信号✅ v3网络协议网络协议
beck-tddBeck TDD — 用红绿重构循环让设计自己长出来✅ v3其他软件工程
belady-1966Belady 1966 — 缓存替换的理论最优与 FIFO 异常✅ v3操作系统内核与虚拟化
ben-sasson-stark-2018Scalable, Transparent, and Post-Quantum Secure Computational Integrity✅ v3安全与隐私安全与隐私
bentley-1975-kdtreek-d 树 — 多维空间里的二叉搜索树✅ v3图形学渲染与图形
bentomlBentoML — 把模型 + 依赖 + API 打包成一个能直接跑的盒子✅ v3机器学习MLOps / 模型服务
berenson-1995-isolationBerenson 1995 — ANSI SQL 隔离级别的漏洞与快照隔离✅ v3数据库存储与查询
bernstein-1981-ccBernstein 1981 并发控制综述 — 把分布式数据库的 20+ 算法整成两条主线✅ v3数据库存储与查询
bernstein-sphincs-2015SPHINCS — 无状态哈希签名,后量子密码的”保险”✅ v3安全与隐私安全与隐私
bertBERT — 双向 Transformer 预训练✅ v3NLPNLP
bert4rec-2019BERT4Rec — 把 BERT 的 MLM 搬进序列推荐做双向建模✅ v3信息检索检索与排序
bidirectional-typing双向类型检查 — 推断和检查两个方向交替前进✅ v3编程语言编程语言
biere-bmc-1999Bounded Model Checking — 把硬件验证翻译成一道 SAT 题✅ v3形式化方法形式化验证
big-little-2011big.LITTLE — 让一颗芯片同时装快核和省电核✅ v3图形学GPU 架构
bigbench-2022BIG-bench — 204 道题给大模型出考卷✅ v3机器学习模型与训练
biggan-2018BigGAN — 把 GAN 暴力放大到 ImageNet 512×512✅ v3机器学习模型与训练
bigtable-2006Bigtable 2006 — Google 把行级随机读写做到 PB 级的存储系统🗄 存量数据库存储与查询
bitcoinBitcoin 白皮书✅ v3分布式系统分布式系统 / 密码学
bittorrent-2003BitTorrent — 用”以牙还牙”逼大家都上传✅ v3网络协议网络协议
blackwell-architecture-2024NVIDIA Blackwell — 双 die NV-HBI + 第二代 Transformer Engine + FP4 让万亿参数训练日常化✅ v3图形学GPU 架构
blink-2020Blink — 按拓扑动态拼生成树替代 NCCL ring✅ v3图形学GPU 架构
blinn-1977Blinn 1977 — 用半角向量 H 把高光算量减半✅ v3图形学渲染与图形
blip2-2023BLIP-2 — 用 188M 小桥接器把冻结的视觉模型和大语言模型拼起来✅ v3机器学习模型与训练
block-max-wand-2011Block-Max WAND — 给倒排索引加分块上界,跳过算不过 top-k 的整块✅ v3信息检索检索与排序
bm25-okapiBM25 — 给文档打分的”老配方”✅ v3信息检索数据检索
boehm-gcBoehm-Weiser 保守式垃圾回收 — 不改编译器也能给 C 加 GC✅ v3操作系统内存管理
bohme-aflfast-2016AFLFast — 灰盒 Fuzz 的马尔可夫调度✅ v3安全与隐私安全与隐私
bonawitz-fl-system-2019Bonawitz FL System 2019 — Google 工业级联邦学习系统设计✅ v3安全与隐私安全与隐私
boogie-2005Boogie — 写一次验证后端,多种证明语言复用✅ v3形式化方法形式化验证
borgBorg — Google 把一万台机器假装成一台✅ v3分布式系统分布式系统
borg-omega-kube-2016Borg / Omega / Kubernetes — Google 调度器三代同源✅ v3分布式系统共识与复制
bos-kyber-2018CRYSTALS-Kyber: A CCA-Secure Module-Lattice-Based KEM✅ v3安全与隐私安全与隐私
bowe-halo-2019Halo: Recursive Proof Composition without a Trusted Setup✅ v3安全与隐私安全与隐私
bpr-2009BPR — 用『i 比 j 更受欢迎』替代『i 是正例 j 是负例』✅ v3信息检索检索与排序
brakerski-bgv-2012Fully Homomorphic Encryption without Bootstrapping✅ v3安全与隐私安全与隐私
branch-prediction-yeh-patt-1991Yeh-Patt 1991 — 用最近 12 条分支的历史给 CPU 算命✅ v3图形学GPU 架构
brewer-cap-2000Brewer CAP — 网络一断电,一致性和可用性只能留一个✅ v3数据库存储与查询
brill-moore-2000Brill-Moore 2000 — 把拼写纠错的编辑操作从单字符扩成任意子串✅ v3信息检索检索与排序
brook-2004Brook for GPUs — 让显卡第一次能用人话编程✅ v3图形学GPU 架构
btrfs-2013Btrfs — Linux 上”写时复制 B-tree”的工业级文件系统✅ v3操作系统内核与虚拟化
bunz-bulletproofs-2018Bulletproofs: Short Proofs for Confidential Transactions and More✅ v3安全与隐私安全与隐私
burgess-2020-turing-rtBurgess 2020 RTX ON — Turing 把光线追踪做进硅片✅ v3图形学渲染与图形
bvt-1999BVT 1999 — 让一份调度器同时照顾”急性子”和”老黄牛”✅ v3操作系统内核与虚拟化
byzantine-generals-1982拜占庭将军问题 — 节点能撒谎时怎么达成一致✅ v3分布式系统共识与复制
cadar-klee-2008KLEE — 符号执行自动生成高覆盖测试✅ v3安全与隐私安全与隐私
caesar-rexford-2005Caesar-Rexford 2005 — 你的包为什么绕了大半个地球✅ v3网络协议网络协议
cakemlCakeML — 从源码到机器码每一步都被数学证明的 ML 编译器✅ v3编程语言类型与 PL 理论
calculus-of-constructionsCalculus of Constructions — 让程序和数学证明共用一种语言✅ v3编程语言类型与 PL 理论
calder-2015-anycast-cdnCalder 2015 — Anycast CDN 在生产环境真的能用吗✅ v3网络协议网络协议
call-by-need-1995Call-by-Need Lambda Calculus — 给惰性求值一套真正的演算✅ v3编程语言类型与 PL 理论
calvin-2012Calvin 2012 — 先排好顺序再执行,让跨分区事务不再走 2PC✅ v3数据库存储与查询
cap-12-years-later-2012CAP 十二年后 — Brewer 自己承认”三选二”是误读✅ v3分布式系统共识与复制
capsicum-2010Capsicum: Practical Capabilities for UNIX✅ v3操作系统内核与虚拟化
cascades-1995Cascades 1995 — 用规则 + Memo 拼装一个可扩展查询优化器✅ v3数据库存储与查询
case-for-risc-1980Case for RISC 1980 — 一篇没有芯片的论文,掀起 CPU 半世纪革命✅ v3图形学GPU 架构
cassandra-2010Cassandra 2010 — 把 Dynamo 的 P2P 骨架和 Bigtable 的列族数据模型拼成一个东西✅ v3数据库存储与查询
catmull-1974-zbufferCatmull 1974 Z-buffer — 用一张深度图解决谁挡谁的问题✅ v3图形学渲染与图形
catmull-clark-1978Catmull-Clark 1978 — 让任意拓扑网格收敛成光滑曲面✅ v3图形学渲染与图形
causal-abstractionCausal Abstraction — 神经网络与算法的因果对齐✅ v3机器学习AI 可解释性
cell-be-2005Cell BE — 一颗 CPU 里塞 8 个加速核✅ v3图形学GPU 架构
ceph-2006Ceph — 让分布式文件系统不靠中心查表✅ v3数据库存储与查询
cerf-kahn-1974Cerf-Kahn 1974 — 用网关把异构网络拼成一个互联网✅ v3网络协议网络协议
certikos-2016CertiKOS — 把整个并发内核拆成 30 多层每层都被 Coq 证过✅ v3形式化方法形式化验证
cesiumCesiumJS — 把会动的 3D 地球塞进浏览器✅ v3数据可视化可视化
chaff-2001Chaff 2001 — 把 CDCL 工程化的两个杀手锏✅ v3形式化方法形式化验证
chain-replication-2004Chain Replication — 把多副本排成流水线,简单且强一致✅ v3分布式系统共识与复制
chaitin-graph-coloringChaitin 图染色寄存器分配 — 把硬件资源问题翻译成数学问题✅ v3编程语言类型与 PL 理论
chandy-lamport-1985Chandy-Lamport 1985 — 分布式系统不停机也能拍一张全家福✅ v3分布式系统共识与复制
chapar-2016Chapar — 第一个被机器证明的因果一致 KV 存储✅ v3形式化方法形式化验证
chapter-llama-2025Chapter-Llama — 语音引导采帧,一小时视频一次前向切章节✅ v3机器学习视频理解
chat-univi-2023Chat-UniVi — 动态视觉 token 统一图像与视频对话✅ v3机器学习视频理解
chatbot-arena-2024Chatbot Arena — 让真人盲投,给 LLM 排出公允座次✅ v3机器学习模型与训练
chaum-1981-mixChaum Mix Network — 把匿名通信从理论变成工程✅ v3网络协议网络协议
cheney-gcCheney 1970 — 把活对象复制走,原地丢弃整片堆✅ v3基础设施系统
cheon-ckks-2017Homomorphic Encryption for Arithmetic of Approximate Numbers✅ v3安全与隐私安全与隐私
chillotti-tfhe-2016Faster Fully Homomorphic Encryption: Bootstrapping in Less Than 0.1 Seconds✅ v3安全与隐私安全与隐私
chinchillaChinchilla — 训练大模型的数据/参数最优比✅ v3NLPNLP
chord-2001Chord — 让上万台机器排成圈,查任何 key 都只走 log N 步✅ v3网络协议网络协议
chronos-2024Chronos — 把时间序列当语言来训练大模型✅ v3机器学习模型与训练
chubbyChubby — 给凡人用的分布式锁服务✅ v3分布式系统分布式系统
ci-effectsCI Effects — 持续集成不是免费午餐,价值看实现细节✅ v3其他软件工程
cimatti-nusmv-2002NuSMV 2 — 把 BDD 和 SAT 两种验证引擎装进同一个开源工具✅ v3形式化方法形式化验证
clark-1988Clark 1988 — TCP/IP 七大目标的优先级,决定了 Internet 长成今天这样✅ v3网络协议网络协议
clarke-cegar-2003CEGAR — 用反例自动改进抽象,让大软件能被验证✅ v3形式化方法形式化验证
clarke-emerson-1981Clarke-Emerson 1981 — 让机器自己检查并发程序对不对✅ v3形式化方法形式化验证
classifier-free-guidance-2022Classifier-Free Guidance — 让扩散模型自己听懂条件✅ v3机器学习模型与训练
clawtrace-cost-awareClawTrace — 把 agent 每步操作的”成本账”先算清再蒸馏✅ v3Agent智能体与 LLM
clearmlClearML — 实验跟踪 + 远程执行 + 数据管理三合一✅ v3机器学习MLOps
clickhouseClickHouse — 把列存 OLAP 推到硬件极限✅ v3数据库存储与查询
clipCLIP — Contrastive Language-Image Pre-training✅ v3机器学习多模态 / 计算机视觉
coca-2022CoCa — 把对比和生成两种多模态训练目标合到一个模型里✅ v3机器学习模型与训练
cockroachdb-2020CockroachDB 2020 — 没原子钟也能做全球强一致 SQL 数据库✅ v3数据库存储与查询
cocondenser-2021coCondenser — 让 BERT 的 [CLS] 在预训练就学会”代表整段话”✅ v3信息检索检索与排序
coda-1990Coda 1990 — 笔记本拔网线照样写文件,重连后自动合并✅ v3操作系统内核与虚拟化
codd-1970Codd 1970 — 关系模型奠基✅ v3数据库存储与查询
codd-1979-extendingCodd 1979 — 给关系模型补上”语义”✅ v3数据库存储与查询
code-as-agent-harnessCode as Agent Harness — 把代码当 agent 的”骨架”来重新看 agentic AI✅ v3Agent智能体与 LLM
codellama-2023Code Llama — 开源代码模型的完整训练配方✅ v3机器学习模型与训练
codex-2021Codex — 让 GPT 学会写 Python,并造一把尺子量它✅ v3机器学习模型与训练
codons-2004CoDoNS — 用 P2P 哈希表替代分层 DNS 的实验✅ v3网络协议网络协议
coeffect-petricekCoeffects — 让类型系统追踪「需要多少上下文」✅ v3编程语言类型与 PL 理论
cognitive-load-theoryCognitive Load Theory — 学不会不是不努力,是工作记忆装不下✅ v3其他认知科学
cohen-1985-hemicubeCohen-Greenberg 1985 Hemicube — 把渲染硬件挪去算辐射度积分✅ v3图形学渲染与图形
colbert-2020ColBERT — 让 BERT 检索既准又能扛大规模✅ v3信息检索检索与排序
colbert-v2ColBERTv2 — 让向量检索既精又能扛百万文档✅ v3信息检索数据检索
comer-1979-btreeComer 1979 — B-Tree 综述:为什么这棵树到处都有✅ v3数据库存储与查询
compcertCompCert — 每条优化都被数学证明保持语义的 C 编译器✅ v3编程语言类型与 PL 理论
compiler-errorsCompiler Error Messages — 让编译报错有用✅ v3编程语言编程语言 / 编译器
consistency-models-2023Consistency Models — 把 50 步扩散压成 1 步出图✅ v3机器学习模型与训练
consistent-hashing-1997Consistent Hashing — 加机器只搬一小部分数据的哈希环✅ v3分布式系统共识与复制
constitutional-aiConstitutional AI — Anthropic 的对齐方法✅ v3机器学习AI 安全 / NLP
cook-1984-distributed-ray-tracingDistributed Ray Tracing — 把所有”模糊”效果统一成随机采样✅ v3图形学渲染与图形
cook-1986-stochastic-samplingCook 1986 — 用噪声换掉锯齿✅ v3图形学渲染与图形
cook-levinCook-Levin 定理 — NP-完全性的诞生✅ v3编程语言计算理论
cook-torrance-1982Cook-Torrance 1982 — 把镜面反射拆成微面元 × 几何遮挡 × Fresnel✅ v3图形学渲染与图形
copilot-rctCopilot RCT — AI 编程助手的第一个严格随机对照实验✅ v3其他软件工程实证
cops-2011COPS — 大规模跨地域存储如何用得起的代价拿到因果一致✅ v3分布式系统共识与复制
costan-sgx-explained-2016Intel SGX 详解 — 在不可信云里圈一块硬件保险箱✅ v3安全与隐私安全与隐私
cotChain-of-Thought Prompting✅ v3机器学习AI / LLM
coturncoturn — 帮 WebRTC 穿越 NAT 的开源中转服务器✅ v3基础设施基础设施
couchdbCouchDB — 把 HTTP + 多版本 + 多主复制揉成离线优先数据库✅ v3数据库数据库
countervqa-2025CounterVQA — 因果图驱动的反事实视频 VQA✅ v3机器学习视频理解
cousot-abstract-interpretationCousot 抽象解释 — 给静态分析一套统一数学框架✅ v3编程语言类型与 PL 理论
cousot-halbwachs-polyhedra-1978Cousot-Halbwachs 凸多面体域 — 让分析器自己发现变量间的线性关系✅ v3形式化方法形式化验证
cover-2025COVER — 四象限反事实视频推理 benchmark✅ v3机器学习视频理解
craq-2009CRAQ — 让链复制每个节点都能读,吞吐线性扩展✅ v3分布式系统共识与复制
crdt-jsonCRDT JSON — 协同编辑 JSON 数据结构✅ v3分布式系统分布式系统
crdt-json-2017CRDT JSON 2017 — 给嵌套 JSON 一套有数学证明的合并算法✅ v3分布式系统共识与复制
crdt-shapiro-2011CRDT — 让多副本各改各的,最终自动合一✅ v3分布式系统共识与复制
crdt-sss-2011CRDT 形式定义 — SSS 2011 八页浓缩版✅ v3分布式系统共识与复制
croft-harper-1979Croft-Harper 1979 — 没有相关性反馈也能跑概率检索✅ v3信息检索检索与排序
cryptoverif-2008CryptoVerif — 让计算机直接证密码协议在真实计算模型下安全✅ v3形式化方法形式化验证
csp-hoare-1978CSP — 进程之间只许喊话不许共用内存✅ v3编程语言类型与 PL 理论
cstore-2005C-Store — 把数据按列存,分析查询直接快十倍✅ v3数据库存储与查询
cubic-2008CUBIC 2008 — Linux 默认拥塞控制,三次曲线把千兆带宽喂饱✅ v3网络协议网络协议
cubical-type-theory-2018Cubical Type Theory — 让 Univalence 公理真的能算出结果✅ v3形式化方法形式化验证
cuda-streams-concurrency-2018CUDA Streams 并发量化研究 — 为什么 SM 利用率拉不满✅ v3图形学GPU 架构
cudnn-2014cuDNN — 把卷积写成矩阵乘,让所有深度学习框架共享底层加速✅ v3图形学GPU 架构
curless-levoy-1996-tsdfCurless-Levoy TSDF — 把多次扫描融成一个干净的 3D 模型✅ v3图形学渲染与图形
cutlass-2020CUTLASS — 把 SOTA GEMM 拆成可组合的 C++ 模板层级✅ v3图形学GPU 架构
cytoscape-jsCytoscape.js — 浏览器里画网络图、跑图算法的 JS 库✅ v3数据可视化可视化
dafny-2010Dafny — 把”代码该满足的条件”直接写进语法,编译器自动证明✅ v3形式化方法形式化验证
daian-flash-boys-2020Flash Boys 2.0 — 区块链上的抢跑者和共识危机✅ v3安全与隐私安全与隐私
dalle-2DALL-E 2 — 基于 CLIP + 扩散的图像生成✅ v3机器学习生成模型 / 计算机视觉
danezis-sphinx-2009Sphinx — mix 网络最紧凑的可证安全消息格式✅ v3安全与隐私安全与隐私
dapper-2010Dapper — Google 大规模分布式系统链路追踪基础设施✅ v3分布式系统共识与复制
dash-numa-1992Stanford DASH — 第一台真跑起来的目录式 CC-NUMA 多处理器✅ v3图形学GPU 架构
dataflow-model-2015Dataflow Model — 流处理的四问框架✅ v3数据库存储与查询
davis-putnam-1960Davis-Putnam 1960 — 让机器自动判断一堆逻辑式能不能同时成立✅ v3形式化方法形式化验证
dcn-2017DCN — 在 DNN 旁边并联一条专门学特征交叉的网络✅ v3信息检索检索与排序
ddim-2020DDIM — 把扩散模型 1000 步采样压到 50 步✅ v3机器学习模型与训练
ddpmDDPM — Denoising Diffusion Probabilistic Models🗄 存量机器学习生成模型
debate-2018AI safety via debate — 让两个 AI 互辩,人类只当评委✅ v3机器学习模型与训练
deberta-2021DeBERTa — 把”内容”和”位置”拆成两路独立看的 BERT✅ v3机器学习模型与训练
debevec-1998-rendering-with-natural-lightDebevec 1998 — 用真实世界的光照亮 CG 物体✅ v3图形学渲染与图形
debugging-dichotomyDebugging Dichotomy — 程序员真实 debug 行为分两轨✅ v3其他软件工程实证
decision-transformer-2021Decision Transformer — 把强化学习当成”文字接龙”✅ v3机器学习模型与训练
deepseek-coder-2024DeepSeek-Coder — 按整个仓库喂代码的开源 SOTA✅ v3机器学习模型与训练
deepseek-r1DeepSeek R1 — 强化学习推理模型✅ v3机器学习模型与训练
deepspeed-zeroDeepSpeed ZeRO — 微软优化大模型训练显存✅ v3分布式系统模型与训练
deering-1988-triangle-processorDeering 1988 Triangle Processor — 现代 GPU 的祖先架构✅ v3图形学渲染与图形
demikernel-2021Demikernel — 微秒级数据中心的 datapath OS 架构✅ v3操作系统内核与虚拟化
denali-2002Denali — 在一台机器上同时跑上千个轻量 VM 的早期实验✅ v3操作系统内核与虚拟化
dense360-2025Dense360 — 全景 ERP 密集理解与 ERP-RoPE✅ v3机器学习视频理解
desbrun-1999-implicit-fairingDesbrun 1999 — 把热扩散方程隐式离散到三角网✅ v3图形学渲染与图形
dewitt-gray-1992DeWitt-Gray 1992 — 并行数据库取代专用机的宣言✅ v3数据库存储与查询
differential-datalogDDlog (Differential Datalog) — 输入只改一条,引擎只算受影响的那一小块✅ v3编程语言类型与 PL 理论
diffie-hellmanDiffie-Hellman 密钥交换✅ v3安全与隐私密码学
diffie-hellman-1976New Directions 1976 — 给协议世界写下公钥宪法✅ v3网络协议网络协议
dijkstra-1965Dijkstra 1965 — N 个进程怎么轮流上厕所而且谁也别卡死✅ v3操作系统内核与虚拟化
dijkstra-gotoDijkstra 1968 — Go To Statement Considered Harmful✅ v3其他软件工程 / 控制流理论
dijkstra-shortest-pathDijkstra 最短路径 — 一杯咖啡时间想出来的贪心算法✅ v3编程语言算法
din-2018DIN — 让推荐模型按你看的广告决定该激活你哪段历史✅ v3信息检索检索与排序
dingledine-mixminion-2003Mixminion 2003 — 让回复消息和发送消息共享同一张匿名面罩✅ v3安全与隐私安全与隐私
dinoDINO 自监督视觉 transformer✅ v3机器学习自监督视觉
disco-1997Disco — 让没改过的商用 OS 在 64 核大机器上一起跑✅ v3操作系统内核与虚拟化
disel-2018Disel — 把分布式协议拆成可独立证明、可拼装的 Coq 模块✅ v3形式化方法形式化验证
diskann-2019DiskANN — 单机十亿向量近邻检索(图存 SSD)✅ v3数据库存储与查询
disney-brdf-2012Disney Principled BRDF 2012 — 11 个滑块封装 Cook-Torrance 全家桶✅ v3图形学渲染与图形
distserveDistServe — 把 prefill 和 decode 拆到不同 GPU 上跑✅ v3机器学习数据科学与 AI
ditDiT — Diffusion Transformer✅ v3机器学习生成模型
dlrm-2019DLRM — Meta 把工业推荐模型拆成 4 个标准积木✅ v3信息检索检索与排序
dnsDNS — 把全球域名解析切成一棵可分布维护的树✅ v3网络协议网络协议
doc2query-2019doc2query — 让模型替文档预想”会被怎么搜”再写进倒排表✅ v3信息检索检索与排序
doligez-leroy-concurrent-gcDoligez-Leroy GC — OCaml 多线程并发垃圾回收✅ v3编程语言类型与 PL 理论
donar-2010DONAR 2010 — 把 DNS 全球调度写成一道可解的优化题✅ v3网络协议网络协议
dot-doh-perf-2020DoT/DoH 性能 — 给 DNS 加密之后网页变快还是变慢✅ v3网络协议网络协议
double-descent-2019Double Descent — 模型越大越准,过参数化时代的反常识曲线✅ v3机器学习模型与训练
dpll-1962DPLL 1962 — 把”逻辑判定”从内存爆炸救成栈式回溯✅ v3形式化方法形式化验证
dpoDPO — Direct Preference Optimization🗄 存量NLPNLP
dpr-2020DPR — 用 BERT 双塔把检索从 BM25 时代拉进稠密向量时代✅ v3信息检索检索与排序
dqnDQN — Deep Q-Network✅ v3机器学习强化学习
dreamfusion-2022DreamFusion — 用 2D 扩散模型当老师,把 NeRF 教成 3D✅ v3机器学习模型与训练
drizzle-2017Drizzle — 让 micro-batch 也能跑出 100ms 延迟✅ v3分布式系统共识与复制
drmm-2016DRMM — 检索里的匹配是相关性不是语义相似✅ v3信息检索检索与排序
dropout-2014Dropout — 训练时随机关掉一半神经元,反而学得更好✅ v3机器学习模型与训练
dspyDSPy — 把 prompt 写成签名,让编译器替你调✅ v3编程语言编程语言
dssm-2013DSSM — 把 query 和文档各编码成 128 维向量再算余弦✅ v3信息检索检索与排序
dstreams-2013D-Streams — 把流处理伪装成一串很小的批✅ v3数据库存储与查询
ducas-dilithium-2018CRYSTALS-Dilithium — 量子计算机来了也签不掉的数字签名✅ v3安全与隐私安全与隐私
duchi-local-dp-2013Local Privacy and Statistical Minimax Rates✅ v3安全与隐私安全与隐私
duckdb-2019DuckDB — 把 OLAP 数据库塞进你的 Python 进程✅ v3数据库存储与查询
dwork-calibrating-noise-2006校准噪声与敏感度 — Laplace 机制奠基✅ v3安全与隐私安全与隐私
dwork-dp-icalp-2006差分隐私 — ε 与邻接数据集不可区分✅ v3安全与隐私安全与隐私
dwork-our-data-ourselves-2006分布式噪声生成 — 去掉可信管理员也能保护隐私✅ v3安全与隐私安全与隐私
dynamoDynamo — 让购物车永远能写入的分布式存储✅ v3分布式系统分布式系统
e5-2022E5 — 用海量”自然出现的文本对”训通用 embedding✅ v3信息检索检索与排序
eagleEAGLE — 让大模型先在”特征层”猜下一步而不是猜 token✅ v3机器学习模型与训练
earley-parserEarley Parser — 一个表能解析任何 CFG 的通用解析器✅ v3编程语言类型与 PL 理论
easycrypt-2011EasyCrypt — 让密码学家的安全证明能被机器自动检查✅ v3形式化方法形式化验证
ebpfeBPF — 用户写小程序,内核证明安全后再跑✅ v3操作系统操作系统
edm-2022EDM — 把扩散模型的训练配方一次拆清楚✅ v3机器学习模型与训练
effect-handlers代数效应(Algebraic Effects)✅ v3编程语言编程语言
effiskillEffiSkill — 把代码效率优化经验抽成两层 skill 库✅ v3Agent智能体与 LLM
egoschema-2023EgoSchema — 三分钟第一视角长视频理解的诊断探针✅ v3机器学习视频理解
electra-2020ELECTRA — 把猜词题改成判真假题,训练效率 4 倍✅ v3机器学习模型与训练
elmo-2018ELMo — 让词向量随上下文变化✅ v3机器学习模型与训练
emqxEMQX — Erlang 写的 MQTT broker,单集群扛千万 IoT 长连接✅ v3基础设施infrastructure
epaxos-2013EPaxos — 没有 leader 的 Paxos,让每个副本平起平坐✅ v3分布式系统共识与复制
erlang-otpErlang OTP — 容错并发系统设计✅ v3编程语言编程语言 / 分布式系统
erlingsson-rappor-2014RAPPOR — 本地差分隐私随机响应采集✅ v3安全与隐私安全与隐私
eros-1999EROS — 让 capability 内核跑得跟 Linux 一样快✅ v3操作系统内核与虚拟化
eswaran-1976Eswaran 1976 — 串行化与谓词锁的源头✅ v3数据库存储与查询
esx-memory-2002ESX Memory 2002 — 让一台机器假装比自己更大的四个魔术✅ v3操作系统内核与虚拟化
ethane-2007Ethane 2007 — 把企业网安全策略集中到一台中央电脑上✅ v3网络协议网络协议
eve-agent-evidenceEVE-Agent — 自我训练前先把证据钉在桌上✅ v3Agent智能体与 LLM
evo-memory-2511Evo-Memory — 给”会自己长记性”的 agent 出一份统一考卷✅ v3Agent智能体与 LLM
exg-experience-graphsEXG 经验图 — 把 agent 的成败拼成一张可复用的关系图✅ v3Agent智能体与 LLM
exokernel-1995Exokernel — 把抽象推到用户态的极致设计✅ v3操作系统内核与虚拟化
f1-2013F1 2013 — 把 Spanner 包成 SQL,扛起 AdWords 全部账单✅ v3数据库存储与查询
f4-2014f4 — Facebook 把 90 天前的旧图片搬到一个省 40% 存储的仓库✅ v3分布式系统共识与复制
faiss-2017FAISS 2017 — 用 GPU 在十亿向量里找最近邻✅ v3数据库存储与查询
fan-vercauteren-bfv-2012Somewhat Practical Fully Homomorphic Encryption✅ v3安全与隐私安全与隐私
farsite-2002Farsite — 把一群不可信桌面 PC 拼成一台可信文件服务器✅ v3操作系统内核与虚拟化
fast-paxos-2006Fast Paxos — 给 Paxos 加一条乐观快车道✅ v3分布式系统共识与复制
fastertransformer-2021FasterTransformer 2021 — NVIDIA 第一代开源 LLM 推理引擎✅ v3图形学GPU 架构
fat-tree-2008Fat-Tree 2008 — 用一堆便宜交换机搭出现代数据中心✅ v3网络协议网络协议
feautrier-polyhedralFeautrier 多面体调度 — 把循环并行化变成解几何方程✅ v3编程语言类型与 PL 理论
fermi-architecture-2010NVIDIA Fermi — 把 GPU 从游戏卡推上超算✅ v3图形学GPU 架构
ffs-1984FFS — 把磁盘几何写进文件系统✅ v3操作系统内核与虚拟化
fidge-1988Fidge 1988 — 给每个进程一份”账本向量”,让因果关系变成可判定✅ v3分布式系统共识与复制
fielding-rest-2000Fielding 2000 — 用约束推导法把 Web 的成功讲成了一门方法✅ v3网络协议网络协议
filip-2021FILIP — 把 CLIP 的图文对齐细化到 token 级✅ v3信息检索检索与排序
firecracker-2020Firecracker 2020 — 给 serverless 量身定做的极简 microVM✅ v3操作系统内核与虚拟化
flamingo-2022Flamingo — 让冻结的大模型学会看图,几张样例就上手✅ v3机器学习模型与训练
flan-2021FLAN — 用自然语言指令教模型学会”听话”✅ v3机器学习模型与训练
flash-attentionFlashAttention — 不改算法,只改数据怎么进 GPU✅ v3图形学GPU 与系统
flash-vstream-2024Flash-VStream — STAR 双进程记忆的低延迟长流理解✅ v3机器学习视频理解
flexible-paxos-2016Flexible Paxos — 两阶段不一定都要多数派✅ v3分布式系统共识与复制
flexsc-2010FlexSC — 把系统调用从同步陷入改成异步队列✅ v3操作系统内核与虚拟化
flink-2015Apache Flink — 流批一体的单引擎✅ v3数据库存储与查询
flink-snapshots-2015Flink 异步快照 — 不停机给流处理拍一致照片✅ v3分布式系统共识与复制
flp-1985FLP 1985 — 一个坏节点就能让异步共识永不终止✅ v3分布式系统共识与复制
foundationdb-2021FoundationDB 2021 — 把数据库拆成五个角色,再用一个 seed 烧十年 bug✅ v3数据库存储与查询
fpga-hls-2011FPGA HLS 2011 — 把 C 代码自动翻译成芯片电路的范式✅ v3图形学GPU 架构
frama-c-2012Frama-C — 一个开源平台把 C 程序的多种验证方法拼到一起✅ v3形式化方法形式化验证
frangipani-1997Frangipani — 把分布式文件系统盖在共享虚拟磁盘上✅ v3操作系统内核与虚拟化
frank-effectsFrank — 让 effect handler 写得就像普通函数✅ v3编程语言类型与 PL 理论
freedman-psi-2004Freedman-Nissim-Pinkas PSI 2004 — 两个人怎么找共同好友而不暴露各自通讯录✅ v3安全与隐私安全与隐私
frenetic-2011Frenetic 2011 — 把 OpenFlow 流表换成函数式程序✅ v3网络协议网络协议
fsdp-2023PyTorch FSDP — 把大模型切成 N 份分到 N 张卡✅ v3图形学GPU 架构
fsrs-spaced-repetitionFSRS — 让 Anki 知道每张卡什么时候快被你忘掉✅ v3其他学习与认知
fstarF* — 把依赖类型、SMT 自动化、副作用追踪揉到一门语言里✅ v3编程语言类型与 PL 理论
g1-collectorG1 Garbage-First — 给暂停时间设个预算的垃圾回收器✅ v3编程语言类型与 PL 理论
gabizon-plonk-2019PLONK: Permutations over Lagrange-bases for Oecumenical Noninteractive arguments of Knowledge✅ v3安全与隐私安全与隐私
gadt-pjonesGADT — 让构造子告诉编译器”我返回的是更精确的类型”✅ v3编程语言类型与 PL 理论
game-semantics-pcf博弈论语义与 PCF — 把程序解释成两个人轮流下的对话棋✅ v3编程语言类型与 PL 理论
gao-2001-as-relationsGao 2001 — 用算法猜出互联网上 AS 之间谁给谁付钱✅ v3网络协议网络协议
garland-heckbert-1997-qemQEM — 给三角网格『瘦身』时算每一刀的代价✅ v3图形学渲染与图形
gat-2018GAT — 让图神经网络的邻居自带权重✅ v3机器学习模型与训练
gbrank-2007GBRank — 把决策树堆起来学排序,一棵树纠正一处错排✅ v3信息检索检索与排序
gcc-webrtc-2016Analysis and Design of the Google Congestion Control for Web Real-time Communication (WebRTC)✅ v3网络协议网络协议
gcn-2017GCN 2017 — 把卷积搬到图结构上的最简版本✅ v3机器学习模型与训练
gemini-1.5-2024Gemini 1.5 — 百万 token 多模态长上下文✅ v3机器学习多模态 LLM
generational-gcGenerational GC — 把全堆扫描换成”频繁扫小区,偶尔扫整堆”✅ v3编程语言编程语言
gentry-fhe-2009Gentry FHE — 全同态加密开山✅ v3安全与隐私安全与隐私
gfsGFS — 编译器决定不做哪些事✅ v3分布式系统分布式系统
ghost-2021ghOSt — 把 Linux 调度策略搬到用户态去写✅ v3操作系统内核与虚拟化
gilbert-lynch-2002Gilbert-Lynch 2002 — 把 CAP 从口号写成数学定理✅ v3分布式系统共识与复制
gin-2019GIN — 把图神经网络的表达力顶到理论天花板✅ v3机器学习模型与训练
glue-2018GLUE — 给 NLU 模型出一张包含 9 道题的统考卷✅ v3机器学习模型与训练
gmw-mental-game-1987GMW 1987 — 任何函数都能让多方安全地一起算✅ v3安全与隐私安全与隐私
goal-misgeneralization-2022Goal Misgeneralization — 奖励函数完全正确,AI 还是可能学歪✅ v3机器学习模型与训练
godel-1931Gödel 1931 — 不完备性定理✅ v3形式化方法数学逻辑 / 计算理论
goldsmith-1987-bvhGoldsmith-Salmon 1987 — 让计算机自己给场景搭层次包围盒✅ v3图形学渲染与图形
goodfellow-fgsm-2014FGSM — 用一行梯度让神经网络看错图片✅ v3安全与隐私安全与隐私
google-1998Google 1998 — 把整个网络爬下来、压扁、再用一秒查到✅ v3信息检索检索与排序
goral-1984-radiosityGoral 1984 Radiosity — 把建筑工程的辐射热传导算法搬进图形学✅ v3图形学渲染与图形
gortler-1996-lumigraphLumigraph — 给 4D 光场加一层粗糙几何,让插值不再鬼影✅ v3图形学渲染与图形
gpipe-2019GPipe — micro-batch 流水线让 GPU 排成生产线✅ v3图形学GPU 架构
gpt-3GPT-3 — Language Models are Few-Shot Learners✅ v3NLPNLP
gptq-2023GPTQ — 把 175B 大模型压成 4-bit 还几乎不掉点✅ v3图形学GPU 架构
gpu-cache-coherence-2013GPU 缓存一致性 — 用时戳代替失效消息✅ v3图形学GPU 架构
gpu-microbenchmarking-2010GPU 微基准 — 用秒表把闭源芯片”戳”出真相✅ v3图形学GPU 架构
gpudirect-rdma-2014GPUDirect RDMA — 让网卡直接读写 GPU 显存✅ v3图形学GPU 架构
graalvm-truffleGraalVM Truffle — 写一棵会自我特化的语法树就能自动得到 JIT✅ v3编程语言类型与 PL 理论
gradual-typing渐进类型 — 让动态和静态类型在同一份代码里共存✅ v3编程语言类型与 PL 理论
graf-saidi-1997Graf-Saïdi — 用谓词把无限状态压成有限抽象✅ v3形式化方法形式化验证
granuleGranule — 让类型系统同时数次数、看安全级、追副作用✅ v3编程语言类型与 PL 理论
graphormer-2021Graphormer — 标准 Transformer 直接刷爆 GNN✅ v3机器学习模型与训练
graphragGraphRAG — 微软的知识图谱 + RAG🗄 存量机器学习AI / NLP
graphsage-2017GraphSAGE 2017 — 给没见过的节点也能算嵌入✅ v3机器学习模型与训练
gray-1978-notesGray 1978 — 数据库操作系统讲义,事务/2PL/2PC/恢复一次讲完🗄 存量分布式系统共识与复制
gray-1981-transactionGray 1981 — 把”事务”提升为通用抽象✅ v3数据库存储与查询
great-sweGreat SWE — 资深工程师”伟大”的标准是 humble + always learning✅ v3其他软件工程
grokking-2022Grokking — 训练 loss 早归零,几千步后才突然学会✅ v3机器学习模型与训练
grounded-videollm-2024Grounded-VideoLLM — 双流编码 + 时间 token,把「何时发生」写进 Video LLM✅ v3机器学习视频理解
gru-2014GRU 2014 — 用两个门替代 LSTM 三个门,编码-解码范式登场✅ v3机器学习模型与训练
gshard-2020GShard — 用注解让 600B 模型自动跨设备切片✅ v3图形学GPU 架构
hacl-star-2017HACL* — 用数学证明过的 C 加密代码,跑在你 Firefox 和 Linux 内核里✅ v3形式化方法形式化验证
halideHalide — 把”算什么”和”怎么算”分开写✅ v3编程语言类型与 PL 理论
hamming-1950Hamming 纠错码✅ v3机器学习信息论
hanrahan-1991-hierarchical-radiosityHanrahan 1991 Hierarchical Radiosity — 让 radiosity 从 O(n²) 跌到 O(n)✅ v3图形学渲染与图形
haven-2014Haven — 把整个应用装进 CPU 黑盒,让云服务商也看不见✅ v3操作系统内核与虚拟化
hawkeye-2024HawkEye — 用递归缩窗把文本查询钉在长视频时间轴上✅ v3机器学习视频理解
haystack-2010Haystack — Facebook 十亿张照片怎么存✅ v3数据库存储与查询
hazard-pointers-2004Hazard Pointers — 多线程下安全释放共享节点✅ v3操作系统内核与虚拟化
hdfs-2010HDFS — 把 GFS 用 Java 重写一遍并撑到 25 PB✅ v3数据库存储与查询
heartbleed-2014Heartbleed — 一个忘了写边界检查的 bug 让全网 1/3 的 HTTPS 站点漏内存✅ v3网络协议网络协议
heckbert-1986-texture-surveyHeckbert 1986 — 把”贴图”这件事讲清楚的第一篇综述✅ v3图形学渲染与图形
helium-type-errorsHelium — 让类型错误说人话的教学版 Haskell✅ v3编程语言类型与 PL 理论
helland-2007Life Beyond Distributed Transactions — 大规模系统下放弃跨机事务的宣言✅ v3分布式系统共识与复制
herlihy-moss-tmHerlihy-Moss 事务内存 — 把数据库事务搬进 CPU✅ v3编程语言类型与 PL 理论
hewitt-actor-modelHewitt Actor 模型 — 把计算拆成一群只会发消息的小邮筒✅ v3编程语言类型与 PL 理论
hindley-milnerHindley-Milner — 编译器自己猜变量类型🗄 存量编程语言编程语言
hits-1999HITS — 给网页同时打两个分:权威页 + 索引页✅ v3信息检索检索与排序
hlc-2014HLC 2014 — 把逻辑时钟和物理时钟合一,让普通服务器也能拍一致快照✅ v3分布式系统共识与复制
hnsw-2018HNSW — 多层近邻图让向量检索从 O(N) 降到近似 O(log N)✅ v3数据库存储与查询
hoare-logicHoare Logic — 把”程序对不对”变成”数学证明对不对”🗄 存量编程语言编程语言 / 形式化方法
hol-light-2009HOL Light — 不到 500 行 OCaml 写出能证开普勒猜想的证明助手✅ v3形式化方法形式化验证
holzmann-spin-1997SPIN — 让计算机帮你穷举并发程序的所有可能执行✅ v3形式化方法形式化验证
hopper-architecture-2022NVIDIA Hopper — Transformer Engine + FP8 + TMA + Thread Block Cluster 把硅片为 LLM 量身定制✅ v3图形学GPU 架构
hotspot-server-compilerHotSpot Server Compiler — JVM 在运行时把热点 Java 代码翻译成飞快的本地码✅ v3编程语言类型与 PL 理论
hotstuff-2019HotStuff — 让换领导也只花线性消息的 BFT 共识✅ v3分布式系统共识与复制
hott-book-2013HoTT Book — 把”相等”重定义为路径,再让数学和程序共用同一本教材✅ v3形式化方法形式化验证
hour-llava-2025Hour-LLaVA — 记忆增强,让 LLaVA 读懂一小时视频✅ v3机器学习视频理解
http-2HTTP/2 — 把 HTTP 从文本协议改造成二进制多路复用✅ v3网络协议网络协议
hu-2018-mls-mpmMLS-MPM — 把 MPM 重写到”几百行能跑实时”的现代版本✅ v3图形学渲染与图形
huffman-1952Huffman 编码✅ v3机器学习信息论 / 算法
hughes-fp-mattersWhy FP Matters — 函数式真正赢在能拆能粘✅ v3编程语言类型与 PL 理论
hydra-1974HYDRA — 用 capability 把整个内核重做成对象 + 票据✅ v3操作系统内核与虚拟化
hyperkernel-2017Hyperkernel — 让 SMT 求解器一键验证操作系统内核✅ v3形式化方法形式化验证
ice-rfc-5245Interactive Connectivity Establishment (ICE): A Protocol for Network Address Translator (NAT) Traversal✅ v3网络协议网络协议
idris-bradyIdris — 让依赖类型从证明助理变成通用编程语言✅ v3编程语言类型与 PL 理论
imagen-2022Imagen — 文生图真正的引擎是语言模型✅ v3机器学习模型与训练
immix-mark-regionImmix — 把”扫”和”搬”两种垃圾回收揉成一个✅ v3编程语言类型与 PL 理论
indri-2005Indri 2005 — 把语言模型、推断网络、结构化查询拼成一个搜索引擎✅ v3信息检索检索与排序
induction-headsInduction Heads — Transformer 的 in-context learning 引擎✅ v3机器学习AI 可解释性
infer-biabductionBi-Abduction — 让静态分析自动猜出函数缺什么前提✅ v3编程语言类型与 PL 理论
ingres-1976INGRES 1976 — Berkeley 平行实现的关系数据库✅ v3数据库存储与查询
instant-ngp-2022Instant-NGP — 秒级训练 NeRF 的多分辨率哈希编码✅ v3机器学习模型与训练
instructgptInstructGPT — RLHF 让 LLM 听话✅ v3NLPNLP
internvideo2-2024InternVideo2 — 三阶段渐进训练,把视频基础模型扩到 6B✅ v3机器学习视频理解
internvideo2-5-2025InternVideo2.5 — 长富上下文 + HiCo 层次压缩✅ v3机器学习视频理解
internvl-2023InternVL — 6B 视觉基座 + QLLaMA 对齐开源多模态✅ v3机器学习模型与训练
io-uringio_uring — Linux 让 N 次 IO 摊销到 1 次 syscall✅ v3操作系统操作系统
ipfs-2014IPFS — 把”地址”换成”内容本身”的 P2P 文件系统✅ v3网络协议网络协议
iris-2015Iris 2015 — 把并发推理拆成 monoid + invariant 两块积木✅ v3形式化方法形式化验证
ironfleet-2015IronFleet — 把分布式协议证到一行 bug 都没有✅ v3形式化方法形式化验证
isabelle-hol-2002Isabelle/HOL — 让程序证明像写数学论文一样可读✅ v3形式化方法形式化验证
islands-architectureIslands Architecture — 静态页面里只让需要交互的小块加载 JS✅ v3后端 API前端框架
ix-2014IX 数据面操作系统 — 用虚拟化把高吞吐和低延迟同时塞进内核✅ v3操作系统内核与虚拟化
jacobson-1988Jacobson 1988 — 让互联网不再被自己塞死✅ v3网络协议网络协议
janus-2016Janus 2016 — 把并发控制和共识捏成一个协议✅ v3分布式系统共识与复制
jemalloc-2006jemalloc — 多 arena 让多线程 malloc 不再互相等✅ v3操作系统内核与虚拟化
jensen-1996-photon-mappingJensen 光子映射 — 先撒光子再查密度的两 pass 全局光照✅ v3图形学渲染与图形
jupiter-1995Jupiter — 把 OT 简化成 client-server,让协同编辑能上工业✅ v3分布式系统共识与复制
jupiter-2015Jupiter Rising — Google 数据中心网络十年怎么做到带宽涨百倍✅ v3网络协议网络协议
jwt-rfc-7519JWT RFC 7519 — 把身份证装进一段可校验的字符串✅ v3后端 API后端
k3sk3s — 把整个 Kubernetes 装进一个 70 MB 的二进制✅ v3基础设施基础设施
kademlia-2002Kademlia — 用 XOR 当距离的 P2P 路由表✅ v3网络协议网络协议
kafkaKafka — 把消息系统降维成只追加的日志文件✅ v3分布式系统databases / 分布式系统
kafka-2011Kafka NetDB 2011 — 把消息中间件砍成”会写文件的水管”✅ v3数据库存储与查询
kahn-natural-semanticsKahn 自然语义 — 用一棵推理树说清楚程序求值✅ v3编程语言类型与 PL 理论
kairouz-advances-fl-2019联邦学习综述 — 60+ 作者合写的联邦学习百科与 58 道开放题✅ v3安全与隐私安全与隐私
kajiya-1986-rendering-equationKajiya 渲染方程 — 把所有渲染算法统一成一个积分方程✅ v3图形学渲染与图形
kami-2017Kami — 在 Coq 里造硬件并自动编译到 Verilog✅ v3形式化方法形式化验证
karger-1997-consistent-hashingKarger 1997 一致性哈希 — 加机器不用全员搬家✅ v3网络协议网络协议
karis-2014-taaKaris 2014 TAA — 让游戏每帧只采一次也能 4K 不锯齿✅ v3图形学渲染与图形
karis-2014-ue4-pbrKaris UE4 PBR — 把电影质感塞进游戏的 33 毫秒✅ v3图形学渲染与图形
karp-21Karp 21 — 21 个 NP-完全问题✅ v3编程语言计算理论
karras-2012-parallel-bvhKarras 2012 — 让每个 BVH 内部节点独立算自己(O(N) 全并行 GPU 构建)✅ v3图形学渲染与图形
kazhdan-2006-poisson-reconPoisson Surface Reconstruction — 把点云变成水密网格的全局解法✅ v3图形学渲染与图形
kepler-architecture-2012NVIDIA Kepler — 把 GPU 调成深度学习训练默认机型✅ v3图形学GPU 架构
kildall-dataflowKildall 数据流框架 — 用一套格论统一所有全局编译优化✅ v3编程语言类型与 PL 理论
kim-rowhammer-2014RowHammer — 只读内存也能把邻居的 bit 敲 flip✅ v3安全与隐私安全与隐私
knrm-2017K-NRM — 用核函数把交互矩阵变成可微排序信号✅ v3信息检索检索与排序
knuth-lr-1965Knuth LR(k) — 编译器自己读懂语法的算法✅ v3编程语言类型与 PL 理论
knuth-taocpKnuth TAOCP — 计算机程序设计艺术✅ v3编程语言算法
kocher-spectre-2019Spectre 攻击 — 推测执行偷看别人的内存✅ v3安全与隐私安全与隐私
kokkos-2014Kokkos — 一份 C++ 代码同时跑 CPU、GPU、Xeon Phi✅ v3图形学GPU 架构
koren-mf-2009Koren-Bell-Volinsky 2009 — 把推荐系统的 MF 写成 8 页教科书✅ v3信息检索检索与排序
krishnamurthy-1999-http11Krishnamurthy 1999 — HTTP/1.0 到 1.1 究竟改了什么✅ v3网络协议网络协议
kubernetes-2016Kubernetes — 为什么选声明式 API 加协调环✅ v3操作系统内核与虚拟化
kustomizeKustomize — 不写模板也能给 K8s 配置分环境🗄 存量基础设施基础设施
kvm-2007KVM 2007 — 把 Linux 内核本身变成 hypervisor✅ v3操作系统内核与虚拟化
l4-1995L4 — Liedtke 用 12KB 内核反驳”微内核必然慢”✅ v3操作系统内核与虚拟化
label-smoothing-2016Label Smoothing — 别让模型对正确答案过度自信✅ v3机器学习模型与训练
lafortune-1993-bdptLafortune-Willems 1993 — 从相机和光源同时撒光线再”接龙”✅ v3图形学渲染与图形
lalr-deremerDeRemer LALR(1) — 把 LR 表压到能用大小✅ v3编程语言类型与 PL 理论
lambda-calculusλ-演算 — 用三条规则表达所有可计算函数🗄 存量编程语言编程语言 / 计算理论
lambdarank-2006LambdaRank — 跳过定义损失函数,直接把梯度写出来✅ v3信息检索检索与排序
lamport-1978Lamport 1978 — 分布式系统里没有”绝对的同时”🗄 存量分布式系统papers / 分布式系统
lamport-tla-1994TLA — 把状态机和时序逻辑捏成一个公式✅ v3形式化方法形式化验证
lampson-hintsLampson Hints — 把做系统的隐式品味写成 27 条经验法则✅ v3分布式系统系统设计
landin-secdLandin SECD — 第一台机械求值 lambda 表达式的抽象机器✅ v3编程语言类型与 PL 理论
layernorm-2016Layer Normalization — 把归一化方向从 batch 转到 feature,让 RNN/Transformer 也能稳定训✅ v3机器学习模型与训练
lean-proverLean 4 — 用 Lean 重写的 Lean,让数学家和程序员共用一种语言✅ v3编程语言类型与 PL 理论
lean-tacticsLean Tactics — 让证明助手把”写证明”当成写程序✅ v3编程语言类型与 PL 理论
lee-keystone-2020Keystone — 开源可定制 RISC-V TEE 框架✅ v3安全与隐私安全与隐私
leis-2015-optimizersLeis 2015 — 用真实数据打脸所有数据库的查询优化器✅ v3数据库存储与查询
lerner-seminalLerner 组合数据流 — 让小优化互相喂招✅ v3编程语言类型与 PL 理论
levoy-hanrahan-1996-light-fieldLight Field Rendering — 把场景拍成 4D 数组,新视角靠查表✅ v3图形学渲染与图形
lfs-1991LFS 1991 — 把整个磁盘当日志写✅ v3操作系统内核与虚拟化
li-2018-rednerredner — 让光线追踪能反向传播过几何边缘✅ v3图形学渲染与图形
li-t-closeness-2007t-Closeness — 用”分布距离”堵住匿名化的最后漏洞✅ v3安全与隐私安全与隐私
lieberman-realtime-gcLieberman-Hewitt 1983 — 把对象寿命统计偏斜兑换成有界停顿✅ v3编程语言类型与 PL 理论
lindholm-2008-teslaLindholm 2008 Tesla — SM、warp、SIMT 这套词汇的官方出生证明✅ v3图形学渲染与图形
linear-scan-reg-allocLinear Scan 寄存器分配 — 把图染色换成单趟扫描,给 JIT 用✅ v3编程语言类型与 PL 理论
linear-types线性类型(Linear Types)✅ v3编程语言类型与 PL 理论
linearizability-1990Linearizability 1990 — 让并发对象看起来像一次只执行一个操作✅ v3分布式系统共识与复制
lion-2023Lion — 让程序自己搜出来的优化器,比 AdamW 内存少一半✅ v3机器学习模型与训练
lipp-meltdown-2018Meltdown — 乱序执行偷读内核内存✅ v3安全与隐私安全与隐私
liquid-typesLiquid Types — 让编译器自己推导出”哪些值才合法”✅ v3编程语言类型与 PL 理论
liu-2020-dlssDLSS 2.0 — 把 4K 实时渲染的一半工作量交给神经网络✅ v3图形学渲染与图形
livevlm-2025LiveVLM — 免训练流式视觉 token 压缩✅ v3机器学习视频理解
llamaLLaMA — Meta 开源大语言模型✅ v3机器学习NLP / LLM
llama-vid-2023LLaMA-VID — 每帧两枚 token,把小时级视频塞进 LLM✅ v3机器学习视频理解
llavaLLaVA — 开源多模态对话模型✅ v3机器学习多模态 / NLP
llava-onevision-2024LLaVA-OneVision — 单图、多图、视频一个模型全搞定✅ v3机器学习视频理解
llava-video-2024LLaVA-Video — LLaVA-NeXT 视频主线,合成数据 + SlowFast 采帧✅ v3机器学习视频理解
llm-int8-2022LLM.int8() — 大模型激活值里藏着几个超大异常通道✅ v3图形学GPU 架构
llm-wiki-retrieval-reasoningLLM-Wiki — 把外部知识编译成 agent 自己的”维基”✅ v3Agent智能体与 LLM
llmvs-2025LLMVS — 用 LLM 语义裁判给视频帧打分做摘要✅ v3机器学习视频理解
llvmLLVM — 模块化编译器框架🗄 存量编译器编译器
lmdb-2011LMDB 2011 — 把数据库直接 mmap 进内存的嵌入式 KV 存储✅ v3数据库存储与查询
local-type-inferenceLocal Type Inference — 编译器只看相邻节点也能推出类型✅ v3编程语言类型与 PL 理论
locus-1980LOCUS 1980 — 让一群机器看起来像同一台机器✅ v3操作系统内核与虚拟化
logjam-2015Logjam 2015 — 全世界共用一把锁,国家级窃听者一次撬完✅ v3网络协议网络协议
logoot-2010Logoot — 给每个字符发一张”永不过期的座位号”✅ v3分布式系统共识与复制
long-video-retrieval-2023R-VLM — 长视频不靠均匀采帧,靠可学习检索选片段✅ v3机器学习视频理解
longformer-2020Longformer — 滑窗加少数全局 token,把长文档喂进 Transformer✅ v3机器学习模型与训练
longva-2024LongVA — 把语言模型的长上下文能力「搬」到视频上✅ v3机器学习视频理解
longvideobench-2024LongVideoBench — 一小时交织字幕视频的长上下文理解考卷✅ v3机器学习视频理解
longvila-2024LongVILA — 把 VILA 从 8 帧扩到 2048 帧的长视频全栈方案✅ v3机器学习视频理解
loop-1987-subdivisionLoop 1987 — 三角形网格的递归光滑细分✅ v3图形学渲染与图形
lottery-1994彩票调度 — 用抽奖代替优先级的资源分配✅ v3操作系统内核与虚拟化
lottery-ticket-2019彩票假设 — 大网里藏着一张能独立训出来的小网✅ v3机器学习模型与训练
lsh-indyk-1998LSH — 让相似点撞同一个桶,把高维最近邻查询从线性变成亚线性✅ v3信息检索检索与排序
lsm-tree-1996LSM-Tree 1996 — 写优化存储引擎✅ v3数据库存储与查询
lstm-1997LSTM — 用门控让神经网络记得住上一段话✅ v3机器学习模型与训练
lucky13-2013Lucky 13 — 用毫秒级时间差把 TLS 加密看穿✅ v3网络协议网络协议
lvbench-2024LVBench — 平均 68 分钟、六维能力的长视频极限考✅ v3机器学习视频理解
mach-1986Mach — 把内核拆成消息互通的小服务✅ v3操作系统内核与虚拟化
mach-vm-1987Mach VM — 把虚拟内存抽象成”对象”,与硬件解耦✅ v3操作系统内核与虚拟化
machanavajjhala-l-diversity-2007l-多样性 — k-匿名之后的隐私保护✅ v3安全与隐私安全与隐私
macklin-2014-position-based-fluidsPosition Based Fluids — 把水也塞进 PBD 同一套框架✅ v3图形学渲染与图形
madry-pgd-2017Madry PGD 2017 — 用最强对手训练最强防御✅ v3安全与隐私安全与隐私
maeMAE — Masked Autoencoders🗄 存量机器学习计算机视觉 / 自监督
magic3d-2023Magic3D — 把 DreamFusion 的 NeRF 拆成”先粗后精”两阶段✅ v3机器学习模型与训练
mahajan-2002-bgp-misconfigMahajan 2002 — 三周看互联网,1% 的路由更新是手滑✅ v3网络协议网络协议
mambaMamba — 选择性状态空间模型✅ v3机器学习NLP / 深度学习
maml-2017MAML — 学一个”好起点”,几步就能学会新任务✅ v3机器学习模型与训练
mapreduceMapReduce — 用户只写两个函数,框架替你扛千节点✅ v3分布式系统分布式系统
marching-cubes-1987Marching Cubes 1987 — 把体数据切成立方体查表生成三角网格✅ v3图形学渲染与图形
maron-kuhns-1960Maron-Kuhns 1960 — 检索不是匹配,是猜”对你有用的概率”✅ v3信息检索检索与排序
marques-silva-grasp-1996GRASP 1996 — 让 SAT 求解器从冲突里学到东西✅ v3形式化方法形式化验证
martin-lof-ittMartin-Löf 直觉主义类型论 — 让”证明”和”程序”变成同一件事✅ v3编程语言类型与 PL 理论
mattern-1989Mattern 1989 — 虚拟时间与全局状态:把分布式时钟变成 N 维笛卡尔积✅ v3分布式系统共识与复制
maxwell-architecture-2014NVIDIA Maxwell — 同一工艺节点把性能每瓦翻一倍✅ v3图形学GPU 架构
mccarthy-lispMcCarthy LISP 1960✅ v3编程语言编程语言
mcfarling-bp-1993McFarling 1993 — 用 XOR 把全局历史和 PC 拧在一起,再让两个预测器打擂台✅ v3图形学GPU 架构
mcmahan-fedavg-2017FedAvg — 联邦学习奠基算法✅ v3安全与隐私安全与隐私
mcmillan-smv-1993McMillan SMV 1993 — 把状态空间从 10^6 推到 10^20 的符号模型检测✅ v3形式化方法形式化验证
mcp-specMCP — 让一个 LLM 客户端能插任何外部能力的 USB 协议✅ v3机器学习AI 工程
mcs-locks-1991MCS 锁 — 让每个线程自旋在自己的缓存行上✅ v3操作系统内核与虚拟化
meagher-1982-octreeMeagher 1982 八叉树 — 把立方体一分为八,递归地装下一整个 3D 世界✅ v3图形学渲染与图形
medusa-2024Medusa — 让大模型自己同时猜好几个 token✅ v3图形学GPU 架构
megastore-2011Megastore — 把数据切成”小数据库”换跨地域同步复制✅ v3分布式系统共识与复制
megatron-lmMegatron-LM — NVIDIA 大规模训练框架✅ v3分布式系统模型与训练
memcached-fb-2013Scaling Memcache at Facebook — 万台缓存怎么不被踩塌✅ v3分布式系统共识与复制
memcoder-co-evolutionMemCoder — code agent 跟着你 git commit 一起成长✅ v3Agent智能体与 LLM
mencius-2008Mencius — 让多台服务器轮流当 Paxos 的 leader✅ v3分布式系统共识与复制
mermaidMermaid — 用文本写图,让代码评审能 diff 流程图✅ v3基础设施工具与基础设施
mesa-optimization-2019Mesa-Optimization 2019 — 训出来的模型自己也是个优化器✅ v3机器学习模型与训练
mesos-2011Mesos 2011 — 把数据中心切成资源 offer 发给框架自己挑✅ v3操作系统内核与虚拟化
metagptMetaGPT — 多智能体软件公司✅ v3机器学习智能体与 LLM
metaml-multi-stageMetaML — 让你显式地写”先生成代码、再跑代码”✅ v3编程语言类型与 PL 理论
metcalfe-boggs-1976Metcalfe-Boggs 1976 — 一根线上几百台电脑怎么不打架✅ v3网络协议网络协议
mills-ntp-1991NTP 1991 — 用四个时间戳和一棵服务器树,让全互联网的钟差几毫秒✅ v3网络协议网络协议
millwheel-2013MillWheel 2013 — Google 给互联网级流处理装上不漏不重的发动机✅ v3数据库存储与查询
milner-pi-calculusπ-演算 — 让通道名本身能在通道里流动✅ v3编程语言类型与 PL 理论
milvus-2021Milvus — 为向量检索而生的数据库✅ v3数据库存储与查询
mind-skillMIND-Skill — 用归纳和演绎双 agent 抽 skill 并保证质量✅ v3Agent智能体与 LLM
mine-octagon-2006Miné 八边形抽象域 — 在区间和多面体之间的甜点✅ v3形式化方法形式化验证
minhash-broder-1997MinHash — 用最小哈希值估算两个集合的重叠度✅ v3信息检索检索与排序
minicpm-v-2024MiniCPM-V — 手机能跑的 GPT-4V 级多模态模型✅ v3机器学习模型与训练
minisat-2003MiniSat 2003 — 600 行 C++ 把 CDCL 写成教科书✅ v3形式化方法形式化验证
mips-1981MIPS 1981 — 让编译器自己安排流水线,CPU 就不用管✅ v3图形学GPU 架构
mirage-2013MirageOS Unikernels — 应用即内核,把操作系统编译掉✅ v3操作系统内核与虚拟化
mironov-renyi-dp-2017Rényi 差分隐私 — 隐私会计统一框架✅ v3安全与隐私安全与隐私
misevolution-2509Misevolution — 自进化 agent 也会”越改越坏”,连顶配模型也躲不过✅ v3Agent智能体与 LLM
mitls-2014-triple-handshakeTriple Handshake — TLS 同一把主密钥被复用,黑客就能换人不换锁✅ v3网络协议网络协议
mixture-of-expertsMixture of Experts (MoE)✅ v3机器学习NLP / 深度学习
mixup-2018mixup — 把两张图按比例叠成一张,标签也一起叠✅ v3机器学习模型与训练
mlflowMLflow — 给机器学习实验装上”记账本和身份证”✅ v3机器学习MLOps / ML 平台
mlirMLIR — 给编译器一套乐高,每层抽象都能搭自己的方言✅ v3编程语言类型与 PL 理论
mllm-benchmark-survey-2024MLLM Benchmark Survey — 200+ 多模态评测基准地图✅ v3机器学习多模态 LLM
mlvtg-2025MLVTG — MambaAligner + 冻结 LLM 提纯的多模态视频时序定位✅ v3机器学习视频理解
mlvu-2024MLVU — 九类任务、多时长分层的长视频理解大考✅ v3机器学习视频理解
mme-benchmark-2023MME Benchmark — 开源 MLLM 评测的事实起点✅ v3机器学习多模态 LLM
mme-survey-2024MME-Survey — 多模态 LLM 怎么评才靠谱✅ v3机器学习多模态 LLM
mmlu-2021MMLU — 用 57 个学科的多选题考一考语言模型✅ v3机器学习模型与训练
mmmu-2023MMMU — 大学级多学科多模态推理基准✅ v3机器学习多模态大模型
mmskills-multimodalMMSkills — 把视觉 agent 的”操作经验”做成多模态卡片✅ v3Agent智能体与 LLM
mockapetris-1988-dnsMockapetris 1988 DNS — 设计者亲口讲为什么 DNS 长这样✅ v3网络协议网络协议
mode-connectivity-2018Mode Connectivity — 神经网络的两个最优解之间有低洼走廊✅ v3机器学习模型与训练
moesi-cache-coherence-1986Sweazey-Smith MOESI 1986 — 给多核 CPU 一份”谁手里有这块内存”的统一规则✅ v3图形学GPU 架构
mogul-1995-persistent-httpMogul 1995 — 为什么 HTTP 必须改成”一根连接复用多次请求”✅ v3网络协议网络协议
monaghan-1992-sphSPH — 把流体拆成一群带核的粒子✅ v3图形学渲染与图形
monetdb-x100-2005MonetDB/X100 — 让数据库一次处理一向量行而不是一行✅ v3数据库存储与查询
monitors-1974Hoare Monitors 1974 — 把锁藏进对象里,让并发代码读起来像普通函数✅ v3操作系统内核与虚拟化
moviechat-2024MovieChat — 从稠密帧到稀疏记忆,小时级电影也能聊✅ v3机器学习视频理解
mplug-owl-2023mPLUG-Owl — 模块化拼装多模态大模型✅ v3机器学习模型与训练
mptcp-2012MPTCP 2012 — 把一根 TCP 管道变成多条并行水管✅ v3网络协议网络协议
mqtt-s-2008MQTT-S 2008 — 把发布/订阅消息机制装进传感器芯片✅ v3网络协议网络协议
ms-marco-2016MS MARCO — 1 千万 Bing 真实查询喂饱神经检索的标准评测集✅ v3信息检索检索与排序
mueller-2007-pbdPosition Based Dynamics — 跳过力,直接挪位置✅ v3图形学渲染与图形
mueller-2022-instant-ngpInstant-NGP — 把 NeRF 训练从几小时压到 5 秒✅ v3图形学渲染与图形
multics-1965MULTICS 1965 — 把计算机做成像电力一样的公共服务✅ v3操作系统内核与虚拟化
muzeroMuZero — 不用规则也能下棋🗄 存量机器学习强化学习
mvbench-2023MVBench — 二十道题拆穿视频大模型真懂还是装懂✅ v3机器学习视频理解
mycroft-strictnessMycroft 严格性分析 — 编译器替你判定哪些参数能”先算”✅ v3编程语言类型与 PL 理论
naiad-2013Naiad — 一套引擎同时跑批处理、流处理和迭代计算✅ v3分布式系统共识与复制
narwhal-tusk-2022Narwhal & Tusk — 把 BFT 共识拆成『谁说过』和『谁先说』两件事✅ v3分布式系统共识与复制
nbeats-2020N-BEATS — 纯前馈网络在时序预测上打败统计派✅ v3机器学习模型与训练
nelson-oppen-1979Nelson-Oppen 1979 — 让多个判定程序坐下来交换”我刚发现 a=b”✅ v3形式化方法形式化验证
nerf-2020NeRF — 用一个 MLP 把整个场景”背”下来✅ v3图形学渲染与图形
netflix-bellkor-2009BellKor Netflix Prize 2009 — 集成学习赢下 100 万美金的工程实录✅ v3信息检索检索与排序
netkat-2014NetKAT 2014 — 把网络转发写成可以做数学等式变换的代数式✅ v3网络协议网络协议
neumann-2015-large-joinsAdaptive Optimization of Very Large Join Queries — 100 张表也敢精确求解✅ v3数据库存储与查询
neumf-2017NeuMF — 用神经网络替掉推荐系统的内积✅ v3信息检索检索与排序
newcombe-2011-kinectfusionKinectFusion — 用消费级深度相机实时重建三维世界✅ v3图形学渲染与图形
newsome-taintcheck-2005Dynamic Taint Analysis for Automatic Detection, Analysis, and Signature Generation of Exploits on Commodity Software✅ v3安全与隐私安全与隐私
nfs-1985NFS 1985 — 让远程磁盘看起来像本地磁盘✅ v3操作系统内核与虚拟化
ngabonziza-trustzone-2016TrustZone — ARM 给 CPU 装上”双重人格”隔离安全世界✅ v3安全与隐私安全与隐私
nickolls-dally-2010-cuda-eraNickolls-Dally 2010 — GPU 怎么从画三角形变成跑 AI✅ v3图形学渲染与图形
nieuwenhuis-dpll-t-2006Nieuwenhuis-Oliveras-Tinelli 2006 — 给 SMT 求解器写一套数学规则书🗄 存量形式化方法形式化验证
nimier-david-2019-mitsuba2Mitsuba 2 — 一份渲染代码同时编出 CPU / GPU / 可微版✅ v3图形学渲染与图形
nixNix — 把每个软件包当成纯函数的输出✅ v3CLI包管理 / 系统
no-silver-bulletNo Silver Bullet — 软件难度的二分手术刀✅ v3其他软件工程
ntk-2018NTK — 把无限宽的神经网络变成一个可解的核方法✅ v3机器学习模型与训练
ntp-mills-1991NTP 1991 — 用四个时间戳和一组滤波器,让全网服务器的钟差几毫秒✅ v3分布式系统共识与复制
nuprl-1986Nuprl — 第一个把 Martin-Löf 类型论搬上屏幕的证明助手✅ v3形式化方法形式化验证
nvila-2024NVILA — 先放大分辨率再压缩 token 的高效 VLM✅ v3机器学习模型与训练
nvlink-nvswitch-2018NVLink 2.0 + NVSwitch — 把 16 块 GPU 拼成一台机器✅ v3图形学GPU 架构
nvmnvm — 在同一台机器上轻松切换 Node 版本✅ v3后端 API前端工具链
nvme-protocol-2017NVMe — 为 SSD 重写的存储协议✅ v3图形学GPU 架构
oauth-2.1-rfcOAuth 2.1 — 把十年 OAuth 实战经验收口成一份能直接用的规范✅ v3后端 API后端
okapi-bm25-1994Robertson-Walker 1994 — 把 2-Poisson 压成一行能算的公式✅ v3信息检索检索与排序
omagent-2024OmAgent — 长视频分治 Agent 与回退检索✅ v3机器学习视频理解
omega-2013Omega 2013 — 让多个调度器同时改一份 cluster 状态✅ v3操作系统内核与虚拟化
omnidirectional-mllm-2025全景空间推理 — MLLM 准备好面对 360° 了吗✅ v3机器学习视频理解
omnistvg-2025OmniSTVG — 按句子把视频里所有相关物体都框出来✅ v3机器学习视频理解
opencl-2010OpenCL 2010 — 一份代码同时跑 CPU/GPU/DSP/FPGA 的开放标准✅ v3图形学GPU 架构
openflow-2008OpenFlow 2008 — 把交换机的『分拣规则』搬到一台中央电脑上✅ v3网络协议网络协议
openhandsOpenHands — 开源 AI 软件工程师✅ v3机器学习智能体与 LLM
opensearchOpenSearch — AWS 主导的 Apache 2.0 搜索引擎分叉✅ v3基础设施基础设施
optunaOptuna — 让超参搜索像写普通 Python 代码一样自然✅ v3机器学习机器学习 / 超参优化
orca-2022Orca — Transformer 生成模型的分布式推理调度✅ v3图形学GPU 架构
orca-continuous-batchingOrca — 让一批 LLM 请求随到随走,不再排队等最长那个✅ v3机器学习模型与训练
ot-1989OT — 多人同时改一份文档,操作随上下文自动改坐标✅ v3分布式系统共识与复制
owens-2007-gpgpu-surveyOwens 2007 GPGPU 综述 — CUDA 之前 GPU 通用计算的黑魔法时代✅ v3图形学渲染与图形
p4-2014P4 — 让交换机的转发逻辑像写代码一样改✅ v3网络协议网络协议
padmanabhan-1995-http-latencyPadmanabhan-Mogul 1995 — 把 HTTP 三种提速方案放一起跑,看谁真的快✅ v3网络协议网络协议
pagerank-1998PageRank — 用随机游走给整个网络的页面打分✅ v3信息检索检索与排序
pair-programmingPair Programming — 两个人共用一台机器写代码✅ v3其他软件工程
panelPanel — 把 notebook 一键变交互式 web app✅ v3数据可视化数据可视化
park-2019-deepsdfDeepSDF — 用一个 MLP 把整类 3D 形状的距离场背下来✅ v3图形学渲染与图形
parti-2022Parti — 把文生图当作翻译,用自回归 Transformer 一像素接一像素地写✅ v3机器学习模型与训练
partial-evaluation-jonesJones-Gomard-Sestoft 1993 — Partial Evaluation 与自动程序生成✅ v3编程语言类型与 PL 理论
pascal-architecture-2016NVIDIA Pascal P100 — HBM2 + NVLink + FP16 让 Tesla 真正变成 AI 卡✅ v3图形学GPU 架构
pastry-2001Pastry — 用 nodeId 的前缀一位一位逼近目标✅ v3网络协议网络协议
paxosPaxos — 分布式共识算法✅ v3分布式系统分布式系统
paxos-1998Paxos 1998 — 古希腊议会寓言里藏的共识协议🗄 存量数据库存储与查询
paxos-simple-2001Paxos Made Simple — Lamport 用平直英语把共识协议推导一遍✅ v3数据库存储与查询
pbft-1999PBFT — 让拜占庭容错从理论变成能跑的工程✅ v3分布式系统共识与复制
peg-packrat-fordPEG / Packrat — 用’有序选择’+‘记忆化’写线性时间解析器✅ v3编程语言类型与 PL 理论
percolator-2010Percolator 2010 — 给 Bigtable 加分布式事务的客户端库✅ v3分布式系统共识与复制
performer-2020Performer — 用随机特征把 softmax attention 拉成线性复杂度✅ v3机器学习模型与训练
perlin-1985-noisePerlin Noise — 让计算机生成的图像不再有”机器味”✅ v3图形学渲染与图形
persistent-memory-2014PMFS — 第一个为字节寻址持久内存设计的文件系统✅ v3图形学GPU 架构
personalized-pagerank-2003Personalized PageRank — 给每个人一份属于自己的网页排名✅ v3信息检索检索与排序
peyton-jones-stgPeyton Jones STG — 让 Haskell 的 lazy 在普通 CPU 上跑得快✅ v3编程语言类型与 PL 理论
phong-1975Phong 1975 — 把光照拆成环境+漫反射+高光三项✅ v3图形学渲染与图形
piotrowska-loopix-2017Loopix — 低延迟 mix 网络实现发送方和接收方双向匿名✅ v3安全与隐私安全与隐私
pipedream-2019PipeDream — 1F1B 调度让流水线工位别空等✅ v3图形学GPU 架构
pivot-tracing-2015Pivot Tracing — 让运维事后想测什么就测什么✅ v3分布式系统共识与复制
plan9-1995Plan 9 — 把”一切皆文件”真的做到极致的下一代 UNIX✅ v3操作系统内核与虚拟化
plenoxels-2022Plenoxels — 不要神经网络也能渲染辐射场✅ v3图形学渲染与图形
plotkin-sosPlotkin SOS — 用规则讲清楚程序”走一步”是什么✅ v3编程语言类型与 PL 理论
pnueli-temporal-1977Pnueli 时序逻辑 — 给”永远不死锁""请求最终被响应”找一套数学语言✅ v3形式化方法形式化验证
pnuts-2008PNUTS — 介于强一致与最终一致之间的实用一致性✅ v3分布式系统共识与复制
polar-codes-2009Polar 极化码 — 把好坏不一的信道整成”完美/全错”两组✅ v3机器学习信息论
pottier-merrPottier LR(1) Reachability — 让 LR 解析器的错误消息覆盖完整✅ v3编程语言类型与 PL 理论
ppoPPO — Proximal Policy Optimization✅ v3机器学习强化学习
presumed-abort-1986Presumed Abort/Commit — 让 2PC 少写日志少发消息的两个默认共识✅ v3分布式系统共识与复制
product-quantization-2011Product Quantization — 把向量切碎再压成几个字节✅ v3数据库存储与查询
program-comprehension-fmriProgram Comprehension fMRI — 程序员读代码时大脑亮的是语言区不是数学区✅ v3其他软件工程认知科学
programmer-interruptionProgrammer Interruption — IDE 数据告诉你被打断后多久才能继续敲代码✅ v3其他软件工程
prolog-colmerauerProlog 的诞生 — 让逻辑式子直接当程序跑✅ v3编程语言类型与 PL 理论
prototypical-networks-2017Prototypical Networks — 每类算个均值,比距离就够了✅ v3机器学习模型与训练
proverif-2001ProVerif — 把密码协议翻成 Prolog 规则让计算机自己证安全✅ v3形式化方法形式化验证
ps-li-2014Parameter Server — 多机训练前 AllReduce 时代的工业标准✅ v3分布式系统共识与复制
push-pull-frpPush-Pull FRP — Functional Reactive Programming 实用化✅ v3编程语言编程语言
pypy-tracing-jitPyPy meta-tracing JIT — 给解释器加一次 JIT,所有用它的语言一起加速✅ v3编程语言类型与 PL 理论
quantum-supremacy-2019Quantum Supremacy 2019 — 量子机用 200 秒做完超算 1 万年的事✅ v3图形学GPU 架构
quicQUIC — 把可靠传输从内核搬到用户空间✅ v3网络协议计算机网络
quincy-2009Quincy — 把”派活给机器”变成一道最小费用流题✅ v3分布式系统共识与复制
qvhighlights-2021QVHighlights — 用自然语言查询在视频里找精彩瞬间✅ v3机器学习视频理解
qwen2-5-vl-2025Qwen2.5-VL — 绝对时间编码 + 动态分辨率,小时级视频原生理解✅ v3机器学习视频理解
qwen2-vl-2024Qwen2-VL — 动态分辨率 + M-RoPE,工业级视频理解的里程碑✅ v3机器学习视频理解
r-bgp-2007R-BGP 2007 — 故障切换前先把备份路径塞进邻居口袋✅ v3网络协议网络协议
rabin-ot-1981Rabin 遗忘传输 — 发送方永远不知道你收到了什么✅ v3安全与隐私安全与隐私
raftRaft — 易理解的共识算法🗄 存量分布式系统分布式系统
rag-lewis-2020RAG (Lewis 2020) — 检索增强生成奠基✅ v3机器学习AI / NLP
ranknet-2005RankNet — 让搜索引擎学会比较两个结果谁更好✅ v3信息检索检索与排序
rcu-2001RCU 2001 — 让”读”的代价归零的并发数据结构✅ v3操作系统内核与虚拟化
reactReAct — Reasoning and Acting✅ v3机器学习智能体与 LLM
react-server-componentsReact Server Components — 让组件自己决定在哪台机器跑✅ v3后端 API前端框架
realmREALM — 把检索器和 BERT 一起预训练的第一篇论文✅ v3NLP自然语言处理
red-1993RED — 让路由器在队列还没塞满时就提前丢包✅ v3网络协议网络协议
reed-onion-routing-1998洋葱路由 1998 — 把匿名通信从理论搬进真实互联网✅ v3安全与隐私安全与隐私
reed-solomon-1960Reed-Solomon 编码✅ v3机器学习信息论
refinement-types-1991Refinement Types for ML — 让程序员告诉编译器”哪些子集才合法”✅ v3编程语言类型与 PL 理论
reflexionReflexion — 让 LLM 自我反思✅ v3机器学习智能体与 LLM
reformer-2020Reformer — 用哈希分桶把 attention 从 O(L²) 压到 O(L log L)✅ v3机器学习模型与训练
regev-lwe-2005On Lattices, Learning with Errors, Random Linear Codes, and Cryptography✅ v3安全与隐私安全与隐私
replug-2023REPLUG — 不动 LLM 一根毛,只把检索器调到它的”口味”上✅ v3机器学习模型与训练
reps-ifdsReps-Horwitz-Sagiv IFDS — 把跨过程分析变成图上找路✅ v3编程语言类型与 PL 理论
resnetResNet — 残差连接✅ v3机器学习计算机视觉 / 深度学习
rest-fielding-2000REST — Fielding 2000 给 Web API 写下的设计宪法✅ v3后端 API后端
retroRETRO — DeepMind 的检索增强 LLM✅ v3机器学习AI / NLP
reynolds-definitional-interpretersReynolds Definitional Interpreters — 用一种语言去定义另一种语言✅ v3编程语言类型与 PL 理论
reynolds-separation-logicSeparation Logic — 把 Hoare 逻辑扩到带指针的程序✅ v3编程语言类型与 PL 理论
rfc-3833-dns-threatsRFC 3833 — IETF 第一次正式承认 DNS 不安全✅ v3网络协议网络协议
ring-allreduce-2017Ring All-Reduce — 把 HPC 的环形规约搬进深度学习✅ v3图形学GPU 架构
risc-i-1981RISC I — 砍掉 90% 指令反而让 CPU 跑得更快✅ v3图形学GPU 架构
rlhf-christianoRLHF Christiano 2017 — 人类偏好做奖励✅ v3机器学习强化学习 / AI 安全
rm3-2001RM3 — 让搜索引擎自己看一眼结果再重搜一次✅ v3信息检索检索与排序
roberta-2019RoBERTa — 把 BERT 重训一遍就能拿 SOTA✅ v3机器学习模型与训练
rocketqa-2021RocketQA — 把稠密检索的训练拧到工业级✅ v3信息检索检索与排序
rocksdb-2017RocksDB 2017 — 把 LSM-Tree 的”空间放大”压到极低的工业经验✅ v3数据库存储与查询
rocksdb-lsmLSM-tree 与 RocksDB — 把所有写都变成顺序写✅ v3数据库数据库
ron-2001RON 2001 — 让一小撮节点自己绕开 BGP 故障✅ v3网络协议网络协议
row-polymorphism-remyRow Polymorphism — 让记录类型可扩展又不丢类型安全✅ v3编程语言类型与 PL 理论
rrf-cormack-2009RRF — 把多个搜索结果列表合并成一个的最简单办法✅ v3信息检索数据检索
rsaRSA 公钥密码✅ v3安全与隐私密码学
rtp-rfc-1889RTP RFC 1889 — 让 UDP 也能跑实时音视频✅ v3网络协议网络协议
rwkv-2023RWKV — 让 RNN 拿到 Transformer 那张训练并行的入场券✅ v3机器学习模型与训练
sac-2018Soft Actor-Critic — 让强化学习既会拿分又愿意多试✅ v3机器学习模型与训练
saga-1987Sagas — 长事务拆成一串能”反向走回去”的小事务✅ v3分布式系统共识与复制
sagiv-shape-analysisSagiv 参数化形状分析 — 用三值逻辑证明链表树仍是链表树✅ v3编程语言类型与 PL 理论
saito-takahashi-1990-gbufferSaito-Takahashi 1990 — 第一次提出 G-buffer 的论文✅ v3图形学渲染与图形
salsa-adaptonSalsa / Adapton — 让程序只重算”真的变了”的那一小块✅ v3编程语言编程语言
salsify-2018Salsify: Low-Latency Network Video Through Tighter Integration Between a Video Codec and a Transport Protocol✅ v3网络协议网络协议
salton-vsm-1975Salton VSM 1975 — 把文档变成向量再用余弦比相似度✅ v3信息检索检索与排序
saltzer-1984-e2eEnd-to-End Arguments — 把功能尽量推到端上做✅ v3网络协议网络协议
saltzer-schroeder-1975Saltzer-Schroeder 1975 — 8 条至今教科书还在引的安全设计原则✅ v3操作系统内核与虚拟化
samSAM — Segment Anything✅ v3机器学习计算机视觉
sarathi-serveSarathi-Serve — 让长 prompt 不再卡住所有人的流式回复✅ v3机器学习大模型服务
sasrec-2018SASRec — 用 Transformer 的 self-attention 替 RNN 做下一步推荐✅ v3信息检索检索与排序
scala-macrosScala Macros — 让 Scala 在编译期把方法调用替换成任意代码✅ v3编程语言类型与 PL 理论
scaling-lawsScaling Laws — 神经语言模型的缩放规律✅ v3NLPNLP
scann-2020ScaNN — 让向量量化只精修「客户会看到的那一面」✅ v3信息检索检索与排序
scoopScoop — Windows 上像 Homebrew 一样装命令行工具✅ v3基础设施工具与基础设施
scott-strachey-denotationalScott-Strachey 指称语义 — 给程序找一个独立于实现的数学含义✅ v3编程语言类型与 PL 理论
sctp-multipath-2006CMT-SCTP 2006 — 让两条网络路径同时干活而不打架✅ v3网络协议网络协议
sel4-2009seL4 — 第一个被数学证明”代码和规范完全一致”的操作系统内核✅ v3操作系统内核与虚拟化
self-adjustingSelf-Adjusting Computation — 输入小幅变化时只重算受影响的那部分✅ v3编程语言编程语言
self-consistency-2022Self-Consistency — 让模型把同一道题做 40 遍再投票✅ v3机器学习模型与训练
self-customizationSELF Customization — 给每种”调用者类型”现场打一份方法✅ v3编程语言类型与 PL 理论
self-evolving-agents-survey自进化 AI agent 综述 — 给”会自己升级”的 agent 画一张统一地图✅ v3Agent智能体与 LLM
self-evolving-recsys-2602Self-Evolving RecSys — 让 LLM agent 自己跑超参实验上线🗄 存量Agent智能体与 LLM
self-evolving-software-agentsBDI-LLM Self-Evolving Agents — 让 agent 自己改自己源代码🗄 存量Agent智能体与 LLM
self-picSelf / PIC — 内联缓存的诞生✅ v3编译器编译器
self-rag-2023Self-RAG — 让模型自己决定何时该查资料✅ v3机器学习模型与训练
self-refine-2023Self-Refine — 让同一个模型自己改自己写的东西✅ v3机器学习模型与训练
selinger-1979Selinger 1979 — 基于代价的查询优化✅ v3数据库存储与查询
selinux-2001SELinux 2001 — 给每扇门都装上门卫,而不是给管理员一把万能钥匙✅ v3操作系统内核与虚拟化
seq2seq-2014Seq2Seq — 把翻译变成端到端神经网络✅ v3机器学习模型与训练
sequel-1974SEQUEL 1974 — 让数据库”听懂”近似英语的查询✅ v3数据库存储与查询
sequential-consistency-1979Sequential Consistency 1979 — 多处理器内存模型的第一个正确性标准✅ v3分布式系统共识与复制
server-sent-eventsServer-Sent Events — 服务器单向推送的标准协议✅ v3后端 API前端
sglang-2024SGLang — 把 LLM 程序当成共享前缀的树来跑✅ v3图形学GPU 架构
sgx-2013Innovative Instructions and Software Model for Isolated Execution✅ v3操作系统内核与虚拟化
shannon-1948Shannon 1948 — 信息论的诞生✅ v3机器学习信息论
sharegpt4video-2024ShareGPT4Video — 用 GPT-4V 级密集字幕,喂饱视频理解与生成✅ v3机器学习视频理解
shellcheckShellCheck — 帮你抓 Bash 脚本里那些”半夜才发作”的坑✅ v3基础设施infrastructure
shenango-2019Shenango — 每 5 微秒重新分一次核的中央调度器✅ v3操作系统内核与虚拟化
shokri-mia-2017MIA 成员推断攻击 — 黑盒 API 能猜出你是不是训练数据✅ v3安全与隐私安全与隐私
siglip-2023SigLIP — 用 Sigmoid 损失训练图文对齐✅ v3机器学习多模态 LLM
sillito-questionsSillito 44 问题 — 程序员改代码时到底在问什么✅ v3其他软件工程
silt-2011SILT — 0.7 字节内存索引一条记录的 flash 键值存储✅ v3数据库存储与查询
simhash-charikar-2002SimHash — 用随机超平面把余弦相似度变成汉明距离✅ v3信息检索检索与排序
simrank-2002SimRank — 两个节点相似当且仅当它们的邻居相似✅ v3信息检索检索与排序
simula-67SIMULA 67 — 面向对象的诞生🗄 存量编程语言编程语言
sinfonia-2007Sinfonia 2007 — 把分布式协议降级成数据结构操作✅ v3分布式系统共识与复制
skcc-skill-compilerSkCC — 给 LLM agent 写一个真正的 skill 编译器✅ v3Agent智能体与 LLM
skeen-3pc-1981Skeen 1981 三阶段提交 — 给 2PC 的阻塞缺陷打补丁✅ v3分布式系统共识与复制
skill-as-pseudocodeSkill-as-Pseudocode — 把 agent 笔记本写成可校验的伪代码✅ v3Agent智能体与 LLM
skill-pro-nonparametric-ppoSkill-Pro — 不动权重学可复用 skill 的非参数 PPO✅ v3Agent智能体与 LLM
skill-sd-self-distillationSkill-SD — 用 agent 自己抽出的 skill 当 dynamic teacher 自蒸馏✅ v3Agent智能体与 LLM
skip-list-1990Skip List — 用抛硬币代替平衡树✅ v3数据库存储与查询
skip-locked-postgres-9.5SKIP LOCKED — 让 Postgres 当任务队列用✅ v3后端 API后端
slab-1994Slab Allocator 1994 — 内核按对象类型开缓存,不是按字节切✅ v3操作系统内核与虚拟化
slam-microsoftSLAM — 让 Windows 驱动 bug 自己撞到工具上✅ v3编程语言类型与 PL 理论
sleeper-agentsSleeper Agents — 故意藏后门的 LLM✅ v3机器学习AI 安全
slim-2011SLIM — 让数据自己学一张稀疏的”看了又看”权重表✅ v3信息检索检索与排序
smalltalk-80Smalltalk-80✅ v3编程语言编程语言
smoothquant-2023SmoothQuant 2023 — 把激活的烫手山芋扔给权重✅ v3图形学GPU 架构
smr-1990SMR 1990 — 把”容错服务”还原成”多副本一起跑同一台状态机”✅ v3数据库存储与查询
snap-2019Snap 2019 — Google 把网络栈搬进用户空间的微内核实践✅ v3操作系统内核与虚拟化
snowflake-2016Snowflake 2016 — 把数仓拆成 storage / compute / services 三层✅ v3数据库存储与查询
soft-updates-1999Soft Updates — 不写 journal 也能保证文件系统元数据一致✅ v3操作系统内核与虚拟化
soltesz-2007Soltesz 2007 — 容器:比虚拟机轻一档的隔离方案✅ v3操作系统内核与虚拟化
sophia-2023Sophia — 让二阶优化器第一次在 LLM 预训练里跑得动✅ v3机器学习模型与训练
sorkine-2004-laplacian-editingSorkine 2004 — 用拉普拉斯坐标编辑网格,拽把手不丢细节✅ v3图形学渲染与图形
souffle-datalogSoufflé — 把 Datalog 编译成 C++ 让程序分析跑得动✅ v3编程语言类型与 PL 理论
spacevllm-2025SpaceVLLM — 一个 MLLM 同时做时序定位、图像指代与时空管定位✅ v3机器学习视频理解
spann-2021SPANN — 内存放中心、SSD 放向量的十亿级近邻检索✅ v3信息检索检索与排序
spannerSpanner — 全球分布式 SQL 数据库✅ v3分布式系统分布式系统 / 数据库
spanner-2012Spanner 2012 — 用原子钟和 GPS 给全球数据库发时间戳✅ v3数据库存储与查询
sparrow-2013Sparrow — 让毫秒级任务也能被精准调度的去中心化调度器✅ v3分布式系统共识与复制
sparse-autoencodersSparse Autoencoders — 把 superposition 解出来🗄 存量机器学习AI 可解释性
sparsegpt-2023SparseGPT — 175B 大模型一次过剪 50%,不重训✅ v3图形学GPU 架构
specinfer-2023SpecInfer — 让大模型一次”猜一棵树”再并行验证✅ v3图形学GPU 架构
splade-2021SPLADE — 让神经网络学出稀疏向量,直接复用倒排索引✅ v3信息检索检索与排序
sprite-1988Sprite 1988 — 把一屋子工作站伪装成一台大主机✅ v3操作系统内核与虚拟化
sqlite-2022SQLite — 嵌入式数据库 30 年怎么活下来的✅ v3数据库存储与查询
ssaSSA — 静态单赋值形式🗄 存量编译器编译器
st-llm-2024ST-LLM — 把所有时空 token 交给 LLM,让它自己学时序✅ v3机器学习视频理解
stable-diffusionStable Diffusion — 开源文生图引爆✅ v3机器学习生成模型
stainless-2017Stainless — 让编译器替你证明 Scala 函数真的满足规约✅ v3形式化方法形式化验证
stam-1999-stable-fluidsStable Fluids — 让流体模拟时间步随便给都不爆✅ v3图形学渲染与图形
standard-mlStandard ML — 让编译器替你把类型补完✅ v3编程语言编程语言
starcoder-2023StarCoder — 把训练数据完整公开的 15B 代码模型✅ v3机器学习模型与训练
starrocksStarRocks — Doris 分叉出来的向量化 CBO 国产 OLAP✅ v3基础设施infrastructure
steensgaard-pointerSteensgaard 指针分析 — 用等价合并把指针分析压到几乎线性✅ v3编程语言类型与 PL 理论
stm-shavit-touitouSTM Shavit-Touitou — 把”加锁”改成”事务”的源头✅ v3编程语言类型与 PL 理论
stonebraker-2010-sqlnosqlStonebraker 2010 SQL vs NoSQL — 慢的是老实现,不是 SQL✅ v3数据库存储与查询
streamingbench-2024StreamingBench — 流式视频理解的 18 任务在线大考✅ v3机器学习视频理解
strongtalkStrongtalk — 可以装可以卸的 Smalltalk 类型系统✅ v3编程语言类型与 PL 理论
stylegan2-2020StyleGAN2 — 把 StyleGAN 的水滴瑕疵和潜空间纠葛一起修掉✅ v3机器学习模型与训练
subramanian-2002-internet-hierarchySubramanian 2002 — 用多个观察点把互联网切成 5 层✅ v3网络协议网络协议
sulsky-1994-mpmMPM — 让粒子背着自己的历史,借网格算一遍力✅ v3图形学渲染与图形
swe-agentSWE-Agent — Princeton SWE-bench 解法🗄 存量机器学习智能体与 LLM
swe-benchSWE-bench — 真实 GitHub Issue 评测✅ v3机器学习AI / 软件工程
sweeney-k-anonymity-2002k-匿名 — 发布数据时让攻击者无法锁定你是谁✅ v3安全与隐私安全与隐私
sycl-cpp-2020SYCL 2020 — 用一份标准 C++ 让 GPU/CPU/加速器一起跑✅ v3图形学GPU 架构
sycophancy-2023Sycophancy 2023 — RLHF 模型为什么爱顺着用户说✅ v3机器学习模型与训练
system-f-reynolds-1974System F — 让类型也能像参数一样被传递✅ v3编程语言类型与 PL 理论
system-r-1976System R 1976 — 第一个跑起来的关系数据库✅ v3数据库存储与查询
szegedy-adversarial-2013Szegedy 对抗样本 2013 — 一张图片骗过神经网络的开山之作✅ v3安全与隐私安全与隐私
t0-2021T0 — 让 50 个人各写各的提示词,模型反而更会听新指令✅ v3机器学习模型与训练
t5T5 — Text-to-Text Transfer Transformer✅ v3NLPNLP
ta-stvg-2025TA-STVG — 解耦「找谁 / 何时 / 何地」的时空视频定位✅ v3机器学习视频理解
tabpfn-2023TabPFN — 一秒解决小表格分类的 Transformer✅ v3机器学习模型与训练
tachyon-2014Tachyon — 把集群存储推到内存速度,丢了再算回来✅ v3数据库存储与查询
tamarin-2012Tamarin — 让计算机自己证 Signal、TLS 1.3 这种带 DH 的协议是不是真安全✅ v3形式化方法形式化验证
tao-2013TAO — Facebook 给十亿人好友列表造的专用图数据库✅ v3分布式系统共识与复制
taso-2019TASO — 让机器自己发现深度学习图重写规则✅ v3图形学GPU 架构
taubin-1995-mesh-smoothingTaubin 1995 — 把网格平滑当成低通滤波✅ v3图形学渲染与图形
tcpTCP — 在不可靠的 IP 上凿出一条 reliable 字节流✅ v3网络协议网络
tcp-vegas-1995TCP Vegas 1995 — 不等丢包,靠 RTT 早一步看见拥塞✅ v3网络协议网络协议
td3-2018TD3 — 给 DDPG 装两副刹车,连续控制终于稳了✅ v3机器学习模型与训练
tempcompass-2024TempCompass — 专门拆穿 Video LLM 有没有真懂时间✅ v3机器学习视频理解
template-haskellTemplate Haskell — 让 Haskell 在编译期把代码当数据玩✅ v3编程语言类型与 PL 理论
tendermint-2016Tendermint — 把拜占庭共识塞进开放区块链的工程模板✅ v3分布式系统共识与复制
tensorflow-osdi-2016TensorFlow — 把神经网络拆成数据流图再跑到任何机器上✅ v3分布式系统共识与复制
tensorrt-llm-2023TensorRT-LLM — NVIDIA 把 FT 升级成可调度的官方推理栈✅ v3图形学GPU 架构
tesla-architecture-2008NVIDIA Tesla — 把显卡改造成通用并行计算机✅ v3图形学GPU 架构
the-os-1968THE 1968 — Dijkstra 用分层 + 信号量造出第一个可证明的 OS✅ v3操作系统内核与虚拟化
theorems-for-freeTheorems for Free — 类型签名直接给定理✅ v3编程语言类型与 PL 理论
thrust-2010Thrust — 让 GPU 编程像写 STL 一样一行调用✅ v3图形学GPU 架构
tidb-2020TiDB 2020 — 给 Raft 加一个”旁听生”,让一份数据同时跑事务和分析✅ v3数据库存储与查询
tigerbeetleTigerBeetle — 只能记账但把记账做到极致的金融数据库✅ v3数据库数据库
timechat-2024TimeChat — 带时间戳的多轮视频助手,长视频也能精确定位✅ v3机器学习视频理解
timelinejsTimelineJS — 一张 Google Sheet 直接变成交互时间轴✅ v3基础设施基础设施
timemarker-2024TimeMarker — 时间分隔符 + 任意长度采帧的视频定位大模型✅ v3机器学习视频理解
tla-yu-tlc-1999TLC — 让 TLA+ 规范可以一键机检的模型检查器✅ v3形式化方法形式化验证
tls-1.3TLS 1.3 — 把 HTTPS 握手砍到一个来回✅ v3网络协议网络协议
tofte-talpin-regionsTofte-Talpin Regions — 让类型系统替你管内存生命周期✅ v3编程语言编程语言
token-bucket-stripeStripe Rate Limiters — 工业级令牌桶长什么样✅ v3后端 API后端工程
tomasulo-1967Tomasulo 算法 — 让 CPU 自己决定指令的执行顺序✅ v3图形学GPU 架构
tomita-glrTomita GLR — 让 LR 解析器扛得住歧义文法✅ v3编程语言类型与 PL 理论
toolformerToolformer — 教 LLM 自主调用 API🗄 存量机器学习智能体与 LLM
tor-2004Tor 洋葱路由 — 让你的网络请求穿上三层马甲✅ v3网络协议网络协议
toy-models-superpositionToy Models of Superposition✅ v3机器学习AI 可解释性
trace-2024TRACE — 用因果事件链同时输出时间、精彩度与描述✅ v3机器学习视频理解
tracemonkeyTraceMonkey — 只编”真的走过的那一条路”✅ v3编程语言类型与 PL 理论
transformer-xl-2019Transformer-XL — 让 Transformer 像 RNN 那样把上下文滚动传下去✅ v3机器学习模型与训练
traveler-2024TraveLER — 四段式多 Agent,帧级问答看懂长视频✅ v3机器学习视频理解
tree-of-thoughts-2023Tree of Thoughts — 让 LLM 像下棋一样多想几步再答✅ v3机器学习模型与训练
trees-that-growTrees that Grow — 可扩展的语法树设计✅ v3编程语言编程语言
trill-2014Trill — 一个引擎同时跑流、批、交互三种分析✅ v3数据库存储与查询
triton-2019Triton 2019 — 让 Python 写出贴近 cuBLAS 的 GPU kernel✅ v3图形学GPU 架构
triton-llmTriton — 让 Python 程序员也能写出贴近 cuBLAS 的 GPU kernel✅ v3编程语言类型与 PL 理论
trustrank-2004TrustRank — 用一小撮可信种子把整张 Web 的信誉算出来✅ v3信息检索检索与排序
turchin-supercompilationTurchin Supercompilation — 让编译器把程序模拟一遍再写回去✅ v3编程语言类型与 PL 理论
turing-1936Turing 1936 可计算性✅ v3编程语言计算理论
turing-architecture-2018NVIDIA Turing — RT Core 把光追装进消费卡,Tensor Core 第二代下放 INT8✅ v3图形学GPU 架构
tvmTVM — 让一份模型能在所有硬件上跑得快✅ v3编程语言类型与 PL 理论
tvm-2018TVM OSDI 2018 — 把 Halide 思想搬到深度学习✅ v3图形学GPU 架构
twine-2020Twine — Facebook 把整个数据中心当一台机器调度✅ v3操作系统内核与虚拟化
unified-memory-2014CUDA Unified Memory — 让 CPU 和 GPU 共享一张内存地图✅ v3图形学GPU 架构
univtg-2023UniVTG — 把视频时刻定位、高光检测、摘要合成一套框架✅ v3机器学习视频理解
unix-1974UNIX 1974 — 用极小内核做出能用的分时系统✅ v3操作系统内核与虚拟化
uvtg-mllm-2025UniTime — 生成式 MLLM 做通用视频时序定位✅ v3机器学习视频理解
v-system-1988V 分布式系统 — 把局域网当成一台机器,内核只剩进程加 IPC✅ v3操作系统内核与虚拟化
vall-e-2023VALL-E — 3 秒样本零样本语音克隆✅ v3机器学习模型与训练
vamp-verisoft-2006VAMP — 把一颗有流水线、乱序、浮点和 cache 的处理器从门电路证到指令集✅ v3形式化方法形式化验证
vcc-2009VCC — 给并发 C 加注解,让 SMT 自动证它对✅ v3形式化方法形式化验证
veach-1995-misVeach MIS — 用一行加权公式让多种采样策略各取所长✅ v3图形学渲染与图形
veach-1997-mltVeach MLT — 用 Metropolis 在路径空间游走,专攻 BDPT 也算不动的难场景✅ v3图形学渲染与图形
vega-liteVega-Lite — 用 JSON 三段式画复合图✅ v3数据可视化数据可视化
vellvmVellvm — 在 Coq 里给 LLVM IR 写一份机器证明的语义✅ v3编程语言类型与 PL 理论
verdi-2015Verdi — 在 Coq 里完整证明 Raft 协议的分布式系统验证框架✅ v3形式化方法形式化验证
verisoft-2008Verisoft — 把整台计算机从晶体管到邮件客户端全部用数学证完✅ v3形式化方法形式化验证
vertica-2012Vertica 2012 — C-Store 论文走向产品的七年改造账✅ v3数据库存储与查询
vid-llm-survey-2023Vid-LLM Survey — 用大语言模型理解视频的全景地图✅ v3机器学习视频理解
video-chatgpt-2023Video-ChatGPT — 让大语言模型看懂视频并聊起来✅ v3机器学习视频理解
video-llama-2023Video-LLaMA — 把音频和视频同时塞进大语言模型✅ v3机器学习视频理解
video-llava-2024Video-LLaVA — 投影之前先对齐,图像和视频共用一个 LLM✅ v3机器学习视频理解
videoagent-longform-2024VideoAgent (Wang) — LLM Agent 迭代选帧理解长视频✅ v3机器学习视频理解
videoagent-memory-2024VideoAgent(Fan)— 双记忆 + 四工具,长视频逼近 Gemini✅ v3机器学习视频理解
videochat-2023VideoChat — 把视频、指令微调、多轮对话第一次放进同一个系统✅ v3机器学习视频理解
videochat-flash-2025VideoChat-Flash — 分层压缩,让长视频理解又快又准✅ v3机器学习视频理解
videollama2-2024VideoLLaMA 2 — 时空卷积连接器 + 音视频联合理解✅ v3机器学习视频理解
videollama3-2025VideoLLaMA 3 — 动态分辨率视觉编码 + 视频 token 压缩✅ v3机器学习视频理解
videollm-online-2024VideoLLM-online — 流式视频对话的 LIVE 框架✅ v3机器学习视频理解
videomme-2024Video-MME — 视频多模态大模型的「高考卷」✅ v3机器学习视频理解
videoprism-2024VideoPrism — 冻结一个模型就能搞定所有视频理解任务✅ v3机器学习视频理解
vidstg-2020VidSTG — 用自然语言在长视频里框出「谁在何时何地」✅ v3机器学习视频理解
vinoground-2024Vinoground — 时序反事实短视频探针✅ v3机器学习视频理解
vitViT — Vision Transformer✅ v3机器学习计算机视觉
vl2-2009VL2 — 让一万台服务器像在同一台交换机上✅ v3网络协议网络协议
vllmvLLM — 把操作系统的分页搬进 GPU KV cache✅ v3机器学习数据科学与 AI
vogels-eventual-2009Eventually Consistent 2009 — 给互联网规模存储一套’放弃强一致’的官方词汇✅ v3分布式系统共识与复制
volcanoVolcano — 把’算子可组合’与’并行可分离’拼成执行器范式✅ v3数据库数据库
volcano-1994Volcano 1994 — 把 SQL 执行写成 next() 拉式数据流✅ v3数据库存储与查询
volta-architecture-2017NVIDIA Volta V100 — 第一代 Tensor Core 把 AI 训练算力一夜抬 6 倍✅ v3图形学GPU 架构
voyagerVoyager — LLM 终身学习智能体✅ v3机器学习智能体与 LLM
vr-1988VR 1988 — 用”主备 + 换届”做共识的另一脉✅ v3分布式系统共识与复制
vr-revisited-2012VR Revisited 2012 — VR 协议的”工程化重写版”✅ v3分布式系统共识与复制
vsi-bench-2024VSI-Bench — 用室内漫游视频考视频大模型的空间智商✅ v3机器学习视频理解
vslnet-2020VSLNet — 用 span-based QA 做自然语言视频定位✅ v3机器学习视频理解
vst-2014VST — 把 C 程序的数学证明一路带到机器码✅ v3形式化方法形式化验证
vtg-llm-2024VTG-LLM — 绝对时间 token + VTG-IT-120K,让 Video LLM 精确定位时刻✅ v3机器学习视频理解
vtimellm-2023VTimeLLM — 让 Video LLM 学会标出事件起止时间✅ v3机器学习视频理解
wadler-prettierWadler Prettier — 函数式优雅打印器✅ v3编程语言编程语言
wald-2007-sah-bvhWald 2007 — 把 SAH BVH 构建从分钟级砍到秒级的 binned 近似法✅ v3图形学渲染与图形
wam-warrenWAM — 让 Prolog 跑得像编译型语言的抽象机器✅ v3编程语言类型与 PL 理论
wandbWeights & Biases — 几行 init 把指标系统代码自动入库✅ v3基础设施基础设施
wang-2014-spdyHow Speedy is SPDY — 换协议没让网页变快多少✅ v3网络协议网络协议
ward-1992Ward 1992 — 第一个能落地的各向异性反射模型✅ v3图形学渲染与图形
websocket-rfc-6455WebSocket RFC 6455 — 让浏览器和服务器开一条不挂断的双向电话✅ v3网络协议网络协议
webxskillWebXSkill — 给 Web agent 的可执行 skill 是参数化代码 + URL 图索引✅ v3Agent智能体与 LLM
whisper-2022Whisper — 68 万小时弱监督训出的语音识别✅ v3机器学习模型与训练
whitted-1980Whitted 1980 — 让光线在场景里递归跑三种次级射线✅ v3图形学渲染与图形
why3-2013Why3 — 写一次程序规范,多个证明器一起来证✅ v3形式化方法形式化验证
wide-deep-2016Wide & Deep — 让模型同时学会”记住”和”举一反三”✅ v3信息检索检索与排序
williams-1983-mipmapWilliams 1983 mipmap — 提前烤好金字塔,纹理过滤变 O(1)✅ v3图形学渲染与图形
wireguard-2017WireGuard: Next Generation Kernel Network Tunnel✅ v3网络协议网络协议
word2vecWord2Vec — 词向量奠基✅ v3NLPNLP
world-model-robot-learning-2026机器人世界模型综述 — 预测未来再动手✅ v3机器学习机器人与 VLA
worldsense-2025WorldSense — 真实世界同步音视频理解 benchmark✅ v3机器学习视频理解
xen-2003Xen 2003 — 让操作系统配合虚拟化,性能直接接近原生✅ v3操作系统内核与虚拟化
xla-compilerXLA — 给 TensorFlow / JAX 装一台真正的张量编译器✅ v3编程语言类型与 PL 理论
xlnet-2019XLNet — 把句子打乱顺序读,借此同时拿到 AR 和双向✅ v3机器学习模型与训练
xtrace-2007X-Trace — 比 Dapper 早 3 年的跨层跨协议追踪框架✅ v3分布式系统共识与复制
yao-garbled-circuits-1986Yao 混淆电路 — 让两人合算函数却互不泄密✅ v3安全与隐私安全与隐私
youtube-two-tower-2019YouTube 双塔召回 — 把 DSSM 搬进推荐并补上两件工业关键✅ v3信息检索检索与排序
z3-2008Z3 2008 — 把 SMT 工程化到工业默认✅ v3形式化方法形式化验证
zab-2011Zab — ZooKeeper 怎么把客户端写入按顺序复制到所有副本✅ v3数据库存储与查询
zero-2020ZeRO 2020 — 把训练状态切成 N 份让万亿参数成为可能✅ v3分布式系统共识与复制
zfs-2003ZFS — 把磁盘当成水池,每滴水都贴标签✅ v3操作系统内核与虚拟化
zgcZGC — 让 GC 停顿与堆大小解耦的低延迟回收器✅ v3编程语言编程语言
zk-snarkzk-SNARK 零知识证明✅ v3安全与隐私密码学
zombie-agents-2602Zombie Agents — 自进化 agent 的长期记忆能被持久化”借尸还魂”✅ v3Agent智能体与 LLM