美国商务部指令 DAO 216-26 与差分隐私禁令
美国商务部指令 DAO 216-26 与差分隐私禁令
DAO 216-26 要求回归过时的隐私技术
2026 年 6 月 4 日,美国商务部长发布了 DAO 216-26 指令,该指令将所有经济分析局(BEA)和美国人口普查局出版物的保密保护限定为 1970 年代初的统计技术。指令明确禁止“噪声注入”——即向数据集添加随机值以保护个人身份的过程,并将披露规避限制为“粗化”(四舍五入、聚合或使用区间)和“抑制”(作为最后手段对数值进行编辑)。
此政策转变实际上禁止了差分隐私——目前在平衡数据效用与隐私方面的黄金标准——以及其他现代技术,如自 1990 年起使用的交换(swapping)和自 2002 年起使用的输入噪声注入。这些方法对于在遵守《人口普查法》(13 U.S. Code Section 9)的前提下共享细粒度的人口和商业数据至关重要,该法规定发布能够识别个人的数据属于犯罪行为。
粗化与抑制无法保护隐私的失败
粗化和抑制不足以保护细粒度数据,因为它们可以被基本代数绕过。当发布多个粗化数据集时,这些数据集的交叉可以让攻击者重建精确数值,从而有效地揭露个人或企业的身份。
案例研究:酿酒厂示例
为说明这种脆弱性,研究人员提供了一个涉及两个城镇(北弯镇和南弯镇)中与啤酒相关业务的情景:
- 情境设置:该县有四个实体:北弯镇的酿酒厂和装瓶公司,以及南弯镇的酿酒厂和装瓶公司。其中两个为公共所有。
- 粗化处理:人口普查局发布了五项统计数据,将类别粗化为“与啤酒相关”,或按城镇或所有权进行分组,以避免披露单一企业的数据。
- 结果:尽管进行了善意的粗化处理,但这五个方程与四个未知数的系统使任何具备高中代数知识的人都能求解出四家公司各自的员工人数。
噪声注入通过扰动方程防止了这种精确重建,确保个人数值无法从汇总总数中数学推导出来。
政治动机与科学价值的对立
包括 Cynthia Dwork 教授在内的批评者以及其他计算机科学领袖认为,DAO 216-26 受政治利益驱动,而非科学证据。具体而言,该指令与传统基金会(Heritage Foundation)2025 项目和美国复兴中心(CRA)的目标相吻合。
根据 CRA 的说明,2020 年人口普查中使用差分隐私使得“无法确定个人的公民身份状态”,即使加入公民身份问题也是如此。通过禁止差分隐私,政府试图使此类个人特征更易获取,尽管《人口普查法》要求对这些数据进行掩码处理。
对数据效用和公众信任的影响
对现代隐私技术的禁令为联邦统计人员制造了严重冲突:他们必须在提供有用数据与保持法律保密之间取得平衡:
- 数据效用下降:为了避免在没有噪声注入的情况下触犯法律,机构可能被迫对数据进行过度粗化,以至于研究人员和政策制定者无法使用。
- 隐私风险上升:政治压力可能导致机构发布易于被解密的数据,违反法律并危及受访者隐私。
- 信任侵蚀:如果受访者认为他们的数据容易被识别,他们将不太可能参与调查,导致“民主数据”的质量下降。
社区观点与争论
虽然客座文章的作者们普遍认为噪声注入是必要的,但社区讨论中也出现了更广泛的争论:
- 实施批评:一些统计学家和政治学者批评 2020 年人口普查中差分隐私的实施,认为它可能扭曲人口配额或选区划分。
- 法律挑战:关于联邦统计中使用差分隐私是否合宪的诉讼仍在进行中。
- 系统性担忧:Hacker News 的评论者对联系立法者的有效性持怀疑态度,认为政治体系被企业和政治利益所控制,使得 DAO 216-26 之类的技术指令成为更大系统性问题的症状。