Evidence, Measurement & Causal Inference
证据、测量与因果识别
这一条中层专题负责把“什么算证据”真正压实。
它关注的不是抽象地说“要讲证据”,而是把证据拆成一条完整链路来看:你看到的是什么,你怎么测量,你拿什么比较,你凭什么把相关说成因果。
只有把观察、样本、指标、设计和反事实放到同一张图里,我们才不会把“有数据”误读成“已经知道了”。
因为“重视证据”如果不展开到方法细节,最后通常只会变成一句态度正确的话。
证据不是信息数量,而是方法质量
看到很多材料,不等于握有强证据。证据的重量来自样本如何来、指标是否可靠、比较是否成立、替代解释有没有被挡住。
材料
→
设计
→
证据强度
测量决定了你到底在看什么
很多争论并不是结论阶段才出问题,而是在定义指标时就已经歪了。你以为在量“能力”,可能实际量的是曝光、资源或表达风格。
概念
→
指标
→
偏差
因果识别是证据链里最容易偷懒的一步
人脑天然喜欢把先后出现、一起出现、看起来合理的东西接成因果故事。方法训练的价值之一,就是逼你把“相关”“预测”“干预效果”分开。
相关
→
反事实
→
因果
它把“证据”拆成可操作的四层,而不是把所有研究都扔进一个大筐里。
观察从来不是“现实自动送到你面前”。场景、抽样、记录方式和时间窗口,都会影响你究竟捕捉到了什么,以及漏掉了什么。
样本入口
观察条件
材料边界
一旦把复杂对象压缩成单一指标,就同时做了选择和放弃。测量的难点不只是精度,而是指标到底有没有抓住你宣称要研究的东西。
指标设计
测量误差
效度
没有对照和可比性,很多差异都只是背景差异在说话。证据质量很大一部分,取决于你是否找到了像样的比较结构。
对照
识别策略
偏差控制
真正难的不是把两个变量放进模型,而是回答“如果我改变它,会发生什么”。因果识别要求你面对反事实,而不是只在已发生世界里讲故事。
相关不等于因果
反事实
干预逻辑
如果只能保留最实用的证据框架,最值得反复训练的就是这四道关。
先问样本有没有代表性、有没有被筛掉关键对象、有没有幸存者偏差。材料入口一旦歪了,后面所有精密分析都只是在加工偏差。
很多研究不是没有数据,而是把复杂对象过度简化,最后量到的是容易记录的东西,不是关键机制本身。测量错误会让结论看起来精确却失真。
无论是实验、准实验还是历史比较,关键都不是术语,而是你是否搭出了足够可信的对照结构,让替代解释没有那么容易混进来。
一个研究也许能支持“在这里、在这群人、在这个时期发生过什么”,却未必支持“到处都如此”或“改变它就一定有用”。外推过度是证据误用的高发区。
最好的读法不是照顺序背,而是看每本书在证据链里补哪一环。
很多证据判断失误,不是因为不会算,而是因为没有先防这几类结构性陷阱。
风险一:样本本身已经偏了
进入样本的人和没进入样本的人,可能在关键特征上早就不同。很多“发现”其实只是选择机制被误当成了世界规律。
选择
→
偏差
→
伪发现
风险二:指标替代了问题本身
一旦把复杂目标压成单一指标,系统就会开始围着这个指标优化,而不是围着真实目标优化。测量在这里会反过来改变被测对象。
目标
→
指标
→
行为扭曲
风险三:把相关性讲成因果故事
只要你不认真面对混杂变量、反向因果和反事实,这类故事几乎总能讲得很顺。但顺耳和成立,是两回事。
一起出现
→
看似合理
→
不等于因果
风险四:结论外推过头
在一个时间、一个样本、一个制度环境里成立的结果,未必能直接拿到另一个场景复用。证据的边界感,往往比结论本身更重要。
局部成立
→
情境变化
→
谨慎外推
这条线往前走,一边会碰到知识标准,一边会碰到概率语言和预测谦逊。
这一页的定位:
它是“科学与方法”分支下的一张中层专题页,负责把证据从态度问题压回方法问题。
它不是统计教材速览,也不是只讲因果推断的术语清单。
更合适的用法,是把它当成整条方法线的证据评估层。