《实验与准实验设计》全景图

一本把“证据强弱”从统计显著性争论，拉回到研究设计、识别策略和效度威胁本身的基础方法书

阅读定位: 这本书最适合挂在“实验方法 / 识别策略 / 证据强弱”这条线上看。它最重要的价值，不是教你几种花哨模型，而是逼你先问：这个研究到底有没有办法把处理效应和其他干扰因素分开。

和“科学与方法”分支的关系: 它负责补“设计先于统计”“证据强弱由识别结构决定”这一层。回到分支总览可看科学与方法全景图；如果想把研究问题和论证结构接起来，可配合看《研究是一门艺术》全景图；如果想把实验设计和因果语义接起来，可配合看《为什么》全景图；如果想先补统计表达防骗层，可配合看《统计数字会撒谎》全景图。

一、这本书真正解决什么问题

问题	这本书怎么回答	你真正该获得什么
为什么同样是“有数据”，有些研究更可信	关键不在图表有多漂亮，而在设计能否把处理效应和历史变化、选择偏差、测量漂移等干扰区分开	开始用设计质量而不是表面专业感判断证据强弱
为什么随机实验被视为强证据	因为随机化能显著降低系统性选择差异，让处理组和对照组更接近可比	理解随机化到底在解决什么，而不是把它当成神秘咒语
没有纯实验条件时还能不能研究因果	可以，但要依靠更小心的准实验设计、对照结构和威胁识别来尽量逼近可比性	学会在现实约束下思考替代识别策略
为什么很多研究的问题不在统计显著，而在设计阶段	设计如果没有把主要偏差关掉，后面的显著性和模型精致度都可能只是精致地放大错误	把“先做回归”改成“先问设计”

最重要的判断: 证据强弱首先是研究设计问题，其次才是计算和表达问题；识别不清，统计再漂亮也救不回来。

二、关键概念关系网

怎么用这一节: 不要把它读成“几种设计模板大全”。真正重要的是一条判断链：先界定处理和结果，再检查可比性，再识别内部效度威胁，最后才讨论结果能不能解释、能不能外推。

设计先于统计

研究是否可信，很多时候在数据收集之前就已经决定了大半
后续分析只能利用设计留下的空间，不能凭空制造识别

Design FirstIdentificationStructure

随机化的价值在于可比性

随机分配不是仪式，而是为了减少处理组与对照组的系统性差异
真正核心是让“如果没处理会怎样”更接近可比较

RandomizationComparabilityCounterfactual

内部效度威胁是设计的主战场

历史事件、成熟效应、回归效应、选择偏差、测量变化都会污染因果判断
识别这些威胁，比事后解释结果更重要

Internal ValidityThreatsBias

准实验不是次等替代，而是现实世界的重要方法

很多高代价或不可操控场景根本不可能做纯实验
此时关键不是放弃因果，而是更严密地设计比较结构

Quasi-ExperimentComparisonConstraint

效度不只是一种

内部效度关心“这个结果是不是处理造成的”
外部效度关心“这个结果能否推广到别处”，两者不能混成一个问题

InternalExternalGeneralization

三、最值得反复吸收的核心论点

1. 研究设计决定了你能回答什么

分析方法只能在设计给出的边界内工作。

2. 证据强弱首先是可比性问题

没有合理对照，很多结论都站不稳。

3. 随机化不是神迹，而是减少系统偏差的工具

真正价值是让组间差异更像偶然，而不是结构性。

4. 准实验的关键不在“准”，而在“怎样逼近因果识别”

现实世界里很多重要问题都要靠它来做。

5. 内部效度威胁必须在前面被认真审计

否则后面只是对污染过的数据做精密计算。

6. 统计显著不等于因果可信

显著只是结果层面的一种表现，不是识别质量证明。

7. 好研究会主动说明自己防住了哪些威胁

不是只展示结果，还要展示设计上的防线。

8. 证据等级的本质是方法边界意识

先知道自己能回答到哪儿，再决定结论敢说多重。

四、常见误读与反直觉点

误读 1:

把这本书当作“实验万能论”。它真正教的不是迷信实验，而是理解何时实验最强、何时必须靠准实验补位、何时只能保持克制。

误读 2:

觉得只要做了对照组就够了。关键不是形式上有没有对照，而是对照是否真的可比、主要威胁是否被处理。

误读 3:

以为统计模型越复杂，研究就越强。很多时候最致命的问题早在样本进入模型之前就已经发生了。

误读 4:

把准实验理解成“没办法时的低配方案”。恰恰相反，很多现实场景里真正成熟的方法能力，体现在能否在约束中设计出可信的比较结构。

反直觉点:

一项研究最关键的部分，常常不是结果页，而是你在研究开始前怎样安排组别、时点、测量和对照。

五、适合谁读

非常适合

做实验、评估、项目复盘、政策分析、教育研究、产品效果分析的人
已经知道“相关不等于因果”，但还不会设计识别策略的人
想把研究设计能力接进知识库、报告或组织决策里的人

最容易读出大收益的人

经常看实验结论、AB 测试或效果评估，但过去主要盯结果而不盯设计的人
总觉得“这结论好像不稳”，却说不清不稳在哪里的人
需要把研究问题推进成可执行设计的人

六、不适合谁读

没那么适合

只想快速抄几种显著性检验公式的人
不打算真正做评估或设计，只想要结果金句的人
期待一本轻松管理读物，而不愿处理研究边界和威胁的人

容易读偏的人

把方法框架当成僵化模板，而不是判断工具的人
容易忽视现实约束，只追求形式上最漂亮设计的人
喜欢跳过前提条件，直接搬结论的人

七、和仓库现有图谱怎么配合看

书里的主问题	建议配套图谱	配套价值
实验方法在总图中的位置	科学与方法全景图	把实验、准实验、识别策略和证据等级放回整条方法链中
怎样把一个问题变成可研究设计	《研究是一门艺术》全景图	前者补问题与论证工作流，后者补怎样把它落成可识别的研究结构
干预问题与反事实问题怎样成立	《为什么》全景图	让实验设计不只是技术模板，而是和因果语义、识别条件连起来
怎样防止研究结果在表达层偷换判断	《统计数字会撒谎》全景图	先防统计包装，再谈设计质量，证据判断会更稳
怎样在不确定世界里谨慎看数据和预测	《信号与噪声》全景图	前者补设计与识别，后者补统计判断与预测谦逊

八、推荐读法

第一遍：只抓研究设计骨架

适合第一次读，先把最重要的判断顺序装进去

处理与结果

→

对照结构

→

效度威胁

目标: 先从“看结果”改成“看设计”

关键收获: 你会更快识别一项研究最脆弱的环节

建议: 第一遍不要急着背所有设计名称

第二遍：带着一个真实评估问题重读

适合产品实验、教育项目、政策评估和组织复盘场景

研究问题

→

可比性

→

威胁审计

→

结论边界

目标: 把书里的方法变成自己的设计动作

最有价值: 你会更少被“显著结果”直接带走

建议: 和《研究是一门艺术》《为什么》配读效果最好

九、如果只能记住这本书的几句话

记住 1:

设计不清，统计再精致也很难挽救因果判断。

记住 2:

随机化的价值，不是形式漂亮，而是让比较更像真正的反事实比较。

记住 3:

准实验不是低配，它是现实世界里认真逼近因果识别的重要办法。

记住 4:

看一项研究，先问它防住了哪些效度威胁，再问它得出了什么结论。