Research Methods: The Essential Knowledge Base|Academic Project 2017–2018(Grade 92)总结:研究方法一篇打通
Research Methods: The Essential Knowledge Base (Book Summary) — Validity, Reliability, Sampling, Survey Research & Data Analysis
在信息过载的时代,难的不是“找到资料”,而是把结论做得可信。这篇博文基于《Research Methods: The Essential Knowledge Base》Academic Project 2017–2018 高分总结(Grade 92)梳理研究方法主线:从研究问题与假设、操作化与测量误差,到信度效度、抽样与调查、实验/准实验设计,再到数据准备与推断分析(GLM、显著性、效应量)。目标是让你更快掌握考试与作业高频要点,并能直接用于方法章节写作。
1. 研究是什么:不是“观点”,而是可检验的证据链
这份总结开篇强调:研究是一种系统性的、基于经验事实的探索,目的是形成可公开讨论、可复核的知识。
你可以把研究当作一条流水线:
研究问题 → 假设 → 操作化与测量 → 抽样 → 研究设计 → 数据分析 → 结论与推广
当你能沿着这条线把每一步“说得清楚”,你的作业/论文就会从“像在写感想”变成“像在做研究”。
2. 研究问题从哪里来:三条最稳的路径
很多人选题靠灵感,但文档给出更可靠的来源:
- 研究文献:做文献综述,找空白、矛盾、可复制/可扩展点
- 实践问题:来自真实场景(教育、组织、政策、社区等)
- 需求型文本:如研究/项目征题(RFP 类文本),常能直接生成可研究问题
实用建议:文献综述尽量早做。它不仅帮你选题,还会帮你选测量工具、确定变量、避免重复劳动。
3. 研究语言速通:变量、假设、关系、时间
3.1 变量与属性
- 变量(Variable):可变化的量(焦虑、成绩、学习时间、满意度)
- 属性(Attribute):变量的具体取值(高/中/低,或具体数值)
3.2 假设:H0 与 H1
- 零假设 H0:通常表示“无差异/无效应”
- 备择假设 H1:你真正期待的方向或差异
并且区分:
- 单尾假设(有方向) vs 双尾假设(无方向)
3.3 关系类型
- 描述性:发生了什么
- 相关性:一起变化但未必因果
- 因果性:X 导致 Y(最难证明)
3.4 时间结构
- 横断面:一次测量
- 纵向/重复测量:多次测量
- 时间序列:更多波次、更密集的长期跟踪
4. 演绎与归纳:定量与定性不是对立
总结里用“演绎/归纳”把研究思维讲得很清楚:
- 演绎(Deductive):从理论出发提出假设,用数据验证(常见于定量)
- 归纳(Inductive):从材料出发找模式,生成概念/理论(常见于定性)
关键理解:优秀研究常常是混合逻辑——先用定性探索问题,再用定量验证假设,或反过来。
5. 有效性(Validity)四件套:你研究“站不站得住”的核心
文档给出非常好用的“四种有效性”框架(建议背熟并用于论文方法章节):
- 结论有效性(Conclusion Validity)
你说“有关系/没关系”是否可靠?是否犯了统计错误?
- 内部有效性(Internal Validity)
你说“X 导致 Y”是否排除了替代解释?这是因果推断的核心。
- 构念有效性(Construct Validity)
你测到的,真的是你想测的概念吗?(操作化是否合理)
- 外部有效性(External Validity)
结果能否推广到别的人/别的地方/别的时间?
一句话记忆:
内部有效性解决“是不是因果”,外部有效性解决“能不能推广”。
6. 测量(Measurement):没有完美测量,只有误差管理
总结里把测量讲得很“现实”:任何测量都有误差,关键是你是否能控制并说明。
6.1 信度(Reliability):一致性
常见信度形式包括:
- 重测信度(test-retest)
- 平行形式信度(parallel forms)
- 内部一致性信度(Cronbach’s alpha 等)
- 评定者一致性(inter-rater / Cohen’s Kappa 等)
6.2 效度(Validity):测得对不对
构念效度是总括性的,常用证据包括:
- 表面效度、内容效度
- 预测效度、同时效度
- 聚合效度、区分效度
6.3 三类常用工具:量表/测验/指数
- 量表(Scale):态度、体验等抽象概念
- 测验(Test):知识或技能
- 指数(Index):多个变量按规则合成一个分数(如 SES)
7. 抽样(Sampling):你能推广到哪里,很多时候抽样那刻就决定了
总结把抽样分为两大类:
- 概率抽样:有随机机制,推广性更强
- 非概率抽样:便利/目的/滚雪球等,更灵活但更难推广
并给出一个很实用的视角:近似相似性(proximal similarity)
当你没法做理想抽样时,至少要说明你的研究情境与目标情境在“人、地、时、设置”等维度的相似程度,从而谨慎地谈推广。
8. 调查研究(Survey Research):问卷与访谈怎么选?
8.1 问卷
优势:覆盖广、成本低、标准化强
挑战:回收率、理解偏差、难追问、题目设计要求高
8.2 访谈
优势:信息深、可追问、适合复杂议题
挑战:耗时、成本高、对访谈员要求高、受社会赞许偏差影响更大
题目设计要点(这部分非常“作业友好”):
- 避免双重问题、含糊词、暗示性措辞
- 控制题目顺序:先易后难,敏感问题靠后
- 必要时用筛选题(filter/contingency questions)
9. 研究设计(Design):因果推断的“主战场”
如果你想回答“X 是否导致 Y”,总结强调三条因果条件:
- 时间先后(cause 在 effect 之前)
- 协变关系(有关系)
- 排除替代解释(最难)
9.1 实验设计(Experimental Design)
核心优势:随机分配能最大化内部有效性
常见限制:伦理、可行性、现实场景难以完全控制
9.2 准实验设计(Quasi-Experimental Design)
看起来像实验,但缺少随机分配,需要更强的论证与补救策略。
常见类型:非等组设计、回归不连续等。
9.3 内部有效性的典型威胁(建议当作写作清单)
- 历史、成熟、测试效应、仪器变化
- 样本流失(mortality/attrition)
- 回归到均值(regression to the mean)
- 组间选择偏差(selection bias)
- 社会互动威胁:扩散/模仿、补偿性竞争、怨怼性消沉等
10. 数据分析(Data Analysis):显著性不等于重要性
总结把分析流程概括为三步:
- 数据准备:编码、缺失处理、反向题、构建量表总分等
- 描述统计:分布、均值/中位数/众数、标准差等
- 推断统计:检验假设、报告不确定性
并强调两类经典错误:
- I 类错误:以为有差异其实没有(假阳性)
- II 类错误:以为没差异其实有(假阴性)
因此建议在报告中同时关注:
- p 值(显著性)
- 效应量(差异/关系有多大)
- 置信区间(结果可能范围)
- 实际意义(对现实有没有影响)
文档还用 General Linear Model(GLM) 作为“总框架”串起 t-test、ANOVA、回归等,让你理解这些方法并非互不相干,而是同一数学体系下的不同表达。
结语:把这份总结当成你的“方法论写作模板”
如果你正在做 Academic Project 或写论文方法章节,最实用的用法是:
- 用“四种有效性”做结构:你能保证什么、牺牲了什么
- 用“操作化—测量误差—信效度”说明你的变量如何落地
- 用“抽样—设计—分析”解释你的证据链如何支撑结论
- 用“威胁清单”主动回应评阅人可能的质疑
研究方法的核心不是“术语堆砌”,而是让你的结论更接近真实、更可被复核。