统计学作业-Stroop(未完)
- 1. 背景
- 2. 任务清单
- 3. 参考
背景
在一个 Stroop (斯特鲁普)任务中,参与者得到了一列文字,每个文字都用一种油墨颜色展示。参与者的任务是将文字的打印颜色大声说出来。这项任务有两个条件:一致文字条件,和不一致文字条件。在一致文字条件中,显示的文字是与它们的打印颜色匹配的颜色词,如“红色”、“蓝色”。在不一致文字条件中,显示的文字是与它们的打印颜色不匹配的颜色词,如“紫色”、“橙色”。在每个情况中,我们将计量说出同等大小的列表中的墨色名称的时间。每位参与者必须全部完成并记录每种条件下使用的时间。
任务清单
我们的自变量是什么?因变量是什么?
概念
- 自变量(Independent variable): 由研究者主动操纵,而引起因变量发生变化的因素或条件.
- 因变量(Dependent variable): 会随一个(或几个)变动的量的变动而变动的量.
对号入座
在该背景下, 自变量是文字与其打印颜色的一致性. 因变量是说出同等大小的文字列表中的墨色名称的时间.
此任务的适当假设集是什么?你想执行什么类型的统计测试?为你的选择提供正当理由.
任何一个集合的总体的方差是一个常量, 而这个集合中的某个样本的方差则是个随机变量, 我们在大多数情况下无法获取集合的总体, 换句话说是大多数情况下我都是根据样本的方差来预估出集合总体的方差. 而我们统计测试主要分为Z检验与T检验, 那么它们都是在什么场景下使用呢?
- Z检验: 已知集合总体均值和标准偏差时, 使用Z检验.
- T检验: 只已知样本时, 使用 t 检验. 当总体标准差未知时, 使用单样本 T 检验 估计总体均值, 并将其与目标值或参考值进行比较. 需要分析两个独立组的均值是否存在差异或者计算两个总体均值差异范围时, 使用双样本 T 检验. 确定两个配对样本之差的均值不等于 0(或目标值)或者计算可能包含差异总体均值的值的范围。
我们知道总体的方差是常数,而样本的方差是个随机变量,大部分情况下总体的方差是不知道的,所以用样本方差来代替总体方差。按照通常的理解,样本量越大样本方差越接近总体方差,因此在大样本(大于30)情况下多数检验用z检验,其实用t检验也可以,两者在大样本情况下已经非常接近了。在小样本情况下,样本方差可能与总体方差差异很大,当然我们不知道具体差异有多大,但用z检验通常会出现偏差。早在100年前戈塞特就发现小样本情况下,用z检验结论有偏差,所以他才在反复试验的基础上提出了对正态分布进行修正的办法,这就是t分布,从此也开启了小样本统计分析的大门,使统计学进入到一个新的天地。现在反而z检验用得很少了,通常都是直接用t检验。
$$ x = \dfrac{-b \pm \sqrt{b^2 - 4ac}}{2a} $$
现在轮到你自行尝试 Stroop 任务了。前往此链接,其中包含一个基于 Java 的小程序,专门用于执行 Stroop 任务。记录你收到的任务时间(你无需将时间提交到网站)。现在下载此数据集,其中包含一些任务参与者的结果。数据集的每行包含一名参与者的表现,第一个数字代表他们的一致任务结果,第二个数字代表不一致任务结果。
报告关于此数据集的一些描述性统计。包含至少一个集中趋势测量和至少一个变异测量。
提供显示样本数据分布的一个或两个可视化。用一两句话说明你从图中观察到的结果。
现在,执行统计测试并报告你的结果。你的置信水平和关键统计值是多少?你是否成功拒绝零假设?对试验任务得出一个结论。结果是否与你的期望一致?
你觉得导致所观察到的效应的原因是什么?你是否能想到会取得类似效应的替代或类似任务?进行一些调查研究将有助于你思考这两个问题!
参考
(转载本站文章请注明作者和出处 Panda)