按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
同类型的线条。当你找到了指导语要求的卡片时,就把它们放到一
个槽里,咀便最后拿到房间外面。
你有所不知,这些卡片上写的是中文;而且你也不知道,你确实
正在按照要求用中文回答问题。这个假想的实验假设,你的指导语
足够详细以至于你能够充分地回答问题,尽管你根本不懂中文一一
你甚至不知道自己正在操纵着中文符号。因此,你正在参加的是图
林测验的一个变式,因为人们正在用中文问“这个房间”的问题(由此
得名中文房间),并且询问者应该不能区分你的答案和舍说中文人的
答案。你正在娴熟地操纵着一套形式符号,但这些符号对于你来说
没有任何意义。
塞尔相信,在一个真实的中文房间比赛中,你会通过图林测验
的。这意味着你在中文方面有才能和智力吗?塞尔的回答是不。虽
然你通过了图林测验,但你根本不理解中文。你的所作所为完全类
同于一个愚弄询问者使其相信是人而不是正在回答问题的计算机。
计算机程序很类似于你在中文房间中所操纵的符号;此外,与你相像
的还有,计算机_没有给符号赋予意义或理解。根据塞尔的观点+这只376
能意味着图林测验是无效的,它不能证明机器有智力。
塞尔叉进一步论证了他的观点。他提出真正的理解需要一个在
实验情境中有着因果推理能力的大脑。休不可能像理解你的母语那
样去理解中文,因为你不能生成它。对于中文来说,所有你能够做
的,与在“智力”活动中一台机器所能做到的一样,就是遵照指导语去
操纵符号。塞尔(1990)指出,有生理基础的人脑或许不是能够思维
的惟一机器;但他又指出,创造人工思维的机器的可能性是“不存
在的”。
47883097 qzonf qq
㈣试看躺咨询 /439
塞尔中文房间的讨论及其有关大脑的观点并非没遇到过挑战
(见Churchland和Churchland,1990)。基本问题似乎是:什么可咀
作为智力的充分测验?只能操纵符号的装置的行为算作智力吗?强
Al的回答是算。塞尔的回答是不算——一个模拟中文说话的程序
是不理解中文的+就像一个模拟消化的程序不能真正消化食物一样。
定义智力
仿;现在可能要问,“智力还有其他的被广为接受的操作定义吗?”
其简短回答是没有。在这里,我们将探讨一些智力的其他定义和与
操作定义概念有关的附加问题。
你可能已经注意到了,当我们在本章的第一部分讨论信度时,我
们没有定义智力。这是因为测验的发起者常常有一个当时实用的问
题。比纳只是想要确定法国学校学生适当的等级水平。在这些实用
的情境中,测验的效度是由某一标准决定的,比如在校就读的成功。
事实上,斯坦福一比纳和韦克斯勒测验在预测学业成绩方面做得很
好。因此,你可能想说,如果智力测验有很好的效标效度(测验预测
学业成绩)的话,那么智力就是测验测量的东西。但这个问题是两面
的。一方面,大多数智力测验集中在数学和言语能力上,以至于它们
忽略了色括音乐能力和理解他人能力在内的其他种类的重要智力活
动;另一方面,从学业角度定义智力能力常常被看作是一个狭隘的和
有文化偏差的智力定义方式。典型的IQ测验并不能测量出一个人
的成功和环境适应能力。按照一些批评家的观点,IQ测验反映的是
上、中层白人的价值,而不反映智力对整个社会意味着什么。因此,
争论一直存在,人们的IQ分数可能也与常识或有效率的生活没什
么关系。而且+即使人们是高教的并且有常识,他们的IQ分数仍不377
会预测他们在另一个情境中的成功,比如在沙漠中存活下来或在丛
林中保护了自己并得以谋生。
因此,把智力的定义确定为智力测验所测量的并接受下来并不
能解决许多问题。把智力局限在专门技术的范围内,很可能会遭致
一般公众的反对,因为他们的关于什么是智力的概念与之不同
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
一
U
: 747883097 TL。 028 8194 2202日址:http: i1747883097 qzone qq…
学专业20门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
(Sternberg; 1995)。
让我们简要思考一下当代对操作定义智力所做的努力和尝试。
这个理论被称为多元智力的理论,是由加德纳(1983)提出的。他的
目的是为了拓宽智力的标准学业定义,以包含那些西方文化价值较
少提到的智力(为了使用他的措词)。而标准智力测验则较多涉及西
方文化价值。加德纳从跨文化的、心理的、心理测量的、发展的以及
神经的等方面提出证据证明智力七个侧面的存在。这些多元智力是
机体运动知觉的、语言的、逻辑一数学的、音乐的、自我理解的、社会成
功的和空间的。在这些侧面中,只有语言的、逻辑一数学的和空间的
在标准IQ测验中被测试过。对于七个智力中的每一个来说,加德
纳都试图证明它有一个独立的神经结构和一个独立的发展史}一个
人可能在一个侧面中表现得很好,而在其他侧面中则相反;并且无论
在什么样的文化背景中它们每一个都起着突出的作用,虽然方式
不同。
我们不对每个智力一一剖析了,接下来我们只考虑一下加德纳
对音乐能力的分析。首先,椰德纳表明音乐能力的基本神经结构有
别于其他的。音乐能力与右脑有关,而语言能力与左脑有关。左脑
损伤的人常常会失语,即他们有语言障碍。然而有趣的是,尽管失语
的人常常有说话的麻烦,但他们常常能唱;更有甚者,即使在很少的
唱不出歌词的情况下,他们的音乐能力依然没受到干扰。相反,右脑
损伤的人常常会遭受音调不识症。音调不识症患者不能唱,他们平
常的声音变化减小了。但是,音调不识症患者的语言能力是完好无
损的。
加德纳注意到的下一件事情是,人们在音乐能力上有着极大的
差异。这可以通过特殊测验(即心理量表方面的)来评估,但在日常
的观察中它已经显而易见了。莫扎特就是一个显而易见的音乐天
才。很小的时候,这种天才就创作了一流的交响音乐;而且还未进人
青少年他就已经在欧洲的皇家宫廷中演奏了。
加德纳还进一步提出了独立音乐智力的证据,在此我们就不考
虑了。对于每一个被提出的智力,加德纳都试图在几个维度建立它
搬一学
瓤献一理
拟柳一心
臻一验
一笨
芸芸视频水久联系方式㈣:747883097 TL:028 8104 2202网址:http://7
推荐:北京师范大学心理学专业20门主干课程DS视频图文并茂,音质圆润,
们的操作定义。这意味着他正在使用会聚操作以便于精练他的智力
概念。他在定义智力上成功了吗?加德纳的多元智力理论是智力的
定义吗?正如你可能预料到的,那些问题的答案是不,或者至少对于378
某些心理学家来说是不。
加德纳理论的一个反对者是心理学家斯顿伯格( Sternberg,
R),他已经采用了信息加工方法来定义智力了(斯顿伯格的工作中
最被接受的处理是The Triarchic Mind,1988)。斯顿伯格对加德纳
方法的主要批评是,它没有明确说出七个智力之下的过程。斯顿伯
格认为,加德纳只是说出了智力的名称而没有确切指出它们是什么
和它们不是什么。斯顿伯格的第二个批评是,智力是一般的,而加德
纳的智力却是具体的。根据斯顿伯格的观点,加德纳辨认出的是才
能而不是智力。缺乏音乐才能对一个人来说不会有太多的损害,可
能只是不突出而已。但是,一个不能计划或推理的人则在这个世界
上将会毫无用途。
斯顿伯格的批评被他考虑进了自己的智力理论中,他的理论强
调加工信息、似新方式综合信息以及适应新情境的能力。斯顿伯格
的智力操作定义表明,智力行为反映的是对社会情境中问题的解决
能力(见Sternberg和Salter,1982)。这个观点是杰出的,被许多感
兴趣于信息加工方法的心理学家所接受(见Kantowitz,1989)。
但这个适应的问题解决能力是智力吗?按照这个观点,写一首
诗或谱一首曲是智力的还是才能的显现?对这些问题的回答需要一
个被根据许多操作定义作出的会聚操作数据所支持的令人信服的理
论。尽管操作定义在科学理论的发展上确实起到了重要作用,但是
操作定义的使用却有利有弊。其有利的方面是,操作定义能够促进
科学的交流,从而也增进了科学研究的信度。如此可靠的工作为概
念的阐述和精炼奠定了基础。其弊端在于,操作定义可能是被讨论
概念的相互矛盾的定义。尽管它们可能有效,但它们的含义通常服
从于争论。定义需要适应于一个用于描述和预测行为的其他概念所
组成的网络。当然,在理解自然和人工智力上的进步依赖于人们对
智力概念作出的一个满意的定义。
r~
·蒸
:㈣: 747883097 TL: 028 8194 2202日址:http: i1747883097 qzone qq…
442蓐喜翠嚣磊黩享勰霉
,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
/实验心理学
12。3 实验主题与研究范例
主题回归假象
范倒教育评价
有关智力和个体差异研究的一个问题围绕着心理学家和教育学
家对提高个体作业的尝试和评价此类尝试的重要性而展开了。正如
你可能怀疑的,精确的测量在于对评价变化的重视。无论测量误差
在什么时候出现,我们错误地得出某种变化发生了或没有发生的可379
能性都将存在。尽管这句话看起来没什么,但它对你却有着深远的
含义,许多心理学研究就是由于没有充分地考虑事实而被弄错了。
用于收集数据的特定设计或程序尤其易受测量误差引起的偏差
影响。那些设计,记住,被称为准实验设计,因为被试没被分配到处
理中,并且控制组是在一个随机的基础上(Campbell和Stanley,
1966》。这些组中的被试可能在许多因素上被研究者匹配,但很难确
保组之间的重要差异在处理开始前不存在。当研究前实验(处理)组
与控制(无处理)组没有在研究接近尾声将要测试的变量上进行匹配
时,这个问题就被扩太了。例如,同一社区的一组儿童可能被选出来
作为实验组以测试一门训练奔跑的新课程,同时在这个社区中再选
出一组儿童作为控制组。实验组接受了六周的训练后,测量这两组
的奔跑速度。这将会是一个准实验设计,因为儿童不是被随机地安
排到实验组或控制组中的。即使实验者报告说两组成员的平均身
高、体重和年龄相同,但我们仍不能确信处理前两组的平均奔跑速度
相等。事实上,即使两组在平均奔跑速度上进行了匹配,我们仍不能
确信训练后的组间差异是由于训练的效果。这是因为不能排除研究
前取样时两组所来自的总体不同这一可能。当总体差异存在时,就
可能出现被回归假象误导的可能性,或者说,实验效果是由“统计回
归”引起的,而不是实验操纵。我们在第2章中谈到了回归假象。
或许在这里举个例子有助于说明它。假设你是一个A学生,而
你的邻居是一个C学生,尽管你们两有着类似的背景。在一个特别
http:i1747883097 qzone qq…
音质卧目,提供试看 期待咨询 /443
第十二章个罔
的作业上,你们都得了B。为了提高学业成绩,你的邻居决定参加一
系列的帮助聚会。你的老师决定评价帮助檗会是否有效,于是她或
他要对相同背景下的帮助聚会和非帮助聚会学生的未来等级进行比
较。你被选出来作为匹配的学生与你朋友比较。在下一个作业中,
你得了A,而你朋友得了一个c+。评价该课程的一些情况列在了
图12…3中。注意作为个人平均等级函数的标准等级的变化。如果
因为你从B变成了A一+而你朋友从B变成了c+.就能得出帮助聚
会有害的结论吗?可能不行,因为你们俩只是向平均数回归而已。
在这个小研究中看到的效应可能不是一个真正的处理效应,而只是
一个回归假象,因为你和你朋友不是真正相等的。事实上,帮助聚会
还可能让你朋友受益了,因为她或他的等级比通常的C等级要高。
如果第一次作业是B的学生被随机分配到帮助聚会或非帮助聚会
组,然后再在第二次作业等级的基础上进行比较的话,那么可能会获
得帮助聚会对学生等级影响的精确评价。
周12…3向平均数回归干扰准实验结果解释的罔解 380
尽管参加者是作为B学生被匹配的,但有或无帮助聚会时他们舯成绩还是
向他们自身确切的平均等级回归了。帮助聚会有用吗,
向平均数回归的原因是,所有的心理测量都会受到一定量变异
的影响。使用任何测量时,都不会百分之百的可靠,获得最高分的被
试组不仅包括那些真正的一流学生,也包括那些由于测量的偶然误
差而被混入的非一流学生。再测时,这些偶然的测量误差不会还在
同一方向上发生。因此,重测时,最高分数组的平均值将略低些,而
首次测试较差的被试组则会略高些。本章结尾处的课后作业部分旨
在通过一个简单的例子使你更好地理解回归假象问题。
在诸如补偿性教育的准实验研究中回归假象的重要性已经成了
争论主题。一个关于20世纪60年代领先计划(Cicirelli和Graug…
er.1969)的有影响力的研究受到了特别关注。在这个被称为威斯
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
频北
帮●
芸菩视频水久联系方式㈣:747883097 TL:028 8104 2202网址:http:i1747883097 qzone qq
444推严:北京师范大学心理学专业2。门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
。。。。。。。。。。。。。。。;。;。。。。。。。。。。。。。。J: …
/实验心理学
r1
u
汀豪斯一饿亥俄( Westinghouse …Ohio)的研究中,为了评估,完成领先
经历的儿童被随机选出。符合该计划条件的来自同一区域的控制组
儿童然后也被限定了。控制组儿童被随机选出并在性别、种族团体
成员和幼儿园看护方面与实验组儿童进行了匹配。请注意,他们是
从不同的组中被选出的:一个参加过领先计划,一个没有参加过。等
到实验和控制被试的最后选择作出后,对两组进行的社会经济情形、
人口统计情形以及态度等方面的额外测量也被比较了。研究者报告
说差异很小。然后实验(领先)和控制(非领先)儿童的学业成就和潜
能被计算和比较了。从这个大研究中得出的一般结论是,领先在消
除贫穷和社会不利影响方面是没有效果的。
其他的心理学家(Campbell和Erjebacher; 1970a)很快就对这
个研究从几方面进行了批许。首先,他们指出这个研究的结果毫无
疑问地引起了部分的回归假象。更糟糕的是,假象的大小不能估算
出来,以至于不得不怀疑整个的发现。
基本问题是匹配(着想参看类似的例子,见第2章)。西西雷利
( Cicirelli)及其合作者令人赞赏地尝试了对一组参加领先计划的贫
穷儿童样本与同一区域未参加的儿童进行了匹配。那么两组间后来381
的差异源于这个计划,对吗?不一定。只有当这两个样本来自于相
同的潜在总体分配时,上述说法才正确。但是这种情况是不可能的。
可能的情况是它们的两个潜在总体不同,即贫穷的“处理”儿童来自
一个比“控制”儿童差的总体。通常被预先选出来参加领先计划的儿
童是来自一个贫穷背景的,相反,未参加计划的“控制”儿童则来自于
能力更强的总体。基本问题是被试没有被随机分配到实验条件中,
因此研究者不得不对控制被试与实验被试进行匹配。为了匹配这两
个来自不同总体的样本,实验者只得选择高于总体均数的儿童作为
贫穷的处理组,而选择那些低于总体均数的儿童作为控制组。但是
当这样做时+可怕的回归假象又总会出现。当再测每一组时,个体的
成绩都倾向于回归到组平均数;换言之,此例中的贫穷组将趋于完成
得更差,而控制组则完成得更好。
驾只对两组匹配未进行任何的实验处理时,向平均数回归将会
芸芸视频水久