知ing

心理学与生活

[美] 理查德·格里格 / [美] 菲利普·津巴多 /

神秘师兄 上传

第十章 智力与智力测验

一、什么是测量

心理测量(psychological assessment)是用来检测人们的能力、行为和个性特质的特殊的测验程序。心理测量通常是指对个体差异的测量。

1、测量的历史

西方智力测验发展中的关键人物是英国上层社会的弗朗西斯·高尔顿爵士(Sir Francis Galton)。

《遗传的天才》测量的四个重要思想:第一,智力的差异可以根据智力的程度来度量。第二,智力的个性差异成钟型曲线,或者称做正态分布。第三,智力,或叫做心理能力,可以由客观测验测得,第四,两套测试成绩之间的相关程度可以由相关的统计分析来确定。

有争议的思想:

* 天才或是出众的人会出现在同一个家族内,教育对于智力只有很小的影响。

* 智力上与人的道德价值相关

2、正是测量的基本特点

正式测量(formal assessment)程序应该满足三方面的要求,即信度、效度和标准化。正式测量的程序适用于所有的心理测量。

(1)信度

信度(reliability)是指某一测量工具能够得出一致分数的程度。

重测信度(tet-retest reliability):即对于同一个人、同一个测验,在两种情况下所测结果的相关程度。

变化了的平行信度(parallel forms):可以减少测验的练习 效应、对测验问题的记忆,以及被试力求两次测验表现一致的愿望。

内部一致性(internal consistency)检验,在可信度较好的测验中,这两部分的成绩相当,这时可称为内部一致性较好,具有分半信度(split-half reliability)。

不仅测量工具本身要可信,运用工具的方法也要可信,主试必须学会以一种可信的方式,采用同一个区分系统来施测。

(2)效度

测验的效度(validity)是指测验能够测得的它要测定的东西的程度。

有效性反映了测验对行为或结果(与测验目的或设计相关)进行准确预测的能力。有三种重要的效度:表面效度、效标效度和结构效度。

如果测验项目看起来与感兴趣的特性直接相关,那么测验具有表面效度(face validity)。表面效应并不能保证测量的准确性。

效标效度(criterion validity,也称为预测效度),将某一个人的测验成绩与他或她在其他标准(与测验相关)上的成绩相比较。

一种测验是否有效的条件是特定的,因此对一种测验要考虑基于何种目的它是有效的。

信度是某一测验与其自身的相关程度,而效度是测验与外部的相关程度。不可信的测验也没有效度,很可能具有较高信度的测验没有效度。

(3)常模和标准化

说明你所得分数的意义,你会将你的成绩统计常模(norm)做比较。通过查看测验的常模,你会知道分数的大致范围,以及在你的年龄和性别范围内的平均数是多少。这会有助于评价你在正态人群中的相对位置。常模使一个人的分数可以同与其年龄、性别和文化相当的人的平均分相比。

标准化(standardiztion)是指在同一条件下对所有人、以同样的方式实施测验。

对任何测验,你应该根据测验的信度和效度,操作的常模以及测验环境的标准化程度等来评价测验分数。

二、智力测量

1、智力测验的起源

智力是一种一般的心理能力,与其他事物一样,包含推理、计划、问题解决、抽象思维、理解复杂思想、快速学习 和从经验中学习 等能力。

1905年,第一次出版了关于可实施的智力测验的出版物。阿尔弗雷德·比奈(Llfred Binet)-西奥菲勒·西蒙(Theophile Simon)量表。

不同年龄的正常儿童的平均分数被计算出来,测验的结果以达到某一特定分数的正常儿童的平均年龄来表示,这就称之为心理年龄(mental age)。

比奈的方法有4个重要特点。首先,它将测验的分数解释为对当前操作的评估,而不是对天生智力的测量。第二,他想使测验分数应用于确认需要特殊帮助的孩子,而不是污蔑他们。第三,他强调训练和机会可以影响智力,而且他也在寻找可以帮助弱势儿童的方法。最后,他用经验编制他的测验——他收集了数据看它是否有效——而不是试图根据一种特定的智力理论来编制。

2、IQ测验

有两种个体施测的测验至今还在广泛应用:斯坦福-比奈(Stanford-Binet)和韦克斯勒(Wechsler)测验。

特曼1916年发表了比奈测验的斯坦福版本被称为斯坦福-比奈测验,在特曼的新测验中,他提供了智商的概念。

IQ=心理年龄&pide;生理年龄×100

当18岁以下的个体的有效IQ得分为70~75,或者更低,则他们被归为心理迟滞(mental retardation)。被认为是心理迟滞的个体还必须在适应性技能等方面表现出缺陷。

1939年发表了韦克斯勒-贝尔维尤智力测验。

WAIS-R中有6个语词分测验:知识、语词、领悟、计算、相似和数字广度。这些测验包括书面和口头表达两种。5个操作分测验是对测验材料的操作。

WAIS-R适于18岁及以上的人群。韦氏儿童智力测验第三版(Wechsler Intelligence Scale for Children-Third Edition)适于6至17岁的儿童;韦入学前和初级智力量表修订版(Wechsler Preschool and timay Scale of Inteligence-revises, WPPSI-R, Wecher,1989)适于4至6岁半的儿童。

在对同一被试的不同年龄进行施测时,韦克斯勒量表具有特别的价值。

三、智力理论

1、智力的心理测量学理论

心理测量学(psychometrics)是心理学的一个领域,主要是对心理能力进行全方位的测量,包括人格评定、智力评估和能力测量。

查理斯·斯皮尔曼(Charles Spearman)在智力领域中较早地应用了因素分析,认为存在一般智力因素,或称为g因素,这是所有智力操作的基础(Spearman, 1927)。每个维度还与其特殊智力相关联,即斯皮尔曼定义的s。

雷蒙德·卡特尔将一般智力分为两个相对独立的成分,他称之为晶态智力和液态智力。晶态智力(crystallized)包括一个人所获得的知识以及获得知识的能力,它由语词、算术和一般知识测验来测定。液态智力(fluid intelligence)是发现复杂关系和解决问题的能力,它由木块图、空间视觉等测验来测定,在这些测验中,所需要的背景信息是很明确的。

晶态智力使得人们很好地面对自己的生活和具体问题,而液态智力帮助你处理新的复杂的问题。

吉尔福德定义了智力任务的三个特性:内容或信息类型、产品或信息表征的形式、操作或心理活动表现的类型。

这一模型中有5个内容:视觉、听觉、符号、语义和行为;6种产品:单元、分类、关系、系统、转换和提示;5种操作:评价、聚合、发散、记忆和认知。每一智力任务都包含这三个维度,每一个内容—产品—操作的结合,代表一个独立的心理能力。吉尔福德的智力概念具有预测价值。

2、两个超出IQ概念的理论。

(1)罗伯特·斯腾伯格(Robert Sternberg)提出了智力的三因素理论,认为智力包括三个部分——成分、经验和情境,它们都代表有效操作的不同方面。

成分性智力(componential intelligence)是指思维和问题解决等所依赖的心理过程。斯腾伯格认为,有三种成分对信息加工是至关重要的:(1)知识获得成分,可以用于学习 新的事实;(2)操作成分,作为问题解决的策略和技巧;(3)元认知成分,用于选择策略、监控认知过程以达到成功。

经验智力(experiential intelligence)是指人们在两种极端情况下处理问题的能力:新异的或常规的问题。

情境智力(contextual intelligence)反映在对日常事物的处理上。它包括对新的和不同环境的适应,选择合适的环境以及有效地改变环境以适应你的需要。情境智力有地被人们称为小聪明(street smarts)或商业头脑(business sense)。没有较高IQ值的人,也可以具有较高的情境智力。

斯腾伯格的三因素智力理论认为,IQ测验并不能涵盖智力行为的全部内容。

(2)加德纳的8种智力

加德纳确定了涵盖人类经验范围的许多智力。每一种能力依据某一社会对它的需要、奖赏以及它对社会的作用,在不同的人类社会中的价值也不同。归纳了8种智力。

加德纳的8种智力

* 逻辑——数学

* 语言

* 功能主义

* 音乐

* 空间

* 身体运动

* 人际间(社交 )

* 内心的(自知)

加德纳的智力理论认为,应该对个体在许多生活情境下的行为进行观察和评价,并将传统的智力测验视为生活的一个很小的缩影。

情绪智力(emotional intelligence)可定义为4个主要成分。

* 准确和适当地知觉、评价和表达情感的能力。

* 运用情感、促进思考的能力。

* 理解和分析情感、有效地运用情感知识的能力。

* 调节情绪,以促进情感和智力发展的能力。

EQ分——情商,对情感的理解是EQ的一种表现。

测定EQ:要求被试对一系列情感问题,提出解决办法。

四、智力的政治

1、 组间比较的历史

高达德帮助开创了宣称一些有色人种先天低等的不幸传统。

2、遗传与IQ

某一特质的遗传性评价,是指基于这一特质的得分可归因于遗传因素的变异比例。

遗传性随年龄而增长;在4~6岁时遗传性为40%,到了成年为60%,到了老年为80%!

很可能基因的规划使得环境促进了我们的基因特质,因而使遗传性变大。

遗传性是对于一个组内的估计,它不能用于对组间比较的解释,不论在客观测验中的组间差异有多大。遗传估计只与给定的个体人群的平均值相关。即使有高的遗传性估计,我们也不能确定与个体IQ或是组的IQ值相关的特定基因的贡献。

一般来说,不同种族基因的组间差别,比同一组内不同个体的基因差别要小。社会判断并不依据生物的真实性,只是将皮肤颜色或血液作为种族融合的指标

母亲对孩子智力的社会化贡献大于父亲。

3、环境与IQ

家庭的社会经济状况和母亲的教育水平。

富裕和贫穷能够影响智力能力,其中对健康和教育资源的影响是最明显的。孕期健康状况不好和出生时低体重,对于孩子的心理能力低下是较强的预测因子。

单亲家庭,会使他们没有时间和精力陪孩子们玩,这会对标准IQ测验中的操作造成负面影响。

生活在贫穷条件下的人们是受歧视的,这种社会耻辱会对个体的自我完善起负面影响。

造成IQ差异的并不是种族,而是在我们的社会和大多数国家中,与种族有关的经济、健康和教育资源。

IQ受环境影响;但丰富的环境要保持(美国领先计划研究)。

4、文化与IQ测验的有效性

对IQ测验的一个普遍的考虑是,它们对不同文化的人们具有某些偏见。

这种IQ测量对于少数民族而言是无效而不公平的。但是,即使测验能够做到更为“文化公平”,仍存在种族间的差别。

测验中的成绩受刻板印象威胁(stereotype threat,又称为定势攻击,stereotype vulnerability)的影响,即某一组人冒着受负性定势影响的威胁。在情境中受到刻板印象威胁影响的人表现会较差。

当黑人学生相信实验成绩可以用来检验他们的智力时,他们做得较差。

测验的情境要比测验的内容存在更多的问题。重要的是测验实施者如何定义情境。人们相信测验可以测量智力时,定势的知识才会影响表现成绩。

五、创造力

创造力(creativity)是指就特定环境而言,个体产生新异的和合适的思想和产品的能力。

1、评价创造力及其与智力的关系

发散思维(pergent thinking),即对于一个问题可以产生许多不寻常的想法的能力。

发散思维测验与IQ测验的关系:相关性很小或中等;如高于120,则其相关程度下降。原因可能是一定水平的智力会使人有机会进行创造,但人们通常不利用他或她自己的这种机会。

当评判创造力的等级时,其一致性相当高,人们可以被可靠地确定为训创造力者或低创造力者。

2、特殊创造力与疯狂

霍华德·加德纳创造力的人的生活肖像,他把她叫做E.C.:

E.C.发现她对某未知一领域的问题有特殊的兴趣,这是一个极度兴奋的时刻。在这一点上E.C.与她的同辈们无法交 流,她必须独自工作。她感到自己正在突破的边缘,虽然她对此还不甚了解。奇怪的是,在这个关键时刻,E.C.渴望认知和情感上的支持,从而使她可以保持她的方向。没有这些支持,她可能会深刻地体会到某种形式的崩溃。

加德纳暗指了一种非常普遍的对创造者的定势:他们生活在疯狂的边缘,或包括对疯狂的体验。

个体会乘着癫狂的波浪进行大量的工作。如果这个人有一定的天赋,他的一些工作,并不是全部,就会很出色,但其比率并不比艺术家在其他时候创作的出色作品的比率更高。创造力和疯狂之间的关系很小。

有关特殊创造力的叙述中学到冒险的模式,高创造力的个体愿意走入“未知的领域”准备模式;高创造力的人通常会在他们希望有所成就的领域中花费很多年来获得专业知识内在动机的模式;高创造力的个体从事他们的工作,是因为他们能从创造的事物中得到快乐和满足。

六、测量与社会

争论的焦点是三个与伦理有关的方面:

* 基于测验的决定的公平性:对某些测验者而言,其代价或负性后果要高于其他人。

* 测量用于教育评价的可行性:测验不只是帮助评价学生,它在教育塑造上也起一定的作用。

以测验分数进行个体分类的寓意:测验结果作为不可改变的标签的状况。

查看更多