創(chuàng)造力合意(共識)評量技術_第1頁
已閱讀1頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、創(chuàng)造力合意(共識)評量技術,導讀者:張世彗教授臺北市立教育大學特殊教育學系,發(fā)展「合意評量技術」(Consensual Assessment Technique, CAT)的主因,在於創(chuàng)造力的共識定義、作者對創(chuàng)造力本質的假定、及對創(chuàng)造力社會心理學適當方法的要求。,選擇適當任務應符合三項要求:,1.評量內容須能形成產(chǎn)品或可觀察的反應,適合評量;2.評量內容應是開放的,能引發(fā)很多變通和新奇性的反應;3.評量內容是令人滿意的,在基線表

2、現(xiàn)上不會產(chǎn)生很大的個別差異,且評量內容不需過分依賴某種特定技巧。,「合意評量技術」在評量程序上有很多要求a:,1.評判者應具備該領域經(jīng)驗,但不需一致。2.讓評判者獨立自主做評量3.相互比較作品,而非依絕對標準來評定4.隨機鑑賞作品和不同判斷層面,合意評量技術」在評量程序上有很多要求b:,5.除評量創(chuàng)造力外,應同時評量其它層面,至少應評量作品的技術性,也包括「美感評量」。然後,就可用來決定主觀評量產(chǎn)品的創(chuàng)造力是否與這些層面有關。,評

3、量程序最重要的標準為:,「評定是可信的」。就定義言,評定者間的信度等同「建構效度」。,藝術創(chuàng)造力的合意評量,為充分瞭解此項技術是否能有效評量創(chuàng)造力作者實施了運用這種技術來評量藝術和語文創(chuàng)造力的研究方案。,研究1:兒童的藝術的創(chuàng)造力a,1.對象和評判者22位女生,年齡為7-11歲。所有女生都採隨機分派。15位女生在一組;7位在另一組。所有女生均來自低社經(jīng)家庭。採用「心理學家」;「藝術類科教師」;「藝術家」。,研究1:兒童的藝術的創(chuàng)造

4、力b,2.材料所有對象使用材料均相同:「有幾種不同大小、形狀和顏色的紙100張以上、膠水1罐、卡紙板1張」。,研究1:兒童的藝術的創(chuàng)造力c,3.程序a都使用長桌,每位有份材料。實驗者負責說明,首先要求製作1項藝術設計減少對她們製作藝術設計表現(xiàn)的期望。然後,示範運用膠水將形狀黏到紙上的方法,接著讓兒童練習。並告訴她們可隨意運用所提供的材料,製作藝術設計。,研究1:兒童的藝術的創(chuàng)造力d,3.程序b18分鐘後,要求兒童停止。告訴評

5、判者兒童在18分鐘內完成。讓每位評判者獨立評量,使用主觀的創(chuàng)造力定義,依創(chuàng)意層次(非常具創(chuàng)意、有創(chuàng)意、無法決定、相當沒創(chuàng)意、非常沒創(chuàng)意)來評定。,研究1:兒童的藝術的創(chuàng)造力e,3.程序c用幻燈片將22張設計呈現(xiàn)給藝術類科教師,要求他們用同樣方式獨立評量。藝術家則花4小時,依不同層面判斷這22項設計。就像其他兩組評判者一樣,要求在評定前先檢查所有設計,然後依23項不同層面來評鑑,並在評定表上提供每項層次的定義。,研究1:兒童的藝術的

6、創(chuàng)造力f,3.程序d提供藝術家量表進行每項判斷,採5點量表方式,讓評判者在量表上依每項判斷以「×」表示並鼓勵他們利用量表的全部範圍,在22項層面中的4項(創(chuàng)造力、技術優(yōu)點、愛好及天真),要求評判者做高中低的判斷。,研究1:兒童的藝術的創(chuàng)造力g,3.程序e將這些隨機安排的設計提供給每位評判者,每個層面也是隨機來判斷。事先對評判者描述評定、等級順序及類別分組任務,然後提供評判者充裕時間,協(xié)助他們完成過程中,實驗者與評判者

7、一起,檢查判斷是否依合理順序進行,是否符合時間限制。,研究1:兒童的藝術的創(chuàng)造力h,4.研究結果藝術家所評判的信度。23個層面中有16個信度在.70以上,10個在.80以上其他兩組評判者間一致性也相當高。12位心理學家的創(chuàng)造力等級信度為.73;21位教師的創(chuàng)造力評定信度為.88。上述分析可見,不同組別之評判者在創(chuàng)造力評量間有良好相關。,最後,,兒童年齡與任何三組對創(chuàng)造力的評判沒顯著相關雖然它與藝術家-評判者所評定技術性有相關。

8、藝術創(chuàng)造力的進一步研究(研究2-13),語文創(chuàng)造力的合意評量a,研究14:運用詩的初期探究,語文創(chuàng)造力的合意評量b,1.對象和評判者以48位美國布蘭帝(Brandeis)大學心理學導論的女生為對象評判者:一是大學英文系研究生;另一為10位麻州詩人,大都是哈佛大學英文所學生,有些未上過大學。他們的詩都曾出版過。,語文創(chuàng)造力的合意評量c,2.程序a提供每位對象20分鐘獨自寫美國五行詩。初步指導後,提供受試者兩篇美國五行詩的例子。同

9、時提供受試者詩的第一行:「快樂」,以降低變異性,並讓評判任務更容易,語文創(chuàng)造力的合意評量d,2.程序b因評判內容包含閱讀,評判者可獨自工作,但不可討論詩或評判任務,直到活動完成評判者先閱讀指示,然後被告知對象有20分鐘寫詩。評判前,要求評判者讀完所有詩的複本,然後依主觀的創(chuàng)造力定義來評定,並要求相互比較,而不是依絕對標準評定。評定量表,類似先前,其中有3個被標記為低、中、高,語文創(chuàng)造力的合意評量e,3.結果所有評判者間信度是相當

10、高的。第一組創(chuàng)造力評判信度為.87;第二組創(chuàng)造力評判信度為.90。14項信度中有13項為.70以上,9項在.80以上。語文創(chuàng)造力的進一步研究(15-21),總結主要的發(fā)現(xiàn)a,這些研究是設計來測試一種在不同領域主觀評量創(chuàng)造力的可靠方法。這種方法是成功的,具下列優(yōu)點A:1.運用主觀評量創(chuàng)造力來獲得高一致性是可能的,即使評判者未受過任何一致性的方法訓練,這種方法是成功的,具下列優(yōu)點B,2.評判者在創(chuàng)造力評定的一致性可能取決於評判者間所需努

11、力量的某種程度。因此,一旦評判任務是特別高要求的,就可預期會產(chǎn)生評判疲乏和難維持一致的標準。在此種情況下,增加評判者人數(shù)會是明智的。,這種方法是成功的,具下列優(yōu)點C,3.針對這些任務,評判者的專業(yè)水準似乎沒有那麼要緊。4.藝術作品的創(chuàng)造力、美感及技術性優(yōu)劣可分割來主觀評判。5.向人描述何謂創(chuàng)造力可能很難,但仍很相當容易且有良好信度的確認創(chuàng)造力。,這種方法是成功的,具下列優(yōu)點D,6.研究說明合意評量技術可用於廣泛領域上不同種類的任務

12、。7.創(chuàng)造力評量任務並不全依賴某人可能發(fā)展較好的特殊技巧。就創(chuàng)造力社會心理學來看,這特別重要。,與先前技術的比較a,1.合意評量技術可視為傳統(tǒng)創(chuàng)造力測驗所用技術的概念逆轉。2.這種技術似乎比許多創(chuàng)造力測驗更具生態(tài)效度(ecological validity)。不僅任務模擬真實的成就表現(xiàn),評量技術也模擬真實世界創(chuàng)造作品的評鑑,與先前技術的比較b,3.有些先前使用主觀評量方法的研究與合意評量技術相似。事實上也獲得類似研究結果,但仍有差

13、異。,限制與未來可能性a,合意評量技術有些限制a:1.此法不實用,相當耗時;2.所選任務不能過度依賴特別能力和經(jīng)驗相關技巧,對確認創(chuàng)造力上持續(xù)的個別差異可能就不是有用的方法;,限制與未來可能性b,合意評量技術有些限制b3.此法可能難用於未知領域的成果(如科學革命性理論)4.此法獲致的評判信度會受歷史時期與位置所限。雖然我的初步研究植基於合意評量技術,不過仍需精鍊和延伸,最新情況a,Amabile等人持續(xù)使用1983年版的創(chuàng)造力

14、合意評量技術進行研究,發(fā)現(xiàn)它是有價值的方法。1996版與先前版本引用情形相同,都是依受試在真實世界常出現(xiàn)領域所做的真實作品。,最新情況b:計算信度的新方法 a,Amabile等人原先計算主觀創(chuàng)造力評量的評判者間信度方法有2種,都可產(chǎn)生類似結果。不過,由於α係數(shù)簡便,因而大都採用SPSS / PC計算α係數(shù)來評估評判者間信度。,最新情況c:計算信度的新方法 b,最近,Amabile等人基於合意評量目的,認為將評判者

15、考量為隨機效果可能較佳(原先假定是固定效果),若根據(jù)「類別間的相關方法」(intraclass correlation)來評估評判者間的信度,就可符合此項假定。實際上,這種方法常產(chǎn)生類似α係數(shù)的結果。,新的信度研究資料,1983年版描述兩項創(chuàng)造力評量內容(美術拼貼和五行詩)的信度。Amabile等人常使用這些評量內容,且?guī)缀蹩色@良好信度。1983年後,Amabile等人又創(chuàng)造許多新評量內容。可分成三組:語文創(chuàng)造力(故事和其他詩);

16、藝術創(chuàng)造力(線畫、繪畫、各種藝術媒體等問題解決創(chuàng)造力(電腦、新高科技服務的方案)。此外,研究對象也擴大了。,合意評量技術的改變與課題,一.誰是適當?shù)脑u判者?1983年前,我們斷定適當評判者是熟悉產(chǎn)品領域的人現(xiàn)在相信多數(shù)領域的作品,評判者不需是專家。不過,至少應有些評量內容上的訓練或經(jīng)驗,如果是多數(shù)人不精通的評量內容,這個原則就更重要了。,二.任務必要的特徵為何?a,這類評量內容的特性與先前描述相同。不過,先前建議特色之一:「評量

17、內容不應過於依賴任何特定技巧」,現(xiàn)在需作些修正。因這項建議主要是針對以社會心理學為「自變項」。就範圍言,如果成就表現(xiàn)上的個別差異是來自原有能力的高低,就會使偵測社會心理學的效果變得更困難。,二.任務必要的特徵為何?b,不過,在3種條件下是可接受的,甚至建議使用依賴特殊能力的任務:1.所有受試在領域上有同樣專業(yè)程度2.如果想研究「能力」對作品創(chuàng)造力的貢獻3.自變項為社會心理學因素,但使用重複量數(shù)的設計。,三.程序的要素是什麼?a,

18、先前認為如訓練評判者創(chuàng)造力評定,評判者間信度將受到質疑。因而,建議不要給評判者特定的創(chuàng)造力定義,僅要求評判者使用主觀的創(chuàng)造力定義,來評定每項作品相較於其他作品的創(chuàng)意。,三.程序的要素是什麼?b,目前相信在多數(shù)情境仍是如此,不過可能有特殊狀況(如評估商品技術性發(fā)展的創(chuàng)造力)。另外,先前要求所有評判者應評定所有作品,是為確保所有作品相互比較,以簡化信度計算,惟有時是無法做到的。在此情況下,只有使用「類別間的相關」來計算評判者間信度。,三

19、.程序的要素是什麼?e,最後,評定作品其他層面之前,評判者應在1個層面評定所有作品。這樣作法是要讓評判者針對特定層面主觀標準上維持一致的方法,避免與不同層面產(chǎn)生混淆。惟這種方法在某些情境是不實際。如,有項研究100篇長篇散文且須評3個層面,四、受試者內作品的評量,1983年前,我們並未進行每位受試者超過一項作品的研究。就社會心理學與其它研究來說,使用「重覆量數(shù)設計」通常是有利的,或許最重要的原因是可更大範圍的了解個別作品的創(chuàng)造力,而非

20、僅從單一角度。我們認為「合意評量技巧」也可用來進行受試者內與受試者間的創(chuàng)造力評量。,五.創(chuàng)造力是種分離的品質嗎?,1983年版,獲得創(chuàng)造力評定與技術性或美感評定是無關的或僅有低相關是可能的。雖然分離創(chuàng)造力和其它成果品質是可能的,不過實務上創(chuàng)造力常與其它品質相關。,六.CAT可用於個別差異的評量嗎?,從近來研究中,發(fā)現(xiàn)CAT可用於社會心理及個別差異的創(chuàng)造力研究。七.創(chuàng)造力的性別差異有時會發(fā)現(xiàn)性別差異,通常是兒童。惟此種性別差異在我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論