版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、因子分析的基本概念和步驟因子分析的基本概念和步驟一、因子分析的意義一、因子分析的意義在研究實際問題時往往希望盡可能多地收集相關變量,以期望能對問題有比較全面、完整的把握和認識。例如,對高等學??蒲袪顩r的評價研究,可能會搜集諸如投入科研活動的人數(shù)、立項課題數(shù)、項目經費、經費支出、結項課題數(shù)、發(fā)表論文數(shù)、發(fā)表專著數(shù)、獲得獎勵數(shù)等多項指標;再例如,學生綜合評價研究中,可能會搜集諸如基礎課成績、專業(yè)基礎課成績、專業(yè)課成績、體育等各類課程的成績以
2、及累計獲得各項獎學金的次數(shù)等。雖然收集這些數(shù)據(jù)需要投入許多精力,雖然它們能夠較為全面精確地描述事物,但在實際數(shù)據(jù)建模時,這些變量未必能真正發(fā)揮預期的作用,“投入”和“產出”并非呈合理的正比,反而會給統(tǒng)計分析帶來很多問題,可以表現(xiàn)在:?計算量的問題由于收集的變量較多,如果這些變量都參與數(shù)據(jù)建模,無疑會增加分析過程中的計算工作量。雖然,現(xiàn)在的計算技術已得到了迅猛發(fā)展,但高維變量和海量數(shù)據(jù)仍是不容忽視的。?變量間的相關性問題收集到的諸多變量之
3、間通常都會存在或多或少的相關性。例如,高校科研狀況評價中的立項課題數(shù)與項目經費、經費支出等之間會存在較高的相關性;學生綜合評價研究中的專業(yè)基礎課成績與專業(yè)課成績、獲獎學金次數(shù)等之間也會存在較高的相關性。而變量之間信息的高度重疊和高度相關會給統(tǒng)計方法的應用帶來許多障礙。例如,多元線性回歸分析中,如果眾多解釋變量之間存在較強的相關性,即存在高度的多重共線性,那么會給回歸方程的參數(shù)估計帶來許多麻煩,致使回歸方程參數(shù)不準確甚至模型不可用等。類似
4、的問題還有很多。為了解決這些問題,最簡單和最直接的解決方案是削減變量的個數(shù),但這必然又會導致信息丟失和信息不完整等問題的產生。為此,人們希望探索一種更為有效的解決方法,它既能大大減少參與數(shù)據(jù)建模的變量個數(shù),同時也不會造成信息的大量丟失。因子分析正式這樣一種能夠有效降低變量維數(shù),并已得到廣泛應用的分析方法。因子分析的概念起源于20世紀初KarlPearson和lesSpearmen等人關于智力測驗的統(tǒng)計分析。目前,因子分析已成功應用于心理
5、學、醫(yī)學、氣象、地址、經濟學等領域,并因此促進了理論的不斷豐富和完善。因子分析以最少的信息丟失為前提,將眾多的原有變量綜合成較少幾個綜合指標,名為因子。通常,因子有以下幾個特點:?因子個數(shù)遠遠少于原有變量的個數(shù)原有變量綜合成少數(shù)幾個因子之后,因子將可以替代原有變量參與數(shù)據(jù)建模,這將大大減少分析過程中的計算工作量。?因子能夠反映原有變量的絕大部分信息因子并不是原有變量的簡單取舍,而是原有變量重組后的結果,因此不會造成原有變量信息的大量丟失
6、,并能夠代表原有變量的絕大部分信息。?因子之間的線性關系并不顯著由原有變量重組出來的因子之間的線性關系較弱,因子參與數(shù)據(jù)建模能夠有效地解決變量多重共線性等給分析應用帶來的諸多問題。?因子具有命名解釋性通常,因子分析產生的因子能夠通過各種方式最終獲得命名解釋性。因子的命名解所謂的因子載荷就是因素結構中,原始變量與因素分析時抽取出共同因素的相關??梢宰C明,在因子不相關的前提下,因子載荷是變量和因子的相關系數(shù),反映jiajZiF了變量與因子的
7、相關程度。因子載荷值小于等于1,絕對值越接近1,表明因子jZiFjia與變量的相關性越強。同時,因子載荷也反映了因子對解釋變量的重要作iFjZjiaiFjZ用和程度。因子載荷作為因子分析模型中的重要統(tǒng)計量,表明了原始變量和共同因子之間的相關關系。因素分析的理想情況,在于個別因素負荷量不是很大就是很小,這jia樣每個變量才能與較少的共同因素產生密切關聯(lián),如果想要以最少的共同因素數(shù)來解釋變量間的關系程度,則彼此間或與共同因素間就不能有關聯(lián)存
8、在。一般說來,負荷jU量為0.3或更大被認為有意義。所以,當要判斷一個因子的意義時,需要查看哪些變量的負荷達到了0.3或0.3以上。?變量共同度(共同性,Communality)變量共同度也就是變量方差,就是指每個原始變量在每個共同因子的負荷量的平方和,也就是指原始變量方差中由共同因子所決定的比率。變量的方差由共同因子和唯一因子組成。共同性表明了原始變量方差中能被共同因子解釋的部分,共同性越大,變量能被因子說明的程度越高,即因子可解釋該
9、變量的方差越多。共同性的意義在于說明如果用共同因子替代原始變量后,原始變量的信息被保留的程度。因子分析通過簡化相關矩陣,提取可解釋相關的少數(shù)因子。一個因子解釋的是相關矩陣中的方差,而解釋方差的大小稱為因子的特征值。一個因子的特征值等于所有變量在該因子上的負荷值的平方總和。變量的共同度的數(shù)學定義為:,該式表明變量的共同度是因jZ2h???mijiah122jZ子載荷矩陣A中第j行元素的平方和。由于變量的方差可以表示成,因此jZ122??u
10、h變量的方差可由兩個部分解釋:第一部分為共同度,是全部因子對變量方差解jZ2hjZ釋說明的比例,體現(xiàn)了因子全體對變量的解釋貢獻程度。變量共同度越接近1,說jZ2h明因子全體解釋說明了變量的較大部分方差,如果用因子全體刻畫變量,則變量jZjZ的信息丟失較少;第二部分為特殊因子U的平方,反應了變量方差中不能由因子jZjZ全體解釋說明的比例,越小則說明變量的信息丟失越少。2ujZ總之,變量d共同度刻畫了因子全體對變量信息解釋的程度,是評價變量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- spss因子分析案例
- 探索性因子分析法
- 因子分析法基本原理
- sfa方法和因子分析法綜述
- [教育]因子分析-spss操作及其原理
- 轉型軟件企業(yè)財務研究——因子分析法
- 卡爾曼濾波法、因子分析法、遺傳算法.pdf
- spss探索性因子分析的過程
- spss因子分析和主成分分析論文
- 基于因子分析法的區(qū)域物流績效研究.pdf
- 基于因子分析法的我國流通效率測度.pdf
- 基于因子分析法和聚類分析法評價中國各省市綜合經濟實力
- 多元統(tǒng)計分析中的因子分析法的應用
- 基于因子分析法的上市公司經營績效實證分析
- 基于因子分析法的安康城市空間績效評價
- 基于因子分析法的shibor基準利率屬性研究
- 基于因子分析法的上市公司并購績效研究
- 基于因子分析法的上市公司并購績效研究
- 因子分析法在煤礦安全管理中的應用
- spss探索性因子分析報告地過程
評論
0/150
提交評論