

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、大學體育統(tǒng)計學,第一章 緒論,第一節(jié) 體育統(tǒng)計及其研究對象,統(tǒng)計的作用,客觀事物的特征,,質的特征,量的特征,,統(tǒng)計活動,研,究,▲ 統(tǒng)計的分類(從性質上),(一) 描述性統(tǒng)計 對事物的特征與狀態(tài)進行數量描述,,身高=226 cm 體重=141 kg,百米速度=15 s 投籃命中率=52%,……,(二) 推斷性統(tǒng)計 通過樣本數量特征估計推斷總體特征,,抽,樣,總體平均成績是14.6秒嗎,體育統(tǒng)計的概念體育
2、統(tǒng)計是運用數理統(tǒng)計的原理和方法對體育領域里各種隨機現象規(guī)律性進行研究的一門基礎應用學科。屬于方法論學科范疇。理解:1:用普遍的方法研究特殊領域的問題。2:無論描述統(tǒng)計還是推斷統(tǒng)計,都服務于對隨機現象規(guī)律性的研究。,▲ 統(tǒng)計工作的基本過程,統(tǒng)計資料的搜集,統(tǒng)計資料的整理,統(tǒng)計資料的分析,,,統(tǒng)計資料的搜集:(基礎環(huán)節(jié))——根據研究設計的要求獲取有關數據資料。統(tǒng)計資料的整理:(中間環(huán)節(jié))——按照分析的要求對數據資料進行審核和
3、分類。統(tǒng)計資料的分析:(決定性階段)——按照研究目的對整理后的數據進行統(tǒng)計學處理。,▲ 統(tǒng)計工作的基本過程,▲ 體育統(tǒng)計的研究對象及其特征,研究對象:(1)體育領域里的各種可量化的隨機現象。(2)非體育領域里對體育發(fā)展有關的各種隨機現象。,研究范圍逐漸擴大了!,▲ 體育統(tǒng)計研究對象的特征,運動性特征:——反映運動能力心理能力等方面的數量指標是具有 運動性特征的。(1,與運動有關;2,是動態(tài)的)綜合性特征:
4、——兼有自然科學和社會科學的綜合屬性??陀^性特征:——數據來源于客觀事物本身,是對客觀事物的反映。,第二節(jié) 體育統(tǒng)計在體育活動中的作用,是體育教育科研活動的基礎有助于訓練工作的科學化能幫助研究者制定研究設計能幫助研究者有效地獲取文獻資料,總體與個體1,總體的概念:根據統(tǒng)計研究的具體研究目的而確定的同質對象的全體。2,個體的概念:組成總體的每個基本單位。3,總體的分類:,第三節(jié) 體育統(tǒng)計中的若干基本概念,總體,,現存總體,
5、假想總體,,有限總體,無限總體,有限總體:基本研究單位的邊界是明晰的,并且基本研究單位的數量是有限的總體。無限總體:基本研究單位的數量是無限多個的總體。,樣本1,樣本的概念:——根據研究需要與可能,從總體中抽取的部 分研究對象所形成的子集為樣本。2,樣本的分類:隨機樣本和非隨機樣本,樣本,,隨機樣本,非隨機樣本,采用隨機抽樣方法獲得的樣本,,,研究者根據研究需要,制定某些條件獲得的帶非隨機性質的樣本,必然事件和隨機事件
6、1,必然事件:在確定的條件范圍內,必然發(fā)生 (或不發(fā)生)的事件。 (具備可預言性)2,隨機事件:在一定的實驗條件下,有可能發(fā)生,也有可能不發(fā)生的事件。(具備不可預言性,只能猜)隨機變量1,隨機變量:隨機事件的數量表現。,隨機變量,,連續(xù)型隨機變量,離散型隨機變量,至少理論上可以窮舉,不能窮舉,總體參數和樣本統(tǒng)計量1,總體參數:反映總體數量特征的指標。2,樣本統(tǒng)計量:反映樣本數量特征的指標。概率1,古典概率:適用于總體
7、明晰的情況下。2:統(tǒng)計概率:適用于總體狀況不明的情況下。,▲ 補充內容:連加和的縮寫式,★ 在高等數學中,采用連加求和縮寫式形式來表示連加求和數,它的一般形式為: 其中:∑連加求和號 變量(一組觀測數據)在 中, i 是下標,n 是上標 , i 、n 表示連加求和的界限,即從通項公式具體分解的第一項開始相加一直到第n項為止。各具體項根據 i 的取值不同而有所不同,i
8、取1為第一項,取“n”為第n項。,,體育中常用的連加求和運算:,,,為了避免符號過于復雜,今后凡在求和范圍可以看清的條件下,通常將∑號上下標省略不寫,簡記為,▲ 補充內容:連加和的縮寫式,課堂練習:展開連加和縮寫式,體育統(tǒng)計學,第二章 統(tǒng)計資料的收集與整理,▲ 收集資料的基本要求 1:資料的準確性 2:資料的齊同性 3:資料的隨機性 ▲ 收集資料的基
9、本方法 1:日常積累 2:全面普查 3:專題研究,第一節(jié) 統(tǒng)計資料的收集,▲ 幾種常用的抽樣方法,簡單隨機抽樣(完全隨機抽樣)抽取特點:1:不分組,不分類,不排隊地抽取; 2:總體中每個個體都有被抽中的機會; 3:總體中每個個體被抽中的機會是均等的。抽取方法:1:抽簽法
10、 2:隨機數表法(見隨機數表)該方法的優(yōu)點:樣本代表性好該方法的缺點:總體含量大時,編號困難。工作量大。,▲ 幾種常用的抽樣方法,分層抽樣抽取步驟方法:1:按屬性特征分成若干類型、部分或層;2:在類型、部分或層中按照比例進行簡單隨機抽樣。分層的需注意的問題:1:層間必須有清晰的界面;(類間差異大,類內差異?。?:必須知道各類型中的個體數目和比例;3:層的數目不宜太多,但也不要極少。分層抽樣的優(yōu)點:1:
11、能夠提高樣本代表性,又不至于給調查工作帶來麻煩,在代表性和工作量之間做出了平衡;2:適用于總體情況復雜、個體數目較多的情況。,分層抽樣范例,某大學體育系大一新生總體人數合計900人,田徑350人,籃球200人,足球150人,網球100人,體操80人,游泳20人,,分,層,,,,,,,田徑35人,籃球20人,足球15人,網球10人,體操8人,游泳2人,按照10%比例簡單隨機抽樣,,研究樣本含量為90人,按照學生專項屬性分
12、層,,繼續(xù)下一步的研究過程,▲ 幾種常用的抽樣方法,整群抽樣整群抽樣的特點:區(qū)別于簡單隨機抽樣和分層抽樣,抽樣的單位不再是總體中的個體,是總體中的劃分出來的群。劃分群應注意的問題: 群間差異要小,群內差異要大。討論: 調查廣東省初中畢業(yè)生體質達標的情況。如何抽樣?,第二節(jié) 統(tǒng)計資料的整理,▲ 資料的審核1:初審——簡單排誤2:邏輯檢查——專業(yè)知識、常識,指標關系間排誤3:復核——按比例抽樣復核,▲ 頻數整理
13、——頻數分布表的制作,頻數分布表的編制(實例),,【例】某小學五年級學生跳繩成績如下(單位:個/分鐘)。對數據進行分組。,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 1
14、27 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,分組方法,單變量值分組,1. 將一個變量值作為一組2. 適合于離散變量3. 適合于變量值較少的情況,單變量值分組表,組距分組,將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等
15、距分組,組距分組的步驟(等距分組),求全距(極差)R:R=最大值-最小值確定組數:組數的確定應以能夠顯示數據的分布特征和規(guī)律為目的。在實際分組時,可以按 Sturges 提出的經驗公式來確定組數K確定組距I:組距(Class Width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即:組距=( 最大值-最小值)÷ 組數 (k)確定組限 (組限:是指每組的起點值與終點值),5. 根據分組整理
16、成頻數分布表 ★ 填寫組限 按照從上到下、從小到大的順序填寫,只寫下限,不寫上限 ★ 劃記 將數據逐個劃記到相應的組中,五個為一組 ★ 計算:頻數(f);頻率;組中值( 組中值=該組下限 + 組距/2 ),組距分組涉及的幾個概念,1. 下 限:一個組的最小值2. 上 限:一個組的最大值3. 組 距:上限與下限之差4. 組中值:下限與上限之間的中點值,課堂練習,117 122 124 12
17、9 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 1
18、24 121,【例】某小學五年級學生跳繩成績如下(單位:個/分鐘)。對數據進行分組。,,1.求全距(極差)R: R=最大值(Xmax) 139-最小值(Xmin) 107 =322.確定組數:3.確定組距: 組距=( 最大值139 - 最小值107)÷ 組數7 ≈5,=1 + 1.70/0.30=6.667≈7,4.確定組限: 第一組下限(L1)=最小值(Xmin) - 組距(I)/2
19、 =107 -5 /2 =104.5≈105 其他組組限的確定:從第一組開始,每一組的下限加上組距,就得到該組的上限,此上限又是下一組的下限,于是就形成了一列左閉右開的半開區(qū)間5.根據分組整理成頻數分布表:(略,參照書P17-P18),需要說明的幾個問題,關于組數的確定: 1:可以依據已有的成熟的專業(yè)經驗來確定; 2:可參考前蘇聯專家制定的參考表(如右表)確定: 關于圖形的繪制:可以
20、繪制直觀的圖形來方便了解數據的信息。較常使用的圖形形式有多邊形圖和直方圖等。圖形中,一般橫坐標代表組限,縱坐標代表頻數。,《作業(yè)》,1.每人準備一本固定的作業(yè)本。2.教材P19第二章習題第4題,按照步驟與格式制作頻數分布表及其直方圖。,體育統(tǒng)計學,第三章 樣本特征數,第一節(jié) 集中位置量數,數據的分布特征及其測量指標,集中趨勢(Central tendency),一組數據向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數據一般水平
21、的代表值或中心值不同類型的數據用不同的集中趨勢測度值低層次數據的集中趨勢指標值適用于高層次的測量數據,反過來,高層次數據的集中趨勢指標值并不適用于低層次的測量數據選用哪一個測度值來反映數據的集中趨勢,要根據所掌握的數據的類型來確定,中位數 (Median),中位數,又稱中數,中點數。 符號Md (Median),定義:是指位于一組數據中較大一半與較小一半中間位置的那個數。,中位數 (Median),特征:此數可能是數據中的某
22、一個,也可能根本不是原有的數據。不受極端值的影響計算方法:將數據依大小次序排列,若數據個數為奇數,則取數列中間的那個數為中數;若數據個數為偶數,則取中間兩個數的平均數為中數。,概念:樣本觀測值在頻數分布表中頻數最多的那一組的組中值。(分組數據的眾數,屬于引申概念)原始概念:眾數,符號Mo,它指在一組數中出現次數最多的那個數。計算方法是直接找到出現次數最多的那個數。眾數具有不唯一性。例如:,眾數 (Mode),無眾數原始數據:
23、 10 5 9 12 6 8,一個眾數原始數據: 6 5 9 8 5 5,多于一個眾數原始數據: 25 28 28 36 42 42,分組數據中眾數的計算,頻數最多的那一組的組中值。如書P21-P22:練習:找找眾數,利用上次所做的作業(yè)。,幾何平均數,概念:樣本觀測值的連乘積,并以樣本觀測值的總數作為次數,開方所得的數據。主要適用于一組數據中有少量數據偏大或偏小,數據分布
24、呈偏態(tài)。計算公式:舉例說明:1,2,3,4,8,16,42,108見教材P22,例題3.4,算術平均數,算術平均數簡稱為平均數或均值,符號為M(Mean)總體算術平均數:希臘字母μ (音:miu)樣本算術平均數:英文字母 (音:X bar)。算術平均數是由所有數據之和除以數據個數所得的商數,用公式表示為:,算術平均數在應用上有如下特點:①算術平均數是一個良好的集中量數,具有反應靈敏、確定嚴密、簡明易解、計算簡單
25、、適合進一步演算和較小受抽樣變化的影響等優(yōu)點。②算術平均數易受極端數據的影響,這是因為平均數反應靈敏,每個數據的或大或小的變化都會影響到最終結果。,第二節(jié):離中趨勢量數,數據分布的另一個重要特征離中趨勢的各指標值是對數據離散程度所作的描述反映各變量值遠離其中心值的程度,因此也稱為離中趨勢從另一個側面說明了集中趨勢測度值的代表程度不同類型的數據有不同的離散程度測度值,全距(極差,兩極差),概念:一組數據最大值與最小值之差。公式
26、: R=最大值(Xmax) -最小值(Xmin)特征與缺陷:1:能夠了解數據的范圍(區(qū)域,區(qū)間)。2:只考慮極值,容易受到異常數據的影響,屬于粗略的指標值,精細程度不夠。,絕對差與平均差,絕對差:平均差;,方差和標準差,1:是離散程度的測量指標值之一,最常用。2:能反映數據的分布。3:能反映各變量值與均值的平均差異。4:根據總體數據計算的,稱為總體方差或標準差;根據樣本數據計算的,稱為樣本方差或標準差。,總
27、體方差和標準差的計算公式,總體方差的計算公式,總體標準差的計算公式,樣本方差和標準差,樣本方差的計算公式,樣本標準差的計算公式,自由度(degree of freedom),一組數據中可以自由取值的數據的個數當樣本數據的個數為 n 時,若樣本均值?x 確定后,只有n-1個數據可以自由取值,其中必有一個數據則不能自由取值例如,樣本有3個數值,即x1=2,x2=4,x3=9,則 ?x = 5。當 ?x = 5 確定后,x1,x2和x3有
28、兩個數據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量,平均數與標準差在體育中的應用,平均數與標準差在決策中的直接應用。變異系數在穩(wěn)定性研究中的應用。 法在原始數據邏輯審核中的應用。,,平均數與標準差在決策中的直接應用,例題:教練員要從兩名
29、標槍運動員中決定一人參加 比賽,如何作出決策? 隊員甲:40.50;41.26;40.44;39.62;40.12 42.10;39.84;40.18;38.70;39.54 隊員乙:40.48;42.88;40.50;39.50;38.00; 43.32;38.72;41.82;36.84;40.24簡單應用平局
30、數與標準差進行數據決策的步驟:1:確定樣本數據的全域。2:確定樣本數據的平均水平。3:確定樣本數據的離散程度。4:根據專業(yè)專項應用要求采取相應不同決策。注意:決策前提是認同所取得的數據是真實客觀有效的。,變異系數在穩(wěn)定性研究中的應用,例題:某運動員主項為100m跑,兼項為跳遠,在競技期內,其主、兼項目測試結果如下: 100m: s s 跳遠:
31、 m m 試比較該運動員主項、兼項成績的穩(wěn)定性。 (試比較該運動員100m跑、跳遠兩成績的離散程度。)解答:二者的指標單位不同且性質不同,不能夠直接進行比較。 依據變異系數的概念特征,可以計算CV進行比較:由于該運動員100m跑的CV<跳遠的CV,故該運動員的100m跑的成績比跳遠成績穩(wěn)定。(或說100m跑成績的離散程度小于
32、跳遠成績),例題:隨機抽取某市300名初中男生的身高,經檢驗基本服從正態(tài)分布,并得出 cm, cm,在這300名學生中,有三人的身高原始數據為 cm, cm, cm。試用 法檢查這三個數據是否為可疑數據。 法進行原始數據邏輯審核的步驟:1:求
33、 的下限和上限。2:數據檢驗,看數據是否存在 [ 下限,上限 ] 區(qū)間之內。3:作出初步判定 a:在區(qū)間之內,可以初步認定數據正常; b:在區(qū)間之外,需要進一步審核數據的準確性。,法在原始數據邏輯審核中的應用,《作業(yè)》,1.計算教材P19第二章習題第4題中樣本數據的所有集中量數指標和離散量數指標。2.教材P39第三章習題第2題。3.自習教材第三章與第四章未講到的內容。,體育統(tǒng)計學,第五章 正態(tài)分布,正
34、態(tài)分布的概念與性質,,,200個樣本數據的頻率分布直方圖,,,,,,總體密度曲線,無窮多個樣本數據的頻率分布直方圖,,正態(tài)分布的重要性,1.描述連續(xù)型隨機變量的最重要的分布2.可用于近似連續(xù)型的離散變量的分布3.經典統(tǒng)計推斷的基礎,概率密度函數,,f(x) :隨機變量 X 的頻數 ?? :總體方差 ? =3.14159; e = 2.71828x = 隨機變量的取值 (-? < x < ?)? = 總體
35、均值,正態(tài)分布函數的一些性質,概率密度函數在x 的上方,即f (x)>0正態(tài)曲線的最高點在均值?,它也是分布的中位數和眾數正態(tài)分布是一簇分布,每一特定正態(tài)分布通過均值?和標準差?來區(qū)分。 ?決定曲線的位置,稱為位置參數;?決定曲線的形狀,稱為形狀參數。曲線f(x)相對于均值?對稱,尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相交正態(tài)曲線下的總面積等于1,即概率值等于1隨機變量的概率由曲線下的面積給出,? 和? 對正態(tài)曲
36、線的影響,正態(tài)分布的概率,標準正態(tài)分布,,▲ 任何一個一般的正態(tài)分布,可通過下面的線性變換 轉化為標準正態(tài)分布,▲ 標準正態(tài)分布的概率密度函數,,標準正態(tài)分布,★ 標準正態(tài)分布的重要性,一般正態(tài)分布的不同取決于均值?和標準差 ?計算概率時 ,每一個一般正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無窮多的。若能將一般正態(tài)分布轉化為標準正態(tài)分布,計算概率時就只需查一張表(標準正態(tài)分布表)就可以了。,,先將一個一般正
37、態(tài)分布轉換為標準正態(tài)分布計算概率時,查標準正態(tài)概率分布表對于負的 x ,可由? (-x)??- ? ?x?得到對于標準正態(tài)分布,即X ~N(0,12),有P (a? X ?b)? ? ?b? ?? ?a?P (|X| ?a)? 2? ?a? ?1對于一般正態(tài)分布,即X ~N(? , ?2),有,標準正態(tài)分布表的使用,標準化的例子A(5,102),x,? =5,?=10,一般正態(tài)分布,,,6.2,,,P(5 ? X ? 6.
38、2),標準化的例子B(5,102),一般正態(tài)分布,P(2.9 ? X ? 7.1),正態(tài)分布(實例),【例】設U~N(0,12),求以下概率值: (1) P(U2); (3) P(-12)=1- P(U ?2)=1-0.9973=0.0227 (3) P(-1<U ?3)= P(U ?3)- P(U<-1) = ?(3)-
39、 ?(-1)= ?(3) – [1-?(1)] = 0.9987-(1-0.8413)=0.8354 (4) P(| U | ? 2) = P(-2? U? 2)= ?(2)- ?(-2) = ?(2)- [1-?(2)]=2 ?(2)- 1=0.9545,正態(tài)分布(實例
40、),【例】設X~N(5,32),求以下概率值 (1) P(X ?10) ; (2) P(2<X <10) 解: (1),(2),正態(tài)分布(實例),【例】設X~N(1,4),求P (0<X<1.6)解: X~N(1,4) X~N(1,22) 故, ? = 1, ? = 2 P (0<X&l
41、t;1.6),,正態(tài)分布理論在體育中的應用,主要應用方面:制定考核標準制定離差評價表進行人數估算在綜合評價中統(tǒng)一 變量單位,應用正態(tài)分布理論制定考核標準,制定考核標準的步驟:1:制作正態(tài)曲線的分布草圖。2:計算出從﹣∞ 到 ui值所圍成的面積概率。3:查表求得各等級的ui值。4:求得各等級標準的原始成績xi值。舉例說明(如書本例5.1),應用正態(tài)分布理論制定離差評價表,制定離差評價表的步驟:1:根據指標總數畫好框表
42、。2:將各個指標的平均數填入0標準差等級線與各個指標縱線的交叉處。3:計算1標準差,2標準差,3標準差的對應指標數值,并填入各級標準差等級線與各個指標縱線的交叉處。特別要注意計量的方向性(如:田徑中田賽與徑賽的計分區(qū)別)。4:依據指標成績基礎值和指標變化值畫出不同時期的變化圖線。5:注意離差等級的劃分標準合理制定。(參考標準有兩種)舉例說明(如書本例5.2),應用正態(tài)分布理論進行人數估算,應用正態(tài)分布理論進行人數估算的步驟
43、:1:作正態(tài)分布曲線的草圖,以確定估計范圍。2:求各個區(qū)間的ui 值。3:查表找到所估計范圍的面積概率。4:計算估計范圍的人數。舉例說明(如書本例5.3),在綜合評價中統(tǒng)一 變量單位,U分法:就是依據距離平均數有多少個標準差的距離來確定分數的方法。如果距離平均數在正方向有2個標準差的距離,則記為U分為2分。在負方向有2個標準差距離,則記為U分為-2分。直接用u值來評分。Z分法:是通過U分轉換成更加符合實際運用情況的分數計量
44、方法??梢赞D換為百分計分法,公式為:累計計分法:用于符合正態(tài)分布的前提下不等距升分的方法之一。其公式為:百分位數法:用于不符合正態(tài)分布的條件下使用變換分數的變量標準化法。其公式見教材P99(5.15)。,《作業(yè)》,1. P49 第三章課后習題第7題。2. P99 第五章課后習題第2題。3. P100 第五章課后習題第3題。4. P100 第五章課后習題第5題。,體育統(tǒng)計學,第六章 統(tǒng)計推斷 (假設
45、檢驗),★ 關于誤差的說明1:隨機誤差——偶然因素造成,不可避免,無法消除2:系統(tǒng)誤差——實驗條件和研究方法造成的,可以改善3:抽樣誤差——抽出的樣本統(tǒng)計量之間或樣本統(tǒng)計量與總體參數之間的偏差,主要由于個體間差異造成的,樣本含量增大時,抽樣誤差會有減少的趨勢4:人為誤差(過失錯誤)——人為過失錯誤造成的統(tǒng)計數據的失真性。統(tǒng)計處理中最關心的是系統(tǒng)誤差和抽樣誤差。,第一節(jié) 參數估計,第一節(jié) 參數估計,★ 關于“標準誤
46、”的概念——表示樣本均數(或樣本率)與總體均數 (或總體率)之間偏差程度的標準差。 ▲ 均數標準誤的計算公式:,第一節(jié) 參數估計,▲ 均數標準誤的計算公式:,第一節(jié) 參數估計,▲ 點估計與區(qū)間估計點 估 計——選定適當的樣本統(tǒng)計量作為參數的估計量。區(qū)間估計——以變量的概率分布規(guī)律來確定未知參數 值的可能范圍。置信概率——在區(qū)間估
47、計中,預選規(guī)定的概率。置信區(qū)間——在區(qū)間估計中,按照預選規(guī)定的概率確 定下來的區(qū)間范圍。,▲ 置信區(qū)間的計算,一:總體均數的置信區(qū)間1:大樣本含量(n≥45),可以認定符合正態(tài)分布,根據正態(tài)分布原理,用u分計算。2:小樣本含量(n<45),不符合正態(tài)分布,只能根據t分布原理,用t分計算。二:總體率的置信區(qū)間◆ 樣本含量必須足夠大(如:n>100) p的抽樣分布逼近正態(tài)分布,
48、用u分計算。計算公式:教材P108-109.,假設檢驗的基本思想及步驟,主要學習目標 : ▲ 假設檢驗的基本知識 ▲ u 檢驗 ▲ t 檢驗 ▲ 卡方檢驗(不講),什么是假設?,假設是對總體參數的一種看法總體參數包括總體均值、比例、方差等分析之前必需要有合理的陳述,,我認為:蛙跳訓練能夠
49、促進100m跑成績的提高!,什么是假設檢驗?,根據研究目的,對樣本所屬總體的特征提出一個假設,然后根據樣本資料所提供的信息,對這個假設作出拒絕或者不拒絕的判斷,這一過程成為假設檢驗。概念核心:事先對總體參數或分布形式作出某種假設然后利用樣本信息來判斷原假設是否成立,假設檢驗的基本思想,,,,,,,,,,,... 因此我們拒絕假設 ? = 173 cm,樣本均值,m,= 173 cm,抽樣分布,H0,這個是我們抽樣得出的某個樣本均
50、值 ...,,150,假設檢驗的過程(提出假設→抽取樣本→作出決策),假設檢驗中的小概率原理,什么是小概率?1.在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率2.在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設3.小概率由研究者事先確定(與置信區(qū)間相關),假設檢驗的基本步驟,(1)根據實際情況建立原假設H0 ,備擇假設H1(2)選擇并計算檢驗統(tǒng)計量的取值(3)確定顯著性水平α,查表得出相應的臨界值(4
51、)把實值與臨界值進行比較,作出統(tǒng)計判斷,? 什么檢驗統(tǒng)計量?1. 用于假設檢驗問題的統(tǒng)計量2. 選擇統(tǒng)計量的方法與參數估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知3.檢驗統(tǒng)計量的基本形式為,確定適當的檢驗統(tǒng)計量,提出原假設H0 和備擇假設H1,? 什么是原假設?(Null Hypothesis)1.待檢驗的假設,又稱“0假設、虛無假設”。2.如果錯誤地作出決策會導致一系列后果。3.總是有等號 ?, ? 或
52、??4.表示為 H0 H0 :? ? 某一數值?0 例如, H0 :? ? 1.73(米),提出原假設H0和備擇假設H1,? 什么是備擇假設?(Alternative Hypothesis)1.與原假設對立的假設2.總是有不等號: ?,?? 或 ?3.表示為 H1 H1:? <某一數值,或 ? ?某一數值 例如, H1:? < 1.73 (米),或 ? ?1.73 (米),假設檢驗的幾個理論問題,
53、假設檢驗的基礎(1)邏輯基礎:反證法(2)數理統(tǒng)計基礎:小概率事件原理顯著性水平問題 (小概率事件發(fā)生的概率) α=0.05 或者α=0.01臨界值問題(見置信區(qū)間部分內容),兩種檢驗類型,雙側檢驗——只是強調差異性,不強調方向性單側檢驗——研究目的著重強調方向性的,有一 定理論和經驗基礎作為背景,雙 側 檢 驗,——只是強調差異性,不強調方向性,雙側檢驗圖解,雙側檢驗圖解,雙側檢驗圖解,雙側檢
54、驗圖解,單 側 檢 驗,——研究目的著重強調方向性,是有一定理論和經驗基礎作為背景的,單側檢驗(左側)圖解,單側檢驗(左側)圖解,單側檢驗(右側)圖解,單側檢驗(右側)圖解,假設檢驗中的兩類錯誤,1.第一類錯誤(錯否定,棄真錯誤)原假設為真時拒絕原假設第一類錯誤的概率為?,被稱為顯著性水平2.第二類錯誤(錯接受,取偽錯誤)原假設為假時接受原假設第二類錯誤的概率為??,H0: 無罪,假設檢驗中的兩類錯誤(決策結果),
55、假設檢驗就好像一場審判過程,數理統(tǒng)計檢驗過程,u檢驗,u 檢驗,性質:總體平均數或者總體率的檢驗最佳適用范圍:(1)總體方差已知且總體為正態(tài)分布。(2)總體方差已知且總體為任何分布的 大樣本。,樣本均數與總體均數的差異顯著性檢驗μ= μ0,樣本均數與總體均數的差異顯著性檢驗μ= μ0,μ= μ0 u 檢驗原始公式:,μ= μ0 u 檢驗原始公式的變式:(即:用樣本標準差S代替總體標準差σ),兩個樣
56、本均數的差異顯著性檢驗μ1= μ2,兩個樣本均數的差異顯著性檢驗μ1= μ2,μ1= μ2 u 檢驗原始公式的變式:(即:用樣本方差S12和S22分別代替總體方差σ12和σ22 ),μ1= μ2u 檢驗原始公式:,率(比例)的差異顯著性檢驗,樣本率與總體率的差異顯著性檢驗 (π=π0)樣本率與樣本率的差異顯著性檢驗 (π1=π2),,其中,t 檢驗,t 檢驗背景知識——“自下而上的科研”,英國Dublin啤
57、酒公司技師Gorsset想要解決啤酒質量檢驗問題,可是所涉及的研究對象(如啤酒中的酵母菌的含量等)很難獲取大樣本的數據。他苦心鉆研統(tǒng)計理論,終于想出了一種小樣本的檢驗方法——t 檢驗法,并于1906年以“Student”筆名在Biometrika的雜志上發(fā)表了。意義:統(tǒng)計思想上開創(chuàng)了一個新紀元。經過劍橋大學著名統(tǒng)計學專家Fisher教授在數學上的嚴格證明,創(chuàng)立了與過去描述性統(tǒng)計學炯然不同的推斷統(tǒng)計學,標志著推斷統(tǒng)計學的誕生。小樣本
58、檢驗理論在許多領域得到了廣泛的應用。,t 檢驗,性質:常用于均數的假設檢驗最佳適用范圍:總體服從正態(tài)分布,總體方差未知,樣本量n<45(30)(或者相對而言樣本量較小的時候)。種類: 單樣本t 檢驗; 獨立樣本t 檢驗; 配對樣本t 檢驗Spss上的演示(選講),單樣本 t 檢驗,檢驗比較的對象:樣本均數與一個已知的總體均數檢驗比較的目的:推斷樣本所代表的未知總體
59、均數μ與已知的總體均數μ0是否相等。(μ= μ0)例子:“全民健身工程”國民體質檢測測試中,已知我國健康成年男子脈搏均數為72次/分(μ0),某調研人員在一個山區(qū)隨機調查了25名健康成年男子的脈搏數(具體原始調研數據已知),能否據此認為該山區(qū)成年男子的脈搏數(μ)就是(或“就可以代表”)我國健康成年男子脈搏數(μ0)。,單樣本t 檢驗,公式:練習:P115 例6.6Spss演練(選講),獨立樣本t 檢驗,檢驗比較的對象:來自兩個
60、正態(tài)總體且相互獨立的兩個樣本均數檢驗比較的目的:推斷兩個樣本所代表的總體均數μ1與μ2是否相等。(μ1= μ2)例子:“全民健身工程”國民體質檢測測試中,A調研人員在一個a山區(qū)隨機調查了25名健康成年男子的脈搏數(具體原始調研數據已知),B調研人員在另一b山區(qū)隨機調查了28名健康成年男子的脈搏數(具體原始調研數據也已知),能否據此推斷兩山區(qū)健康成年男子的脈搏數沒有差異?;蛘哒f能否推斷兩山區(qū)健康成年男子的脈搏數同屬于一個共同的大總體的
61、兩個樣本(即來源于同一總體)。,獨立樣本t 檢驗,公式(大樣本)公式(小樣本)書本P118練習:大樣本:P116例6.7 小樣本:P117例6.8Spss演練(選講),配對樣本t 檢驗,檢驗比較的對象:兩個數據均能配對的樣本檢驗比較的目的:比較經不同實驗處理后或某因素變化后配對單位的差異是否顯著。( μd= 0)例子:某調研人員在一個山區(qū)隨機調查了25名健康成年男子的脈搏數(具體原始調研數據已知
62、),現在該調研人員對這25人進行了為期三個月的高原體能訓練,三個月后再測得了這25名健康成年男子的脈搏數(具體數據已知),想了解這三個月的訓練后,這25名健康成年男子的脈搏數是否有了顯著性的變化。,配對樣本t 檢驗,公式及其計算過程:教材P120例6.10練習:例6.10Spss演練(選講),體育統(tǒng)計學,第七章 方差分析(單因素方差分析),下面通過一個實例來介紹方差分析中的有關基本概念。 例 題 為檢驗不
63、同的訓練方法對磷肌酸增加有無影響,設計了四種不同的訓練方法A1、A2、A3、A4,并選取同樣條件的24名運動員,將他們分成四組,通過三個月的訓練后,觀察他們磷肌酸增長情況,數據如下表所示:,試通過以上數據推斷:不同的訓練方法對磷肌酸的增長有無影響?,從表中數據可看出,24名運動員磷肌酸的增加量存在差異,這種差異是由以下兩方面原因造成的:第1方面:由隨機誤差造成的。第2方面:由訓練方法不同造成的(系統(tǒng)誤差)。方差分析的目的就是將試驗中上述
64、兩個方面所造成的差異區(qū)分出來,并分析哪一方面在試驗中起主要作用。,以下是方差分析中所涉及的幾個基本概念: 1、指標:方差分析中,我們通常把實驗所要考察的結果稱為指標,也可稱之為因變量。 2、因素:對試驗數據有影響的條件叫因素,其中可控條件叫可控因素,不可控條件叫不可控因素,也稱為隨機因素。3、因素水平:試驗中把可控因素控制在不同范圍內,每一個范圍就稱為一個因素水平。 例如,在例6-1中,訓練方法就是一
65、個因素,而訓練方法A1就是一個因素水平,在該試驗中共設計了四個因素水平A1、A2、A3、A4。4、隨機誤差:在試驗中由隨機因素(也稱為不可控因素)造成的誤差叫隨機誤差。5、條件誤差(系統(tǒng)誤差):在試驗中由試驗條件不同而造成的誤差叫條件誤差。,6、單因素方差分析:在試驗中只考慮一個因素對試驗結果的影響,則稱此試驗為單因素試驗,其對應的數據分析方法為單因素方差分析法。7、多因素方差分析:在試驗中考慮多個因素對試驗結果的影響,則稱此試驗
66、為多因素試驗,其對應的數據分析方法為多因素方差分析法。8、交互作用:多因素方差分析中,不同因素水平間的搭配會對試驗結果產生影響,稱這種影響為交互作用。,單因素方差分析,一、單因素方差分析的基本思想 單因素方差分析的基本思想就是把觀測值的總變異(差異)分解成條件誤差與橢機誤差兩部分,并求得反映它們所起作用大小的量—離差平方和,再除以各自的自由度而求得它們各自的方差,通過比較它們方差的“大小”,就可作出試驗條件對試驗結果是
67、否有影響的統(tǒng)計判斷。 單因素方差分析的基本原理可簡述如下: 單方差分析的基本原理:把試驗數據的總差異分解成條件誤差與隨機誤差,然后比較“大小”,看哪一個在總差異中占主要地位。 這一基本原理也稱之為離差分解法,即Q總=Q條件+Q隨機,二、單因素方差分析的步驟,單因素方差分析分一般分如下4個步驟:1.提出假設H0:某因素對試驗數據無顯著影響。2.列方差計算表,計算隨機誤差、條件誤差及它們的自
68、由度。3.列方差分析表,比較條件誤差與隨機誤差的大小。4.作出結論。 當F≥臨界值Fα(γ1,γ2)或相伴概率P ≤a時,拒接假設H0; 當F<臨界值Fα(γ1,γ2)或相伴概率P﹥a時,接受假設H0。,方差計算表,總差異Q總、條件誤差Q條件、隨機誤差Q隨機可由方差計算表中右下方框中的T、N、S、R按以下公式計算: Q條件=S-T2/N Q隨機=R-S Q總= Q
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 體育統(tǒng)計學
- 體育統(tǒng)計學教案
- 《統(tǒng)計學》課件
- 統(tǒng)計學課件英語
- 統(tǒng)計學課件2
- 《應用統(tǒng)計學》課件
- 2016統(tǒng)計學題庫1
- 生物統(tǒng)計學課件
- 衛(wèi)生統(tǒng)計學課件
- 醫(yī)學統(tǒng)計學ppt課件
- 《體育統(tǒng)計學》課程第1講體育統(tǒng)計的概念
- 中醫(yī)藥統(tǒng)計學課件-中醫(yī)藥統(tǒng)計學
- 《統(tǒng)計學浙大》ppt課件
- 中南大學統(tǒng)計學課件
- 醫(yī)學統(tǒng)計學復習課件
- 《應用統(tǒng)計學》課件.1
- 解剖統(tǒng)計學滲透統(tǒng)計學玩轉統(tǒng)計學培訓班
- 統(tǒng)計學數據分析 統(tǒng)計學
- 統(tǒng)計學
- 衛(wèi)生統(tǒng)計學 醫(yī)學統(tǒng)計學 習題
評論
0/150
提交評論