2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩135頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一些機(jī)率與統(tǒng)計(jì)的概念,黃文璋國(guó)立高雄大學(xué)應(yīng)用數(shù)學(xué)系,2,1. 前言,宇宙的運(yùn)轉(zhuǎn),穿插著必然性及隨機(jī)性。銅板以自由落體方式落下。 ◇高度固定,落地所需時(shí)間為定值(必然性) 。 ◇那一面朝上?無法預(yù)知(隨機(jī)性)。必然性:下次日蝕、月蝕、哈雷慧星來?隨機(jī)性:颱風(fēng)走向?,3,數(shù)學(xué)裡多半是必然性的問題: ◇ 0.3+0.2=0.5, ◇三角形內(nèi)角和必為180°,

2、 ◇ ,當(dāng) ,無非零整數(shù)解。統(tǒng)計(jì)裡多半是隨機(jī)性的問題, ◇一成不變就非隨機(jī), ◇連機(jī)率值都可能改變。,4,在隨機(jī)世界裡,不能以數(shù)學(xué)中的必然性來思考問題。物理學(xué)裡用到不少數(shù)學(xué),但學(xué)物理主要不是在學(xué)數(shù)學(xué)。從機(jī)率與統(tǒng)計(jì)的課程裡,是要學(xué)到隨機(jī)性,而非只欣賞數(shù)學(xué)。,5,在隨機(jī)世界裡,我們接觸到的是 數(shù)據(jù)(data),在必然世界裡,我們接觸到的是

3、 數(shù)字(number)。,6,數(shù)據(jù)是有內(nèi)涵包含資訊的數(shù)字。2.29與1.16為兩個(gè)數(shù)字,並未顯示任何資訊。 臺(tái)灣地區(qū)民國(guó)70年之出生率為 2.29%,民國(guó)90年之出生率為1.16%,此二數(shù)據(jù)除了含有一些資訊(如二十年來出生率下降等)外,我們可能會(huì)想到諸如 ◇如何求出? ◇是否正確? ◇學(xué)校會(huì)不會(huì)招不到學(xué)生? 而不是單純地視為兩個(gè)數(shù)字。,7,數(shù)字是數(shù)學(xué)上的問題, 數(shù)據(jù)是統(tǒng)計(jì)上的問題。

4、數(shù)字是一成不變, 數(shù)據(jù)就會(huì)有變異(variation)。,8,什麼是data? ◇資料、數(shù)據(jù),從調(diào)查、實(shí)驗(yàn)或研究中獲 得資訊。 ◇ A general term for observations and measurements collected during any type of scientific investigation 。,9,

5、在Conan Doyle 著 The Celebrated Cases of Sherlock Holmes(福爾摩斯) The Adventure of the Copper Beeches一章 中: Data! data! data! he cried impatiently. I can't make bricks without clay.,10,做決策不能

6、沒有data,算命者所倚賴的也是data: ◇要收集很多人的命運(yùn), 並按面相、八字 等分類。算命是在做統(tǒng)計(jì)實(shí)務(wù)。 我們常說讓數(shù)據(jù)說話。但是否真能了解數(shù)據(jù)所說的話呢?,11,,12,你交了一新朋友。問他“有幾個(gè)小孩”,他說“有兩個(gè)”。問他“有女孩嗎?”他答“有”。問:他亦有一男孩之機(jī)率為何?解.兩個(gè)小孩的性別: 男男、男女、女男、女女。 已知有一女孩: 男女、女男、

7、女女。 會(huì)有男孩: 男女,女男。 另一小孩為男孩之機(jī)率為2/3, 另一小孩為女孩之機(jī)率為1/3。,13,很多人不相信此結(jié)果,以模擬來說明。產(chǎn)生1,000,000組(i, j),i , j=0,1。 1表女孩,0表男孩。 無女孩:250,820組, 有女孩:749,180組, 有二女孩:249,131組。,14,回答“沒有”

8、 兩個(gè)小孩皆為男孩。若問“有男孩嗎?” 回答“有” 另一個(gè)小孩為女孩之機(jī)率亦為2/3。小孩是男是女的可能性皆為1/2: 事前機(jī)率。獲得一些資訊(知道其中有一女孩)後,另一小孩是男或是女的機(jī)率改變了: 事後機(jī)率。不少家庭都是兩個(gè)小孩。若知道其中一個(gè)是男孩,則猜另一個(gè)是女孩;若知其中一個(gè)為女孩,便猜另一個(gè)是男孩: 猜中的比率很容易超過一半。,1

9、5,問:不論問有男孩或有女孩,只要答“有”, 另一小孩為異性之機(jī)率皆為2/3,合理嗎?問:如果問題改為「老大是女孩嗎?」 結(jié)果有何不同?回到前述圖片,跪著那小孩是女孩之機(jī)率為何?福爾摩斯根據(jù)一些蛛絲馬跡來推測(cè),一張清晰的圖片,是會(huì)顯示一些資訊。,16,機(jī)率的意義為何?有二銅板: 銅板 A 出現(xiàn)正面之機(jī)率為0.3, 銅板 B 出現(xiàn)正面

10、的機(jī)率為0.2。問: ◇0.3是什麼意思?丟10次會(huì)得到3次正面? 丟10,000次得到3,000次正面? ◇0.3>0.2,若二銅板各丟10次, 銅板A之正面數(shù)>銅板B? ◇兩銅板各丟一次, 得到一正面之機(jī)率為 0.3+0.2=0.5?,17,好賭是人的天性周伯通與歐陽鋒賭是否能真能把海上鯊魚全部殲滅。黃眉僧與段延慶下圍棋,為搶先手,要段延慶猜他七十歲後,兩腳足趾

11、是奇是偶。越戰(zhàn)獵鹿人中,左輪手槍裡放一子彈,兩人輪流對(duì)自己頭部發(fā)射。 問:先發(fā)射者是否較不利?,18,有位婦女很想生個(gè)女兒,她已連生7個(gè)兒子,朋友都鼓勵(lì)她再生, 因?yàn)槟怯羞\(yùn)氣那麼壞的 ?賭個(gè)運(yùn)氣吧! 事實(shí)上約有一半的人賭成功,約有一半的人賭失敗。這一半賭失敗者,其中有些人還會(huì)再賭一次,然後又有約一半的人賭成功。這是為什麼有很高比例的人,相信連生7個(gè)兒子後,是較容易生出一個(gè)女兒。,19,公正賭局玩法. 投擲一

12、公正銅板,正面出現(xiàn)則賭徒贏, 否則莊家贏。策略. 每次賭注加倍,直至贏一次便停止。結(jié)果. 設(shè)第一次賭注為a元,且銅板在第n次投 擲才首度出現(xiàn)正面。則 前n-1次共輸 a+2a+…+2n-2a=(2n-1 -1)a(元)。 第n次賭注 2n-1a(元)

13、 淨(jìng)贏a元。,20,玩法. 投擲一公正銅板,直至出現(xiàn)一正面才停 止,若停止是在第r次,則得2r元。期望所得.問:1. 賭徒每次玩該付莊家多少錢,此才為 一公正賭局? 2.若所得2r元改為1.95r元,有何改變?,21,大部分的人連隨機(jī)性及機(jī)率的意義都不甚了解,因此才會(huì)沈迷於賭博,猜測(cè)明牌,或懷疑開獎(jiǎng)之公正性。賭應(yīng)只是

14、一種遊戲。去KTV唱歌、去看表演 ,都只是為了樂趣。從金錢上來看當(dāng)然都是付出。,22,賭戲?qū)€客並不公平,何以許多人一上了賭臺(tái)就下不來?情況不利 那有運(yùn)氣那麼壞,該轉(zhuǎn)運(yùn)了,不能就此打住。 ◇再玩若仍輸 下次更該贏了。 ◇若幸運(yùn)贏了 開始翻身了。若情況有利 手氣正順,怎可停止?除非是一直輸贏不太多(此機(jī)率並不大),讓人覺得此賭戲沒趣,否則不少人不論手氣好壞,都缺乏當(dāng)機(jī)立斷的決心。,23,以投擲銅板為例

15、持續(xù)投擲一公正銅板10,000次,令,24,以布朗運(yùn)動(dòng)的結(jié)果來估計(jì): 其中 Z 有 分佈, 表一標(biāo)準(zhǔn)的布朗運(yùn)動(dòng)。,25,仍以布朗運(yùn)動(dòng)的結(jié)果來估計(jì): 當(dāng)x=0.993,機(jī)率約為,26,底下為五個(gè)模擬圖,橫軸為n, 縱軸為Sn,其中Si > 0表正面領(lǐng)先,Si < 0表反面領(lǐng)先。

16、 構(gòu)成一隨機(jī)漫步(random walk)。 注意,27,28,29,30,31,32,新聞媒體多半只報(bào)導(dǎo)有人樂透彩中大獎(jiǎng),或在賭場(chǎng)大贏的新聞。人有選擇性記憶的傾向。在賭之前向神明祈求,大部分的時(shí)候沒有效果。但若贏了,可能真覺得神明聽了自己的祈求。,33,2. 你了解隨機(jī)嗎?,民國(guó)92年1月1日起,環(huán)保署實(shí)施第二階段的塑膠袋限用政策,塑膠業(yè)者與民眾均感到困擾。中國(guó)時(shí)報(bào)92年1月1日有一則投書: 昨天筆者支

17、援採(cǎi)訪此則新聞, 經(jīng)“隨機(jī)採(cǎi)樣” 受訪者,…。 而「平口,無提把」塑膠袋可用的細(xì)節(jié)幾乎都能“隨機(jī)”答出。 …。 於是筆者又鍥而不捨的“隨機(jī)”多問了許多間店家,…。,34,隨機(jī)與隨便的意思一樣嗎?容不容易做到隨機(jī)採(cǎi)樣(或隨機(jī)抽樣)呢?隨機(jī)點(diǎn)名,會(huì)不會(huì)每次都點(diǎn)不同的人?,35,再引一段文字。我代替電視節(jié)目出征,站在路邊訪問經(jīng)過的路人,隨機(jī)抽樣,盡量毫不偏私地呈現(xiàn)社會(huì)大眾的心聲?!?/p>

18、 (91年4月14日中國(guó)時(shí)報(bào)39版,作者黃明堅(jiān),題目為活到一百一十四歲如何?),36,在機(jī)率裡: 事先不能預(yù)知結(jié)果的試驗(yàn),便稱隨機(jī)試驗(yàn)。隨機(jī)抽樣裡,說將10個(gè)球隨機(jī)地放進(jìn)10個(gè)箱子中,此處之隨機(jī)便含有獨(dú)立及均勻分佈的意思。均勻的骰子,將撲克牌洗得很均勻。在隨機(jī)現(xiàn)象裡,均勻大致表出現(xiàn)之機(jī)率相等,而非出現(xiàn)之頻率相等。,37,例1. n個(gè)球隨機(jī)地放進(jìn)n箱中,每箱各有一球的機(jī)率: ◇n=2,約1/2;

19、 ◇n=3,約2/9; ◇n=10,約0.00036288。每箱各有一球,不是應(yīng)最易發(fā)生嗎?,38,取n=10。令a=每箱各有一球的機(jī)率。 恰有i空箱的機(jī)率: (i) 1空箱:45a。 (ii) 2空箱:375a。 ?第三大 (iii) 3空箱:980a。 ?最大 (iv) 4空箱:

20、(7609/8)a。 ?次大 (v) 5空箱:(2835/8)a。 ?第四大 (vi) 6空箱:(6821/144)a。 (vii) 7空箱:(311/168)a。 (viii) 8空箱:(511/40320)a。 (xi) 9空箱:a/9!。,39,在紅樓夢(mèng)的第八回,賈寶玉去探望薛寶釵,正在閒聊。一語未了,忽聽外面的人

21、說:『林姑娘來了。』話猶未完,黛玉已搖搖擺擺的進(jìn)來,一見寶玉,便笑道:『哎喲! 我來的不巧了!』寶玉等忙起身讓坐。 寶釵笑道:『這是怎麼說?』 黛玉道:『早知他來,我就不來了。』 寶釵道:『這是什麼意思?』 黛玉道:『什麼意思呢? 來呢,一齊來,不來,一個(gè)也不來。今兒他來,明兒我來,間錯(cuò)開了來,豈不天天有人來呢? 也不至太冷落,也不至太熱鬧。姐姐有什麼不解的呢?』,40,

22、從10n個(gè)有編號(hào)的球中,依序隨機(jī)取n球,每次取出後放回。會(huì)有重複的機(jī)率: ◇ n=20,約0.05; ◇ n=30,約0.098; ◇ n=300,約0.777; ◇ n→∞, 趨近至1。 隨機(jī)下的後果,往往是不均勻!,41,在電影沈默的羔羊裡: Doesn't this random scattering site seem desperately random, li

23、ke an elaboration of bad liar. 這些隨機(jī)散佈的地點(diǎn),不是極度地隨機(jī)嗎? 就像差勁的騙子精心設(shè)計(jì)的謊言??雌饋黼S機(jī),反而會(huì)像精心設(shè)計(jì)的謊言!隨機(jī)點(diǎn)名,很難每次點(diǎn)不同的人。做芝蔴餅,隨機(jī)灑,芝蔴散布不易均勻。均勻分佈並非均勻散佈!,42,43,有時(shí)我們會(huì)懷疑事件之隨機(jī)性,因看到過多的巧合。以樂透彩為例,從每期開出的6個(gè)頭獎(jiǎng)號(hào)碼,要找到一些特殊的組合,並非太困難。,44,例2. 在42取6

24、的樂透彩裡,偶數(shù)共有21個(gè)。故6碼全為偶數(shù)之機(jī)率: 每期頭獎(jiǎng)號(hào)碼全為偶數(shù),全為奇數(shù),全在1 至21,或全在22至42,機(jī)率約,45,6碼全為3的倍數(shù),全不為3的倍數(shù),…,每期開出的6碼中,總能找到一些有趣的現(xiàn)象。當(dāng)期數(shù)夠多後,更易從其間找到一些有趣的現(xiàn)象(如北銀樂透彩39號(hào)曾連續(xù)5期出現(xiàn))。除非經(jīng)過統(tǒng)計(jì)檢定,否則不要輕易判定號(hào)碼並非隨機(jī)地出現(xiàn)。有些我們以為不容易發(fā)生的事件,其發(fā)生的機(jī)率其實(shí)並沒有想像中

25、的小。,46,例3. 在n取r的樂透彩中,頭獎(jiǎng)號(hào)碼會(huì)有連號(hào)的機(jī)率: 在42取6,機(jī)率: 因此看到連號(hào)不用太驚訝。問:簽注連號(hào),中頭獎(jiǎng)的機(jī)率是否較大?,47,例4. 對(duì)北銀發(fā)行的樂透彩,假設(shè)每期簽5注 ,連續(xù)50年,至少會(huì)中一次的機(jī)率為何?解.50年間至少中一次頭獎(jiǎng)之機(jī)率: 50年間共簽了 5?5,200=26,000(

26、注), 佔(zhàn)全部注數(shù) 利息不計(jì),共花了一百三十萬元。,48,有志者事竟成?;?0年的歲月,中頭獎(jiǎng)之機(jī)率的確是不小。在一個(gè)人的一生中,自己或認(rèn)識(shí)的人裡,有中頭獎(jiǎng)(或發(fā)生很特殊的事件)者,是不太稀奇的。,49,夢(mèng)幻七部車民國(guó)90年12月,新開幕的京華城購物中心,推出一百名休旅車抽獎(jiǎng)活動(dòng),每天抽10部,購物每滿2,000元可兌換一張抽獎(jiǎng)券。一對(duì)夫婦合計(jì)抽中7部車,他們共花三百多萬元,換來1,500餘張抽獎(jiǎng)券。

27、活動(dòng)期間,共投進(jìn)十四、五萬張彩券。不知每天箱內(nèi)有多少張彩券,不易求中7部車的機(jī)率。 利用波松近似估計(jì)此機(jī)率約萬分之一。,50,從新聞的觀點(diǎn),只要有一這類幸運(yùn)發(fā)生皆會(huì)引起注意。一件事若發(fā)生在每個(gè)人身上的機(jī)率為百萬分之一,則臺(tái)灣兩千三百萬人,每天發(fā)生二十餘件是毫不稀奇的。,51,例5. 1986年,美國(guó)紐約時(shí)報(bào)在頭版報(bào)導(dǎo)一位名叫Adams的女士第二度贏得紐澤西州的樂透彩頭獎(jiǎng)一百五十萬美元。1985年,她第一次得三百九十萬美元

28、。第一次中的樂透彩是39取6,中頭獎(jiǎng)機(jī)率:第二次中的樂透彩是42取6,中頭獎(jiǎng)機(jī)率:,52,樂透彩主辦單位說一個(gè)人一生中中兩次頭獎(jiǎng)之機(jī)率為 約十七兆分之一。 這樣算對(duì)嗎?,53,上述計(jì)算是假設(shè)Adams兩種彩券各買一張。事實(shí)上Adams每週買好幾張且買了好幾年。若在39取6的玩法裡,每週買3張,在42取6的玩法裡,每週買5張,則每週有大於百萬分之一的機(jī)率中頭獎(jiǎng): 以百萬分之一計(jì),在

29、4年(約200期)裡,一次頭獎(jiǎng)皆未中的機(jī)率:,54,利用波松近似,中一次頭獎(jiǎng)的機(jī)率:中兩次頭獎(jiǎng)的機(jī)率:,55,一個(gè)人終身(以30年,1,500期計(jì))中兩次頭獎(jiǎng)的機(jī)率:,56,紐澤西州人口超過八百萬,若有一百萬人,每期皆如上述方式買彩券,則三十年內(nèi)該州會(huì)有人至少中兩次頭獎(jiǎng)之機(jī)率便很大:若全美有五千萬人,每期皆以上述方式買彩券,則在4年裡,至少有一人中兩次頭獎(jiǎng)的機(jī)率便不小了:不要小看大數(shù)的威力!,57,註.

30、 此即波松近似。,58,3. 統(tǒng)計(jì)檢定,統(tǒng)計(jì)檢定是在隨機(jī)世界裡做決策之一重要的依據(jù)。有人能分辨奶茶先加奶或茶現(xiàn)代統(tǒng)計(jì)學(xué)之創(chuàng)始者英國(guó)人費(fèi)雪 (R.A. Fisher)提出下述故事:,59,在1920年代後期,某日有位女士對(duì)一群正在喝下午茶的科學(xué)家宣稱,奶茶的調(diào)製順序?qū)︼L(fēng)味有很大的影響,把茶加進(jìn)牛奶裡,和把牛奶加進(jìn)茶裡,兩者喝起來完全不同。 在座的科學(xué)家們感到可笑,他們看不出兩種混合方式的化學(xué)成分有何差異。

31、 但費(fèi)雪卻認(rèn)真地設(shè)計(jì)一個(gè)實(shí)驗(yàn)步驟來對(duì)這件事做檢定,包括要準(zhǔn)備多少杯奶茶,以及依照什麼順序給這位女士喝等。,60,懷孕者之尿液可使種子提前發(fā)芽中央社記者郭傳信安卡拉十九日專電)土耳其國(guó)立安卡拉大學(xué)醫(yī)學(xué)院婦科系教授庫克在專欄中表示,早在西元前二二00至二000年,藥學(xué)史極為發(fā)達(dá)的古埃及人,已能夠不靠化學(xué)藥劑即可檢驗(yàn)出女性是否懷孕。 庫克說,根據(jù)至今已發(fā)現(xiàn)的古埃及紙草文獻(xiàn)記載,希望知道自己是否懷孕的婦女,必須將自己清晨即起的

32、尿液裝在一個(gè)盛有大麥種子的袋子裡,但在此同時(shí),也必須要求另一位確定未懷孕的女性也將清晨即起的尿液裝在另一個(gè)有大麥的袋子裡。,61,庫克表示,由於女性懷孕後,體內(nèi)會(huì)較未懷孕女性產(chǎn)生更多的荷爾蒙,因此泡在懷孕女性尿液中的大麥種子容易發(fā)酵並提前發(fā)芽,即可確定懷孕,但如果兩袋的大麥種子同時(shí)發(fā)芽,則證明未懷孕。 庫克最後在文中強(qiáng)調(diào),現(xiàn)代科學(xué)已證實(shí)這項(xiàng)古老的女性懷孕檢驗(yàn)法「相當(dāng)準(zhǔn)確」。 (民國(guó)90年12月20日,Yahoo!奇摩網(wǎng)站

33、),62,在費(fèi)雪的故事裡,若只拿一杯奶茶讓那位女士喝,她說對(duì)先放茶或先放牛奶,會(huì)相信她真有分辨能力嗎? ◇兩次皆說對(duì)呢? ◇連續(xù)10次皆說對(duì)呢? ◇20次中錯(cuò)一次呢? ◇20次中錯(cuò)兩次呢? 在此分辨能力指她每杯講對(duì)的機(jī)率大於隨機(jī)猜的機(jī)率 1 / 2。我們對(duì)犯錯(cuò)是有一些容忍度,但程度究竟多大,就因人、因情況而異。,63,對(duì)檢驗(yàn)女性是否懷孕,一樹之果有酸甜之別,一母之子有賢愚之分。與1

34、0位未懷孕的女性比,“比賽”結(jié)果,倒入該婦女尿液的大麥,以6比4提前發(fā)芽,算不算領(lǐng)先? A, B兩支球隊(duì),即使勢(shì)均力敵,連比十場(chǎng),A隊(duì)領(lǐng)先的機(jī)率為0.377,可說很容易發(fā)生。怎樣算“提前 ”? 古埃及人如何操作,以得到可靠的推論?,64,在數(shù)學(xué)裡,一命題,一旦被證明是對(duì)的,就毫無疑問地成立。如費(fèi)馬最後定理。在數(shù)學(xué)上我們可以寫 假設(shè) 為一整數(shù),且x, y, z皆不為 0(假設(shè)A),

35、 試證 xn+yn=zn無整數(shù)解(結(jié)論B)。在隨機(jī)世界裡,一件事往往不知究竟是真或是偽。,65,到底該女士能否分辨奶茶是先放奶還是先放茶,即使她20次皆說對(duì)(亂猜猜中之機(jī)率=1/220 百萬分之一) ,恐怕還是有人不信她有此能力: 平均一百萬人約有一人20次皆猜對(duì)。因此我們不會(huì)說: 試證某女士“有”分辨奶茶是先放奶還 是先放茶的能力,

36、或是: 試證某女士“無”分辨 …。,66,數(shù)學(xué)家因相信在條件A下, xn+yn=zn 無整數(shù)解是對(duì)的,於是去證明。對(duì)奶茶問題,我們相信什麼?由於該女士宣稱(也希望人家相信)她有分辨能力。因此 先假設(shè)該女士無分辨能力。然後拿20杯讓她分辨,觀察她講對(duì)幾次。先設(shè)定一能忍受的推論錯(cuò)誤機(jī)率α,如0.05,或0.01等,然後求在無分辨能力的假設(shè)下,講對(duì)次數(shù)會(huì)這麼多的之機(jī)率有多大?如果機(jī)率小於α

37、(即這麼多次講對(duì)是較不尋常),則拒絕原假設(shè),否則接受原假設(shè)。,67,對(duì)一隨機(jī)現(xiàn)象, 提出猜想, 將猜想表為統(tǒng)計(jì)假設(shè), 接受或拒絕統(tǒng)計(jì)假設(shè)。 此過程稱為假設(shè)檢定, 得到的推論,稱為統(tǒng)計(jì)推論。,68,統(tǒng)計(jì)假設(shè)與一般數(shù)學(xué)中的假設(shè)不同。 ◇在數(shù)學(xué)裡: 假設(shè)x>y。

38、 並未涉及任何隨機(jī)的量,此非統(tǒng)計(jì)假設(shè)。 ◇令μ表北銀樂透彩1號(hào)出現(xiàn)在頭獎(jiǎng)號(hào)碼中 的機(jī)率,則 為一統(tǒng)計(jì)假設(shè)。數(shù)學(xué)中的假設(shè)不須去檢驗(yàn)是否為真。統(tǒng)計(jì)中的假設(shè)並不是要證明是否為真,而是要判定該接受或拒絕。,69,取一組隨機(jī)樣本,並利用此組樣本,當(dāng)做是否接受某一假設(shè)之證據(jù)。如果證據(jù)與假設(shè)所陳述的不合,或者說吻合的機(jī)率很低,便拒絕該假設(shè),否則便接受該假設(shè)。數(shù)據(jù)會(huì)說話,

39、但不論方法多好,對(duì)一統(tǒng)計(jì)假設(shè)所做的推論,是可能有錯(cuò)的。數(shù)學(xué)證明不能有錯(cuò),統(tǒng)計(jì)推論允許犯錯(cuò)!換一組樣本,結(jié)論可能便相反。在無法避免犯錯(cuò)下,只能以較好的方法減小犯錯(cuò)的機(jī)率。,70,波蘭人奈曼(J. Neyman)及英國(guó)人皮爾生 (E.S. Pearson),1933年,給出奈曼-皮爾生引理。其架構(gòu)中, ◇虛無假設(shè)(H0):通常表現(xiàn)況, ◇對(duì)立假設(shè)(Ha):表我們傾向相信,或希望

40、 它是對(duì)的。北銀樂透彩頭獎(jiǎng)號(hào)碼中,1號(hào)出現(xiàn)的機(jī)率是否大於1/7?若傾向相信答案是肯定的,則取 H0:μ=1/7 , Ha:μ>1/7。在奶茶問題,取 H0:μ=1/2 , Ha:μ>1/2。,71,虛無假設(shè)是被保護(hù)的,除非證據(jù)夠強(qiáng),否則不輕易推翻。宣佈該女士有分辨能力,將造成新聞轟動(dòng)。對(duì)於現(xiàn)況不輕易推翻,會(huì)使人們?cè)谧鰶Q策時(shí)更謹(jǐn)慎: 朝令夕改非假設(shè)檢定的

41、精神!,72,假設(shè)檢定裡,多大的錯(cuò)誤機(jī)率可忍受?有兩種錯(cuò)誤的機(jī)率: ◇虛無假設(shè)為真卻拒絕(第一型錯(cuò)誤), ◇虛無假設(shè)不真卻接受(第二型錯(cuò)誤)。,73,當(dāng)樣本數(shù)固定,兩型錯(cuò)誤的機(jī)率, 有一減小另一必增大。第一型錯(cuò)誤較嚴(yán)重,通常的作法: ◇先控制第一型錯(cuò)誤的機(jī)率不要超過某一 α值, ◇然後使第二型錯(cuò)誤的機(jī)率愈小愈好。,74,在樂透彩號(hào)碼的隨機(jī)性檢定裡,先假設(shè)各號(hào)碼

42、出現(xiàn)的機(jī)率相同,再看於此假設(shè)下會(huì)出現(xiàn)這麼異常的結(jié)果之機(jī)率是否夠小,以判定該不該推翻機(jī)率相同的假設(shè)。通過檢定並不表號(hào)碼真的是隨機(jī)產(chǎn)生,只是說尚無不合;但若不通過,大約便不相信號(hào)碼為隨機(jī)產(chǎn)生。,75,統(tǒng)計(jì)假設(shè)的架構(gòu),與刑事訴訟法中的無罪推定原則(第154條)類似: 被告未經(jīng)審判證明有罪確定前, 推定其為無罪。 先相信虛無假設(shè),然後看實(shí)驗(yàn)出現(xiàn)的數(shù)據(jù)合不合理。以機(jī)率大小來判定合理性。

43、若會(huì)出現(xiàn)這種數(shù)據(jù)的機(jī)率很小,便認(rèn)為不合理,由是拒絕虛無假設(shè)。,76,“虛無” 二字的由來?若做出的推論是北銀樂透彩每期頭獎(jiǎng)號(hào)碼的出現(xiàn)符合隨機(jī)性,誰有興趣?大家有興趣的是拒絕虛無假設(shè)! ◇宣佈頭獎(jiǎng)號(hào)碼是有公式可以算出, ◇宣佈明牌存在, ◇宣佈有某幾個(gè)號(hào)碼較容易出現(xiàn),,77,統(tǒng)計(jì)裡的推論與數(shù)學(xué)中的證明不同。假設(shè)投擲一銅板100次,皆得到正面。在合理的α下(只要α>1/2100),會(huì)拒絕

44、 H0:此為公正銅板。 但公正的銅板還是有可能(只是機(jī)率很小) 出現(xiàn)如此極端之結(jié)果。問:統(tǒng)計(jì)檢定中,α太小(如α=1/2100)是否恰 當(dāng)?,78,例6. 某大公司有一萬名員工,年終摸彩,總經(jīng)理秘書中首獎(jiǎng)。作一檢定: H0:沒有作弊, Ha:有作弊。 在H0之下,隨機(jī)地抽

45、獎(jiǎng),秘書中獎(jiǎng)機(jī)率為0.00001,只要α>0.00001,會(huì)拒絕H0。 合理嗎?全公司每一員工都不該中獎(jiǎng)?,79,4. 人的天性有隨機(jī)性嗎?,證據(jù)顯示,一般人隨意寫的號(hào)碼不易通過隨機(jī)性的檢定。寫20個(gè)1至42的數(shù)字,奇數(shù)很可能居多。參考黃文璋、洪宛頻及羅夢(mèng)娜(2002)一文。,80,民國(guó)92年4月7日起,北銀開始發(fā)行四星彩。共有正彩、前三彩、後三彩、前對(duì)彩、後對(duì)彩等五種玩法。每期從0000至9999等10,0

46、00組號(hào)碼中開出一組有序號(hào)碼。正彩玩法就是四位數(shù)全對(duì),中獎(jiǎng)機(jī)率為10,000分之一,中獎(jiǎng)每注可獲獎(jiǎng)金5,000倍。表1列出頭16期開出之號(hào)碼及正彩中獎(jiǎng)數(shù)等資料。,81,表1 四星彩正彩中獎(jiǎng)號(hào)碼等資料,82,總計(jì) 20,010,806 1329 33.21%,83,民眾選號(hào)極不隨機(jī),雖千挑萬選。但16期中,只有三期獎(jiǎng)金比例超過該有的50%。獎(jiǎng)金比例最高的第6期,開出的號(hào)碼為281

47、6,顯然是一組大家喜歡的號(hào)碼。,84,Boland and Pawitan(1999)曾做實(shí)驗(yàn): 在初等統(tǒng)計(jì)課程中,以愛爾蘭國(guó)家樂透彩的玩法(42取6),要學(xué)生每人隨機(jī)地寫出一組頭獎(jiǎng)號(hào)碼,如此得到234組號(hào)碼。 這234組號(hào)碼通不過隨機(jī)性的檢定。,85,第2節(jié)所提的那位記者,自行隨機(jī)採(cǎi)樣很可能不是真正隨機(jī),而只是隨意罷了。欲追求明牌,所追逐的往往卻是名牌。 樂透彩除了普獎(jiǎng)外,由中獎(jiǎng)人均分該獎(jiǎng)獎(jiǎng)金。而每組號(hào)碼中獎(jiǎng)機(jī)

48、率又相同,該簽注熱門號(hào)碼還是冷門號(hào)碼?德國(guó)的樂透彩為49取6,1993年10月16日那期共賣出6,803,090張彩券,表2給出最熱門的20組號(hào)碼。簽中頭獎(jiǎng),與4,000人共分獎(jiǎng)金?,86,,87,等差數(shù)列、過去的頭獎(jiǎng)號(hào)碼、修改過去頭獎(jiǎng)號(hào)碼、別國(guó)頭獎(jiǎng)號(hào)碼、與重大事件有關(guān)的號(hào)碼等,都是一般人喜歡簽注的,這些其實(shí)是名牌而非明牌。 與其追求明牌卻追成名牌,倒還不如聽天由命(隨機(jī)地選),至少結(jié)果不會(huì)更壞。問:是否電腦選號(hào)較個(gè)人選號(hào)

49、易中獎(jiǎng)?,88,中國(guó)時(shí)報(bào)92年3月29日14版記者蔡沛恆有下述報(bào)導(dǎo)。 昨日彩券銷售額降至五億五千七百萬元,是去年底以來新低。北銀彩券部經(jīng)理?xiàng)钊饢|表示,面對(duì)樂透彩銷售金額出現(xiàn)“盤跌”走勢(shì) ,北銀確實(shí)傷透腦筋,甚至連“取消電腦選號(hào)”的方式都考慮過,後來因?yàn)橛绊憣用孢^大而暫時(shí)作罷。,89,採(cǎi)用電腦選號(hào)可適度提升中獎(jiǎng)率,北銀評(píng)估暫停電腦選號(hào)主要是為了增加「摃龜」機(jī)會(huì),頭彩可以累積,買氣自然上升。 楊瑞東進(jìn)

50、一步指出,目前電腦選號(hào)比重約占六成,六億元的銷售量等於有三億六千萬元採(cǎi)電腦選號(hào)。換算每二億六千三百萬元的銷售額就能開出一個(gè)頭獎(jiǎng),與最近每期頭獎(jiǎng)得主一到二名的實(shí)際情況相比,就能證明電腦選號(hào)果然保證每期都能開出頭獎(jiǎng),北銀樂彩的銷售量就欲高不易。,90,5. 大數(shù)下的迷思,機(jī)率與我們的生活息息相關(guān),但一般人對(duì)機(jī)率的含義常無法正確地掌握,對(duì)隨機(jī)世界裡的規(guī)則也就常誤解。十餘年前大家樂很風(fēng)行,賭徒藉著每期愛國(guó)獎(jiǎng)券中獎(jiǎng)號(hào)碼來對(duì)獎(jiǎng)。經(jīng)常有沒簽中者對(duì)愛

51、國(guó)獎(jiǎng)券之搖獎(jiǎng)機(jī)率產(chǎn)生懷疑。報(bào)章雜誌遂刊登一些教導(dǎo)大家“ 正確” 了解機(jī)率的文章。,91,我們引用底下一段話,供大家參考(見趙慕嵩等 (1987))。原文一字不易: 事實(shí)上,所謂失常的機(jī)率只是在機(jī)率學(xué)中必然性的短暫現(xiàn)象,其實(shí)還是正常的。 譬如一顆六面的正方形骰子,上面有一到六的點(diǎn)數(shù),理論上每擲一次就應(yīng)該使得每個(gè)數(shù)字各有六分之一的出現(xiàn)機(jī)會(huì),那麼連擲六次 ,是否 1,2,3,4,5,6等數(shù)字剛好各出現(xiàn)一次?當(dāng)然不會(huì),可是如果

52、連擲六億次,每個(gè)點(diǎn)數(shù)出現(xiàn)的次數(shù)就非常接近一億次,而滿足於六分之一的理論機(jī)率。,92,如果按照理論的機(jī)率,愛券連開十五萬次獎(jiǎng),開出105萬組號(hào)碼,那麼00到99這一百組號(hào)碼就有可能各出現(xiàn)一萬零五百次,而接近於理論機(jī)率。 開獎(jiǎng)次數(shù)愈多,各組號(hào)碼出現(xiàn)之相對(duì)頻率,有“很大的機(jī)會(huì)” 很接近1/100 大數(shù)法則。 但各組號(hào)碼出現(xiàn)的次數(shù)與期望次數(shù)(10,500)之差,很可能會(huì)很大。,93,以投擲銅板為例。投擲數(shù)愈多,愈不易得到正反面次數(shù)相

53、同。投擲 2n 次,正反面各出現(xiàn) n 次之機(jī)率為 以Stirling公式估計(jì)n!。當(dāng)n=100,此機(jī)率約0.08;當(dāng)n=106,此機(jī)率約萬分之5.64。,94,那再看底下一則報(bào)導(dǎo): 北銀彩券部表示,樂透彩每一次的開獎(jiǎng)都是「獨(dú)立事件」,四十二個(gè)號(hào)碼出現(xiàn)的機(jī)率是一樣的。 若以每周開獎(jiǎng)二次來估算,經(jīng)過五萬年,「四十二選六」所有的號(hào)碼組合(即五百二十四萬餘種)都會(huì)開出一次,每一號(hào)碼被開出的次數(shù)就會(huì)十分接近。 (91

54、年3月31日聯(lián)合報(bào)第6版,91年5月25日聯(lián)合報(bào)第6版,記者黃雯雯),95,由於樂透彩上市後,開出的號(hào)碼有所謂冷門及熱門,遂有此報(bào)導(dǎo)。此報(bào)導(dǎo)毫無變異的概念。不但不會(huì)每一組號(hào)碼都開出一次,且1至42,每一號(hào)碼被開出的次數(shù)之差異,也會(huì)隨著開獎(jiǎng)次數(shù)之增加而變大 (較嚴(yán)謹(jǐn)?shù)恼f法是,差異會(huì)變大的機(jī)率很大),而不會(huì)十分接近。,96,人本教育札記,這是一份自認(rèn)是為評(píng)析教育政策,及解讀教育問題及理念而辦的雜誌,並曾獲三屆雜誌類金鼎獎(jiǎng)。民國(guó)九

55、十二年二月號(hào),特別企劃的主題是 從賭博的機(jī)率現(xiàn)象談數(shù)學(xué)教育, 其中有一篇 機(jī)率的一體兩面-既偶然又規(guī)律。,97,文中有段文字: 根據(jù)數(shù)學(xué)預(yù)測(cè)的估計(jì)值告訴我們,擲骰子一萬次,將出現(xiàn)一千六百六十七個(gè)“ 一點(diǎn) ” ,出現(xiàn)比率大約為百分之十六點(diǎn)九。 之後 ,又有數(shù)學(xué)家做實(shí)驗(yàn),當(dāng)骰子擲超過十萬次之後,出現(xiàn)“ 一點(diǎn) ”的次數(shù)大約比估計(jì)值多出五百次,但百分比只差百分之 0.五,所以我們可以推論, 擲骰子

56、的次數(shù)越多,就越接近數(shù)學(xué)的預(yù)測(cè),這就是所謂隨機(jī)的規(guī)律。問:這一段的講法有何錯(cuò)誤?,98,6. 隨機(jī)法則,隨機(jī)世界裡仍有規(guī)則可循,如大數(shù)法則、中央極限定理等,便引導(dǎo)出隨機(jī)法則。大數(shù)法則說樣本平均隨著n之增大,在某種意義下會(huì)趨近至期望值。,99,弱大數(shù)法則: 設(shè)X1, X2, …為i.i.d.,令 = 樣本平均,μ= E(X),設(shè)|μ|0,即樣本平均與期望值差異會(huì)很小的機(jī)率會(huì)很大。,100,在隨機(jī)世界裡,變異

57、存在,大數(shù)法則保證了必然性。必然性使人們願(yuàn)意事先好好的準(zhǔn)備:球隊(duì)挑選好教練及爭(zhēng)取好球員,學(xué)生設(shè)法進(jìn)入好學(xué)校。光有必然性的世界,可能會(huì)使人們對(duì)未來失去盼望,少了努力的動(dòng)機(jī)。如果各球隊(duì)陣容擺出來,就可算出那一隊(duì)實(shí)力最強(qiáng),穩(wěn)獲冠軍,還有人想看球嗎?,101,如果進(jìn)好大學(xué)便確保將來必定成功,還有學(xué)生要努力嗎?光有必然性的世界無法運(yùn)轉(zhuǎn)。必須還有隨機(jī)性,使有變異,如此世界才能生生不息地運(yùn)轉(zhuǎn)。隨機(jī)性使變異隨時(shí)可能存在,使未來充滿著

58、不確定性。因此人們: 困境時(shí)等待隨機(jī)性, 順境時(shí)想要必然性。,102,103,不論樣本數(shù)n多大,都無法保證樣本平均與期望值的差一定很小。由前面五個(gè)模擬投擲銅板一萬次的圖便可得知。不過我們知道差異會(huì)很小的機(jī)率很大。我們還可求出誤差大小的機(jī)率。一般人對(duì)誤差到底大或小,概念不是很清楚 。,104,誤差理論是高斯對(duì)機(jī)率論的主要貢獻(xiàn)。統(tǒng)計(jì)裡常要做估計(jì),估計(jì)會(huì)有誤差,需掌握誤差的大小。 在一些條件下,高斯導(dǎo)出誤

59、差有常態(tài)分佈。 德國(guó)10馬克,以高斯為人像。,105,106,,107,中央極限定理導(dǎo)致當(dāng)樣本數(shù)n夠大,樣本平均 滿足 其中μ為觀測(cè)之期望值,σ為標(biāo)準(zhǔn)差。,108,由(1)式, n愈大, 對(duì)相同的機(jī)率, 會(huì)落在一愈窄的區(qū)間。由(2)式,對(duì)相同的機(jī)率,n愈大,樣本和 會(huì)落在一愈寬的區(qū)間。,109,問:投擲一銅板若干次,正面數(shù)出現(xiàn)比率為 50.114%, 僅比50

60、%略多,是否不足以 推翻此銅板為公正?解.結(jié)論為何與投擲數(shù) n 有關(guān)。 設(shè) 為 i.i.d. 分佈之r.v.’s。 E(X) = p,Var(X) = p(1 - p)。 欲檢定 H0:p=0.5 , Ha:p>0.5。 拒絕域?yàn)?。由中央極限定理,,110,

61、現(xiàn)觀測(cè)到 。(1) n = 13,000,000。 此值微乎其微,故拒絕H0,即認(rèn)為銅板並 非公正。,111,(2) n = 1,000,000。 若α>0.0113,則拒絕H0,否則接受H0。,112,(3) n = 10,000會(huì)如何(實(shí)際 n 不可能為10,000, 因 算至小數(shù)第5位值)?

62、 對(duì)大部分的情況下(α<0.40978),皆接受 H0。,113,50.114%與50%差異是否夠大,與投擲數(shù) n 有關(guān)! n 愈大,此差異就可能夠大, n 較小時(shí),此差異可能不夠大。換種說法,正面數(shù)比反面數(shù)多30,000是否夠多?註. x →∞時(shí), 其中,114,例7.(取材自Harris(1988))某次

63、選舉,有A, B二候選人,共投了N張票。選舉結(jié)果A以些微票數(shù)落敗。由於採(cǎi)人工計(jì)票,A認(rèn)為有可能會(huì)誤計(jì),要求重新計(jì)票。假設(shè)選舉沒有弊端,且每一張票會(huì)被誤計(jì)之機(jī)率為 p。又設(shè)計(jì)票過程形成一獨(dú)立的試驗(yàn),而重新計(jì)票可更正所有錯(cuò)誤。,115,設(shè)n1,n2為A,B二人實(shí)際該得之票數(shù)。令 X1 表 A 該得而被計(jì)為 B 之票數(shù), X2 表 B 該得而被計(jì)為 A 之票數(shù)。 假設(shè)

64、 , 。在重新計(jì)票前,A 所得之票數(shù): V1 = n1 + X2 - X1, B 所得之票數(shù)為 V2 = n2 + X1 - X2。重新計(jì)票後,A 得 n1 票,B 得 n2 票, n1 + n2 = N。,116,在重新計(jì)票前,B 領(lǐng)先的票數(shù): D = V2 - V1 = n2 - n1 – 2 (X2 - X1)。由

65、中央極限定理 又,117,故,118,設(shè)d > 0, 。則在實(shí)際 A 獲勝的假設(shè)下(即 n1 > n2),原先計(jì)票 B 領(lǐng)先超過 d 票之機(jī)率現(xiàn)設(shè)N = 13,000,000,d = 30,000??煞P之機(jī)率(即重計(jì)後 A 獲勝)小於對(duì)一些不同的 p,表3 給出上述機(jī)率??煽闯鲆P之機(jī)率微乎其微。,119,表3. d=30,000,N=13,000,000,1-Φ(z)之

66、值。,120,其次對(duì)一給定的 p ,於觀測(cè)到D=d後,可得n1之估計(jì)值 滿足當(dāng)d=30,000,N=13,000,000,表4給出一些不同的 p 之下 之值。在我們的假設(shè)下, 重新驗(yàn)票,原先落後者將落後更多!,121,表4 d=30,000,N=13,000,000, 之值,122,統(tǒng)計(jì)給的結(jié)果,並非百分之百可靠,此與數(shù)學(xué)不同。話說回來,在這隨機(jī)的世界,不依據(jù)統(tǒng)計(jì)給出

67、的結(jié)果做判斷,似乎不是明智之舉。,123,對(duì)於愛國(guó)獎(jiǎng)券那個(gè)例子中所提到的擲骰子六億次的情況。只看點(diǎn)數(shù)1,令Xi=1表第i次投擲得到點(diǎn)數(shù)1,Xi=0表第i次投擲得到其他點(diǎn)數(shù)。 便表投擲n次點(diǎn)數(shù)1出現(xiàn)的次數(shù)。因P(Xi=1)=1/6, P(Xi=0)=5/6,故,124,由(2)式,取n=6?108, 便約有0.9545之機(jī)率,落在區(qū)間 此區(qū)間半徑為18,257。 而約有0.

68、0455之機(jī)率 ,點(diǎn)數(shù)1出現(xiàn)之總次數(shù)不落在此區(qū)間: ◇點(diǎn)數(shù)1出現(xiàn)的次數(shù)不會(huì)“非常接近1億次”, ◇同理愛國(guó)獎(jiǎng)券若開出 105萬組號(hào)碼,00至 99這100組號(hào)碼,很難各出現(xiàn)恰好10,500 次。,125,再看前述月刊中那段報(bào)導(dǎo)。由於 故約有0.9545的機(jī)率,出現(xiàn)一點(diǎn)的次數(shù)與期 望次數(shù)16,667之差異不超2?117.85=235.70。是樣本平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論