貴州師范學院2014屆物理學專業(yè)畢業(yè)論文(設計)_第1頁
已閱讀1頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、<p>  學科分類號 </p><p>  本 科 畢 業(yè) 論 文(設計)</p><p>  題 目:在線電影點播系統(tǒng)標度特性研究</p><p>  Title: Study on characteristics of online movie on demand label </p><

2、p>  姓 名 學 號 </p><p>  院 (系) 物理與電子科學學院 </p><p>  專 業(yè) 物理學 年 級 </p>&l

3、t;p>  指導教師 職 稱 副教授 </p><p>  二○一四 年 五 月</p><p>  貴州師范學院本科畢業(yè)論文開題報告書</p><p>  貴州師范學院本科畢業(yè)論文(設計)評審表 </p><p><b>  目錄</b></p>

4、<p>  摘要錯誤!未定義書簽。</p><p>  Abstract11</p><p><b>  1.引言12</b></p><p>  1.1 研究背景及研究趨勢12</p><p>  1.2 研究目的及意義13</p><p>  1.3研究方法14<

5、/p><p>  2.相關理論知識14</p><p>  2.1電影點播14</p><p>  2.2 時間間隔和回復時間15</p><p>  2.3.泊松分布和冪律分布16</p><p><b>  3.數據說明17</b></p><p>  4.個體

6、行為的標度特性17</p><p>  4.1 個體用戶活躍度17</p><p>  4.2冪律分布研究18</p><p>  4.3 電影點播時間間隔與次數的實證分析20</p><p><b>  5.結束語22</b></p><p><b>  參考文獻23&

7、lt;/b></p><p><b>  致謝25</b></p><p><b>  摘要</b></p><p>  本文利用電影點播網站公開的實證數據,對人類動力學在線電影點播系統(tǒng)標度特性進行研究。研究部分電影點播個體的活躍度;對用戶連續(xù)兩次觀看電影的時間間隔進行統(tǒng)計分析,發(fā)現時間間隔并不是隨機的和平穩(wěn)的,用

8、泊松過程來描述是錯誤的,具有冪律分布的特點和性質,出現前瘦尾胖的現象,存在標度特性,;最后從電影點播次數的角度對人類動力學行為進行統(tǒng)計分析,并對其產生機理進行了探究。</p><p>  關鍵詞;人類行為動力學;活躍度;冪律分布;標度特性;電影點播次數</p><p><b>  ]</b></p><p><b>  Abstrac

9、t</b></p><p>  This paper uses empirical data movies on demand web site open, characteristic of standard for the online movie on demand system of human dynamics research. Part of the movie on demand in

10、dividual activity; user two times in a row to watch the movie time intervals for statistical analysis, found that the time interval is not random and smooth, with a Poisson process to describe is wrong, has the character

11、istics and properties of power-law distribution, the phenomenon of thin tail fat before, there</p><p><b>  1.引言</b></p><p>  1.1 研究背景及研究趨勢</p><p>  近些年來,人們對人類的活動時間統(tǒng)計特性進行

12、了大量的實證研究。Barabasi 在2005年發(fā)表于《Nature》的一篇論文【1】,從記錄人類活動歷史的數據庫中挖掘出了人類行為的統(tǒng)計規(guī)律,這為定量研究人類社會行為提供了一個新方向。剛初步形成人類行為動力學學科時,對人類行為的研究,都是通過假設人類行為是平穩(wěn)性、無后效性、普遍性的。在泊松分布描述中,人類相繼行為的間間隔一般認為是均勻和穩(wěn)態(tài)的,不會出現長時間的靜默和短時間內發(fā)生大量的事件,但Barabasi 等人在研究中卻發(fā)現,現實生

13、活中大量人類活動都不滿足泊松分布,有著偏離現象,人類總是在短時間內從事密集活動,而接下來會在很長一段時間內將其擱置,這些現象都違背了泊松分布條件,引發(fā)了許多學者的研究興趣。</p><p>  近年來,探索人類行為動力學已經成為復雜系統(tǒng)與復雜網絡中的一個新興的熱點。國際上已有許多工作者做了實證研究,探索人類行為的非泊松特性對網絡傳播、通信等動力學過程的影響,特別是從2005年以來,僅在Nature, PNAS,P

14、RL等強影響因子期刊上就已經有發(fā)表了十余篇文章。在國內,實證方面,2008年6月,上海理工大學課題組的李楠楠、張寧等在《復雜系統(tǒng)與復雜性科學雜志》中發(fā)表了論文《人類動力學基本概念與實證分析》,通過電子郵件及錢學森先生的個人信件記錄,對人類行為偏離泊松統(tǒng)計進行了研究【2】;樊超、郭進利 、韓筱璞、汪秉宏等在《人類行為動力學研究綜述》中總結了人類在通信、訪問網絡、工作和自身生理特征4個方面表現出的時間標度特征和在遷移活動中表現出的空間標度特

15、征【3】;2008年12月,上海交通大學王科、胡海波等人在《復雜系統(tǒng)與復雜性科學雜志》中發(fā)表了論文《中國高校電子郵件網絡實證研究》發(fā)現社團規(guī)模累積分布滿足冪律分布【4】;中國科學技術大學復雜系統(tǒng)課題組的周濤等人與瑞士弗里堡大學合作,研究了電影點播中的人類行為模式以及與個體活動性之間的關系【5】;中國科學技術大學復雜系統(tǒng)課題組、上海理工大</p><p>  1.2 研究目的及意義</p><p

16、>  人類的行為是一種很復雜的現象,要想深刻地了解人類行為的特征,從人類行為動力學形成至今一直是人們堅持不懈努力的方向,它潛在的應用價值吸引了各界人士的關注,包括社會學、心理學、人類學、物理學家等眾多學科的共同關注,不管是群體還是個體的研究,都是社會心理學攻克的主要問題。對人類動力學行為進行研究有助于解決網絡實時通信的擁堵,電子郵件病毒的傳播,謠言的傳播和城市的交通擁堵等。人們觀看電影行為,是人類娛樂的重要行為方式之一,研究人們觀

17、看電影的行為,能夠較好地反映人類自身的行為特征,并為人類行為動力學的研究提供部分理論基礎。本文通過對點播電影的大量統(tǒng)計數據進行實證分析,研究人類個體以及社會群體的行為特征、相互作用。研究的持續(xù)深入,還需我們的繼續(xù)努力,相信不久的明天, 呈現在我們面前的必將是一幅描繪人類行為的五彩斑斕的美麗畫卷。</p><p><b>  1.3研究方法</b></p><p>  

18、論文以電影點播時間特性為依據,通過對大量的人類行為事件進行定量統(tǒng)計分析,研究當中所暗藏的統(tǒng)計性規(guī)律,其次根據所研究的問題,提出假設、分析,進行論證,來探究這些規(guī)律的產生機制和可能的人類行為動力學影響。通過對人們觀看電影時間的記錄,統(tǒng)計兩次觀看電影的時間間隔,分析活躍度并統(tǒng)計分析電影點播次數,用軟件繪制成圖表使讀者一目了然,并對結果產生的機理進行分析。</p><p><b>  2.相關理論知識<

19、/b></p><p><b>  2.1電影點播</b></p><p>  隨著時代進步,人類對于信息存儲方式和質量的要求日漸提高。剛開始,人們沒有文字,就選用一些物體來記錄發(fā)生的重要事件,比如古代波斯人就用繩子或者畫圖來記錄;直到后來人們慢慢有了文字,就逐漸開始使用文字來記錄周邊所發(fā)生的重大事件;經過幾次重大革命之后人類發(fā)明了相機,人們就用照片來記錄人類歷

20、史;到了二戰(zhàn)后期,美籍保加利亞人、物理學家阿塔納索夫發(fā)明了世界第一臺計算機,并隨著計算機的不斷的更新和發(fā)展,互聯(lián)網已經遍及世界的每一個角落,成為一種生活的必需品。在這樣一個計算機引領的時代,每分每秒都有龐大的數據量在互聯(lián)網上傳輸,而這龐大的數據流中又有相當一部分是電子商務的數據,電影點播在線視頻技術發(fā)展,人們觀看最新的影視作品或了解最新電影資訊,只需要輕輕點擊鼠標即可。</p><p>  電影點播采用php+m

21、ysql構建,具有運行速度更快,更安全等特點,運行程序目錄中install.php進行安裝。采用模塊化后臺管理,可輕松管理電影數據,能實現影片等級制度等功能,同時還可實現會員分級制度。支持在線點播,在線下載,在線直播等方式發(fā)布音樂和視頻??山Y合BBS論壇,實現用戶數據庫共享。同時能保存觀看歷史,可以隨時回味曾經看過的精彩影片。用戶收費機制:用戶可分扣點消費,包月消費。其擁有便捷的手機銀行、網上銀行、銀行卡等支付方式,配合程序就能實現時時

22、開通。流量統(tǒng)計功能,該功能可統(tǒng)計出用戶從哪里進入該電影網站。</p><p>  2.2 時間間隔和回復時間</p><p>  從數學角度很容易將人類相繼行為的發(fā)生看作具有特定時間序列的隨機過程, 而人每天要做的大量工作又可以看作源源不斷地到達服務臺的任務。間隔時間和等待時間是排隊理論中的主要指標, 前者決定了輸入過程的類型和性質, 后者反應了服務臺的工作效率, 取決于任務到達系統(tǒng)和接

23、受服務的隨機過程。“ 間隔時間”即連續(xù)兩次相繼行為發(fā)出的時間差, 如連續(xù)兩次發(fā)送電子郵件、借閱圖書、網上購物等行為之間的時間間隔, 反應了人類行為發(fā)生的密度和頻率。而“等待時間”則指某項任務從到達系統(tǒng)直到開始接受服務所經過的時間, 如短信通信中從收到短消息到回復該條短消息所經過的時間、網上交易中從下訂單到發(fā)貨再到收貨之間所經過的時間等等, 又稱為“回復時間”【10】。</p><p>  2.3.泊松分布和冪律分

24、布</p><p>  泊松分布最初是由泊松在最初審判管理案件的工作中引入概率概念時提出的【11】。現在它已被廣泛應用于人類活動的量化模型中,用以描述單位時間內或指定范圍內特定事件出現次數的統(tǒng)計規(guī)律性 ,例如模擬交通流量的模式或事故發(fā)生頻率【12】、商業(yè)話務中心的配置【13】、庫存管理【14】、以及估計移動通信中占線的電話數量【15】。泊松分布是 18-19世紀的法國數學家西莫恩·德尼·泊松(

25、Siméon-Denis Poisson)命名的,并且在21 世紀前,人類的行為分布是以泊松分布為基礎。泊松分布是概率論中常用的一種離散型概率分布。若隨機變量 X 只取非負整數值,取 k 值的概率為:</p><p>  泊松分布 P(λ)中只有一個參數λ,它既是泊松分布的均值,也是泊松分布的方差。</p><p>  非泊松分布泛指除泊松分布以外的所有分布,在人類動力學中極為常

26、見,其中最廣泛、形式最簡單、最具動力學內涵的是冪律分布。人們對冪律分布的研究最早起源于早期對各種語言詞頻的分析中,冪律分布最大的特點是其分布函數的尾部衰減速度遠遠慢于指數函數的各種分布形式,因其尾部的衰減速度非常慢,所以會出現一個胖胖的尾部,因此也常常把冪律分布稱為“胖尾分布”、“胖尾特性”或“重尾分布”。冪律分布的概率密度分布函數的表達式為:P(X)∽X-β,其中冪律指數β的取值范圍常處于1到4之間。</p><p

27、><b>  3.數據說明</b></p><p>  本論文采用的數據來自于Netflixipf網站公開的數據庫,Netflixpf是目前全球最大的在線電影共享系統(tǒng)之一,該數據庫是用戶http://www.netflix.com的在線電影觀看記錄,收集了17770部電影、447139個用戶和接近1億條用戶點播電影時的記錄。數據采集從1999年11月至2005年12月,反映了用戶a給電

28、影e的評分i及觀看時間t,評分的標準為根據觀眾對電影的喜愛程度評出 1.2.3.4.5五個不同的評分等級。需要說明的是用戶的ID是用數字隨機分配的地址。從數據庫提取部分用戶的點播記錄,通過計算出用戶觀看電影的時間間隔。</p><p>  4.個體行為的標度特性</p><p>  4.1 個體用戶活躍度</p><p>  為理解觀看電影用戶行為,我們依據活躍程

29、度來分析用戶對觀看電影的喜愛程度。任意電影點播用戶i的活躍度Ai定義為</p><p><b>  Ai=Ni/T</b></p><p>  其中,Ni 是用戶i在時間T內點播電影的總數目,T是用戶的最早和最晚點播電影的時間間隔。活躍度Ai 的值越大,表示該用戶在單位時間內點播電影的次數越多,表明活躍性越高,用戶電影點播行為越積極。反之,Ai 的值越小,則活躍度越低

30、。</p><p>  圖1 活躍度統(tǒng)計分析圖</p><p>  對11個用戶的活躍度進行統(tǒng)計分析,如圖1。由圖中可知每個用戶的活躍度高低起伏,可見,不同的用戶觀看電影的活躍度不盡相同,3用戶的活躍度最高達到1.4,在100天內該用戶平均觀看了約140部電影,是標準的電影愛好者或影評人員,也有可能是離退休人士,休閑時間充足;10用戶和11用戶的活躍度接近0.5,大部分用戶的活躍度低于0.

31、25;8用戶活躍度最低只有0.02,在100天內該用戶平均只看了2部電影,一定是非電影愛好者,當然有可能是受網絡條件的限制或者學習、活節(jié)奏緊張,生活壓力大,休閑時間少的人士。</p><p><b>  4.2冪律分布研究</b></p><p>  本論文研究了電影點播用戶個體層面連續(xù)兩次點播電影的時間間隔分布。先抽取出多個用戶點播電影的詳細記錄進行統(tǒng)計,以下展示了

32、a、 b 、c 3位個體用戶點播電影時間間隔分布圖像。時間間隔表示為同一個用戶連續(xù)點播電影的時間差,以天為單位,然后對每個時間間隔出現的次數進行了統(tǒng)計,得到頻率次數。畫出橫坐標為時間間隔,縱坐標為相應的頻率次數的雙對數坐標圖。如圖2所示。紅色方點為實證數據,黑色的直線為冪指數的擬合直線,冪指數標度如圖中所標示。</p><p>  (a) (b) </p>

33、;<p><b>  (c) </b></p><p>  圖2 雙對數坐標下a、b、c三個用戶電影點播時間間隔統(tǒng)計圖</p><p>  由圖2所示,不同的用戶有著不同趨勢的擬合直線,冪率標度分別為-0.991、-1.005、-1.228。有著明顯的胖尾分布現象,即三個用戶點播電影的時間間隔滿足冪律分布,具有標度特性,并非經典的時間間隔均勻的泊松分布。

34、每個個體觀看電影的頻繁程度不均勻,有靜默期和暴發(fā)期,體現了該用戶對觀看電影是否喜愛的一個階段表現,也是該段時間有沒有出現受歡迎電影的一個實證,以及他這段時間的工作繁忙程度,有多少空閑時間,都會影響該用戶觀看電影的活躍程度。每一個空閑時段都會迎來一個觀看電影的高峰期。</p><p>  4.3 電影點播時間間隔與次數的實證分析</p><p><b>  圖3</b>

35、;</p><p>  圖3表示為隨機選擇一個用戶從2004年1月21日-2005年12月26日之間觀看所有電影的時間間隔和點播次數進行統(tǒng)計研究的結果。最下排的數字表示為該用戶在這段時間觀看電影的具體天數,共40天,也是點播電影活躍度的一個參數。在規(guī)定的時間內點播電影的次數越多, 點播電影的頻率越大,即說明活躍度越高,點播電影的次數越少,點播電影的頻率越低,即說明活躍度相對較低。圖中菱形方塊所連接的藍色線條表示該

36、用戶在此段時間依次觀看電影的時間間隔,數字為連續(xù)兩次觀看電影時間間隔的統(tǒng)計數值,正方形方塊連接的紅色線條表示該用戶在當天所點播電影的次數,均為實證數據。由圖可知該用戶觀看電影的時間間隔最長間隔為85天,其次45天,在這段時間可能是該用戶工作繁忙的時間范圍,導致觀看電影的活躍度處于低潮期。時間間隔最低為1天,其次為2天、3天,頻繁的在線視頻電影觀看,分析原因可能有兩因素構成:一是該用戶的休閑期,工作、學習壓力較小,能有較多時間駐足于視頻點

37、播網站,如學生的周末或寒暑假,二是該用戶處于在線觀看電影的興趣區(qū)間,這段時間表明該用戶觀看電影的活躍度相對高潮。再看紅色方點,對點播次數進行分析,大多數紅色方點都為1,</p><p><b>  5.結束語</b></p><p>  隨著數據挖掘技術和統(tǒng)計分析技術不斷提升以及理論水平的不斷進步,人們曾經錯誤的認為關聯(lián)不顯著的人類行為卻在通信流量、網絡流量以及計算機

38、指令的監(jiān)控下呈現出標度特性。人類動力學行為分析及行為媒介的研究對信息或病毒的傳播、輿論的形成和傳播以及對他人想法的影響均有著不可替代的地位。近些年來數據庫技術的發(fā)展和多學科學者的共同努力,使得人類動力學成為復雜性科學中非?;钴S的一個新興科學領域,很大程度上拓寬了對復雜性科學研究領域的視野,逐步顯示出廣泛的應用前景。目前在該領域已經初步形成了若干類基本研究范式。本論文主要針對個體行為在線電影點播的實證數據進行統(tǒng)計研究,研究了個體的觀看電影

39、活躍度、觀看電影時間間隔統(tǒng)計規(guī)律滿足冪律分布具有標度特性,最后分析了個體電影點播次數,并分析其發(fā)生的可能機理。雖粗略完成,但仍然有很多的不足需要加強,不管是厚度還是深度都有待更一步的提高。人類行為動力學有著很高的應用價值,受到了許多領域學者的關注,目前已經出現了百家爭鳴的局面,但仍還有很多空白領域等待著大家的研究。</p><p><b>  參考文獻</b></p><

40、p>  [1] Barabási A-L. The origin of bursts and heavy tails in human dynamics[J]. Nature,2005,435(7039): 207 - 211.</p><p>  [2] 李楠楠,周濤,張寧.人類動力學基本概念與實證分析[J].復雜系統(tǒng)與復雜性科學COMPLEX SYSTEMS AND COMPLEXITY

41、SCIENCE,2008,5(2) </p><p>  [3] 韓筱璞,周濤,汪秉宏, 基于自適應調節(jié)的人類動力學模型, 復雜系統(tǒng)與復雜性科學 4(4), (2007) 1.</p><p>  [4] 王科,胡海波,汪小帆.中國高校電子郵件網絡實證研究[J]. 復雜系統(tǒng)與復雜性科學COMPLEX SYSTEMS AND COMPLEXITY SCIENCE,2008,5(4).&l

42、t;/p><p>  [5] 周濤.在線電影點播中的人類動力學模式[J].復雜系統(tǒng)與復雜性科學,2008 ,5(1) </p><p>  [6] 李平,汪秉宏.證劵指數的網絡動力學模型[J].系統(tǒng)工程,2006,24(3).</p><p>  [7]曹盼盼,閻春寧.人類通信模式的冪律分布和Zipf定律[J].復雜系統(tǒng)與復雜性科學COMPLEX SYSTEMS AND

43、 COMPLEXITY SCIENCE,2009,6(4)..</p><p>  [8] 樊瑛,狄增如,何大韌.探討社會網絡理論與分析的幾個問題[J].復雜系統(tǒng)與復雜性科學,2010,7(2-3).</p><p>  [9] 司夏萌,劉云.虛擬社區(qū)中人際交互行為的統(tǒng)計分析研究[C].物理學報Acta Phys.sin.,2011</p><p>  [10] 郭

44、進利.論壇網絡演化模型[D]. 上海理工大學管理學院.</p><p>  [11] Poisson S D. Recherches sur la Probabilitédes Jugements en Matière Criminelle et en Matière Civile, Précédées des RèglesGén&#

45、233;rales du Calcul des Probabilités[M ]. Paris: Imp rimeur2L ibraire pour lesMathematiques, 1837.</p><p>  [12] Haight F A. Handbook of the Poisson Distribution[M ]. New York: JohnWiley and Sons, 1967.

46、</p><p>  [13] Reynolds P. Call Center Staffing: The Comp lete, Practical Guide to Workforce Management [ S ]. Lebanon: The Call CentreSchool Press, 2003.</p><p>  [14] Greene J H. Production an

47、d Inventory Control Handbook[M ]. 3 rd ed. New York: McGraw2Hill, 1997.</p><p>  [15] Anderson H R. Fixed BroadbandWireless System Design[M ]. New York: Wiley, 2003.</p><p><b>  致謝</b&g

48、t;</p><p>  本次論文在選題及研究過程中得到劉XX老師的親切關懷和悉心指導下完成的。劉老師嚴肅的科學態(tài)度,嚴謹的治學精神,精益求精的工作作風,深深地感染和激勵著我。從課題的選擇到項目的最終完成,劉老師都始終給予我細心的指導和不懈的支持。劉老師不僅在學業(yè)上給我以精心指導,同時還在思想、生活上給我以無微不至的關懷。在此,對劉老師敬上誠摯的謝意。同時也感謝在此次論文創(chuàng)作中給與我?guī)椭呐笥褌儯斘矣龅嚼щy的時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論