簡介:第二章高級語言及其語法描述,第二章高級語言及其語法描述,本章概述高級語言的結(jié)構(gòu)和主要的共同特征,并介紹程序語言的語法描述方法。要學(xué)習(xí)和構(gòu)造編譯程序,理解和定義高級語言是必不可少的。21程序語言的定義任何語言實現(xiàn)的基礎(chǔ)是語言的定義。在定義方面,編譯程序研制者與一般用戶有所不同,他們對那些構(gòu)造允許出現(xiàn)更感興趣。即使一時不能看出某種構(gòu)造的實際應(yīng)用,或者判斷實現(xiàn)該結(jié)構(gòu)會導(dǎo)致嚴(yán)重的困難,但仍必須嚴(yán)格根據(jù)語言的定義實現(xiàn)它。程序語言主要由語法和語義兩方面定義。,第二章高級語言及其語法描述,,211語法任何語言程序都可以看成是一定字符集(稱為字母表)上的字符串(有限序列)。但是什么樣的字符串才算是一個合適的程序呢所謂一個語言的語法是指這樣的一組規(guī)則,用它可以形成和產(chǎn)生一個合適的程序。這些規(guī)則一部分稱為詞法規(guī)則,另一部分能稱為語法規(guī)則(或產(chǎn)生規(guī)則)。,第二章高級語言及其語法描述,,注意這里提到三個概念A(yù)一個程序只是用一個有限字符集作為字母表;B詞法規(guī)則是指單詞符號的形成規(guī)則。單詞符號一般包括各類型的常數(shù)、標(biāo)識符、基本字、算符和界符等。C語言的語法規(guī)則規(guī)定了如何從單詞符號形成更大的結(jié)構(gòu)(即語法單位),換言之,語法規(guī)則是語法單位的形成規(guī)則。一般程序語言的語法單位有表達(dá)式、語句、分程序、函數(shù)、過程和程序等。,第二章高級語言及其語法描述,,212語義對于一個語言來說,不僅要給出它的詞法、語法規(guī)則,而且要定義它的單詞符號和語法單位的意義。這就是語義問題。語義是指這樣的一組規(guī)則,使用它可以定義一個程序的意義。我們采用的方法為基于屬性文法的語法制導(dǎo)翻譯方法。,第二章高級語言及其語法描述,,一個程序語言的基本功能是描述數(shù)據(jù)和對數(shù)據(jù)的運算。所謂程序,從本質(zhì)上來說是描述一定數(shù)據(jù)的處理過程。在現(xiàn)今的程序語言中,一個程序大體可以視為下面所示的層次結(jié)構(gòu),,,,,程序,,子程序,或,分程序,,語句,,表達(dá)式,,數(shù)據(jù)引用,算符,函數(shù)調(diào)用,,,,,第二章高級語言及其語法描述,,自上而下看上述層次結(jié)構(gòu)頂端是程序本身,他是一個完整的執(zhí)行單位。一個程序通常是由若干個子程序或分程序組成的,他們常常含有自己的數(shù)據(jù)(局部名)。子程序或分程序是由于語句組成的。而組成語句的成分是個種類型的表達(dá)式。表達(dá)式是描述數(shù)據(jù)運算的基本結(jié)構(gòu),它通常含有數(shù)據(jù)引用、算符和函數(shù)調(diào)用。,第二章高級語言及其語法描述,,自下而上看上述層次結(jié)構(gòu)我們希望通過對下層成分的了解掌握上層成分,從而掌握整個程序。在學(xué)習(xí)編譯原理的過程中特別注意程序語言的每個組成成分都有(抽象的)邏輯和計算機(jī)實現(xiàn)兩方面的意義。當(dāng)從數(shù)學(xué)上考慮每一個組成成分時,我們注重它的邏輯意義,當(dāng)從計算機(jī)這個角度來看時,我們注重他在機(jī)內(nèi)的表示和實現(xiàn)的可能性與效率。,第二章高級語言及其語法描述,,22高級語言的一般特性221高級語言的分類;A強(qiáng)制式語言過程式語言(命令驅(qū)動、面向語句,如PASCALC等)B應(yīng)用式語言函數(shù)式語言(如LISP)C基于規(guī)則的語言邏輯型設(shè)計語言(如PROLOG)D面向?qū)ο笳Z言支持封裝、多態(tài)、繼承222幾種程序的典型結(jié)構(gòu);,第二章高級語言及其語法描述,,FORTRANMAINENDSUBROUTINESUB1ENDSUBROUTINESUBNEND,一FORTRAN一個FORTRAN程序有一個主程序段和若干個(可以是0個)輔助程序段組成。如右側(cè)),第二章高級語言及其語法描述,,輔助程序段可以是子程序、函數(shù)段或數(shù)據(jù)。每程序段由一系列說明語句和執(zhí)行語句組成。各程序段可以獨立編輯。這對模塊設(shè)計甚為方便。一個FORTRAN程序個程序段所定義的各種名字通常是彼此獨立的。同一個標(biāo)識符在不同的程序段中一般都可以代表不同的名字,即代表不同的存儲單元,個程序段對它們的引用或賦值是彼此無關(guān)的。但是,不同程序段里的同名公用塊(COMMONBLOCK卻代表同一個存儲區(qū)域。因此,出現(xiàn)在COMMON語句中的名字所代表的單元在其他程序塊中也可以引用。所以說,公用區(qū)具有全局性。不出現(xiàn)在COMMON中的名字所代表的單元具有局部性。,第二章高級語言及其語法描述,,二PASCALPASCAL是一個允許子程序嵌套定義的語言。一個PASCAL程序可以看作是操作系統(tǒng)調(diào)用的一個子程序,而子程序中又可以定義別的子程序。,PROGRAMMAINPROCEDUREP1PROCEDUREP11BEGINENDBEGINENDPROCEDUREP2BEGINENDBEGINEND,第二章高級語言及其語法描述,,PASCAL這種嵌套結(jié)構(gòu)中允許同一標(biāo)識符在不同的子程序段中表示不同的名字。關(guān)于名字的作用域的規(guī)定是A一個在子程序B1中說明的名字X只在B1中有效(局部于B1)。B如果B2是B1的一個內(nèi)層子程序,且B2中對標(biāo)識符X沒有新的說明,則原來的名字X在B2中仍然有效。如果B2對X重新作了說明,那么,B2中對X的任何引用都是指重新說明過的這個X。,第二章高級語言及其語法描述,,223數(shù)據(jù)類型與操作;一個數(shù)據(jù)類型通常包括以下三種要素A用于區(qū)別這種類型的數(shù)據(jù)對象的屬性B這種類型的數(shù)據(jù)對象可以具有的值C可以作用于這種類型數(shù)據(jù)對象的操作一、初等數(shù)據(jù)類型常見的初等數(shù)據(jù)類型有A數(shù)值數(shù)據(jù)B邏輯數(shù)據(jù)C字符數(shù)據(jù)D指針類型,第二章高級語言及其語法描述,,指針是指這樣一種類型的數(shù)據(jù),他們的值指向另一些數(shù)據(jù)。一般意義是,假定P是一個指針,PADDRX意味著P將指向X,或說P的值將是變量X的地址。有些語言用P↑表示指針P的內(nèi)容。在PADDRX的情況下,如令P↑03,則意味著X的值是03,第二章高級語言及其語法描述,,用計算機(jī)術(shù)語來說,名字可以看成是代表一個抽象的存儲單元,這個單元可包含一位、一字節(jié)、一字或相繼的許多個字。而這個單元的內(nèi)容則認(rèn)為是此名字的值。名字的值就是它所表示的對象。此外,我們還必須指出名字的屬性。一個名字的屬性包括類型和作用域。名字的類型決定了它能具有什么樣的值,值在計算機(jī)內(nèi)的表示方式,以及對他能施加什么運算。名字的作用域規(guī)定了他的值存在范圍。,第二章高級語言及其語法描述,,二、數(shù)據(jù)結(jié)構(gòu)許多程序語言提供了一種由初級數(shù)據(jù)定義復(fù)雜數(shù)據(jù)的手段。下面我們將概述其中常見的定義方式A數(shù)組從邏輯上說,一個數(shù)組是由同一類型數(shù)據(jù)所組成的某種N維矩形結(jié)構(gòu)。沿著每一維的距離稱為一個下標(biāo)。數(shù)組的每個元素是矩形結(jié)構(gòu)中的一個點,它的位置可通過給出每維的下標(biāo)來確定。,第二章高級語言及其語法描述,,數(shù)組的每個元素(也稱為下標(biāo)變量)是由數(shù)組名連同各維的下標(biāo)值命名的。如A(I1,I2,IN)。根據(jù)數(shù)組的類型,每個數(shù)組元素在計算機(jī)中占有同樣大小的存儲空間。如果一個數(shù)組所需的存儲空間大小在編譯時就已知道則稱此數(shù)組是一個確定數(shù)組;否則稱為可變數(shù)組。,第二章高級語言及其語法描述,,數(shù)組的存儲表示有多種形式,最簡單的一種是把整個數(shù)組按行(或按列)存放在一片連續(xù)存儲區(qū)中。數(shù)組元素的地址計算和數(shù)組的存儲方式密切相關(guān)。關(guān)于數(shù)組元素的地址計算公式,數(shù)據(jù)結(jié)構(gòu)教材中有詳細(xì)的介紹。編譯程序要做的就是實現(xiàn)地址計算公式,使數(shù)組元素得到正確的引用。在編譯過程中,當(dāng)碰到數(shù)組說明時,必須把數(shù)組的有關(guān)的信息記錄在一個“內(nèi)情向量”之中,以便以后計算數(shù)組元素的地址時引用這些信息。每個數(shù)組的內(nèi)情向量必須包括維數(shù),各維的上下限,首地址,以及數(shù)組元素的類型等。,第二章高級語言及其語法描述,,B記錄從邏輯上說,記錄結(jié)構(gòu)是由已知類型的數(shù)據(jù)組合起來的一種結(jié)構(gòu)。記錄結(jié)構(gòu)是許多程序語言的一類重要的數(shù)據(jù)結(jié)構(gòu)。不同語言定義記錄結(jié)構(gòu)的方式也不同。如PASCAL語言采用下面形式定義記錄CARDRECORDNAMEARRAY120OFCHARAGEINTEGERMARRIEDBOOLEANEND,第二章高級語言及其語法描述,,這說明定義了一個記錄CARD它是一個含有三個分量的記錄結(jié)構(gòu)NAME,字符數(shù)組;AGE,整型量;MARRIED,布爾量。記錄結(jié)構(gòu)的每個分量(域)所需占用的存儲單元(字節(jié))數(shù),成為該域的長度。當(dāng)知道一個記錄的地址后,通過每個域的長度就可算出個域的地址,因為我們?nèi)菀淄瞥雒總€域相對于記錄結(jié)構(gòu)起點的相對數(shù)OFFSET此域之前各域長度的總和。,第二章高級語言及其語法描述,,如就CARD而言,NAME,AGE,MARRIED的相對數(shù)OFFSET分別為0、20、24。于是,假定CARD的首地址為A,那么,CARDNAME地址為ACARDAGE地址為A20CARDMARRIED地址為A24,第二章高級語言及其語法描述,,224語句與控制結(jié)構(gòu)一、表達(dá)式一個表達(dá)式是由運算量(亦稱操作數(shù),即數(shù)據(jù)引用或函數(shù)調(diào)用)和算符組成的。對于大多數(shù)程序語言來說,表達(dá)式的形成規(guī)則可概括為(1)變量(包括下標(biāo)變量)、常數(shù)是表達(dá)式;(2)若E1、E2為表達(dá)式,Θ為二元算符,則E1ΘE2為表達(dá)式;(3)若E為表達(dá)式,Θ為一元算符,則ΘE為表達(dá)式;(4)若E為表達(dá)式,則(E是表達(dá)式。,第二章高級語言及其語法描述,,在多數(shù)語言中算術(shù)算符和邏輯算符的優(yōu)先順序一般規(guī)定如下乘冪(或↑)一元負(fù)()乘、除(,/,÷)加、減(,)關(guān)系符(,,非(﹁,NOT,或NOT與(∧,S→ASB|AB,第二章高級語言及其語法描述,,為了對句子結(jié)構(gòu)進(jìn)行確定性分析,我們往往只考慮最左推導(dǎo)或最右推導(dǎo)。所謂最左推導(dǎo)是指任何一步???都是對?中的最左非終結(jié)符進(jìn)行替換的。同樣,可定義最右推導(dǎo)。,第二章高級語言及其語法描述,,232語法分析樹與二義性前面我們提到過可以用一張圖表示一個句型的推導(dǎo),這種表示稱為語法分析樹,或簡稱語法樹。語法樹的根結(jié)由開始符號所標(biāo)記。隨著推導(dǎo)的展開,當(dāng)某個非終結(jié)符被它的某個候選式所替換時,這個非終結(jié)符的相應(yīng)結(jié)就產(chǎn)生了下一代新結(jié)。每個新結(jié)和其父親結(jié)間都有一條連線。在一棵語法樹生長過程中的任何時刻,所有那些沒有后代的端末結(jié)自左至右排列起來就是一個句型。,第二章高級語言及其語法描述,例如對于文法(21關(guān)于(III的推導(dǎo)形成語法樹如圖22,,,,圖22語法樹,第二章高級語言及其語法描述,,一個句型是否只對應(yīng)唯一的一棵語法樹呢也就是說它是否只有唯一的一個最左(最右推導(dǎo)呢不盡然。如文法21,關(guān)于(III就存在一個與22非常不同的推導(dǎo)E??E?EE?IE?IEE?IIE?III其對應(yīng)語法樹,,第二章高級語言及其語法描述,,圖22與圖23的不同之處在于從第二代三代過渡開始。對于前者,我們選用規(guī)則E→EE,而后者我們選用E→EE。這里不是同代兄弟生兒子的先后次序的不同而是生什么兒子的不同,后面的這個不同是本質(zhì)上的的差異。這意味著我們可以用兩種完全不同的辦法產(chǎn)生同一個句子。,第二章高級語言及其語法描述,,如果一個文法存在某個句子對應(yīng)兩棵不同的語法樹,則稱這個文法是二義的。也就是說,若一個文法存在某個句子,它有兩個不同的最左(最右推導(dǎo),則這個文法是法是二義的。最后,作為描述程序語言的上下文無關(guān)文法,我們對它有幾點限制。(1)文法中不含任何下面形式的產(chǎn)生式P→P因為這種產(chǎn)生式除了產(chǎn)生二義性外沒有任何用處。,第二章高級語言及其語法描述,,(2)每個非終結(jié)符P必須有用處。這一方面意味著,必須存在含P的句型;也就是,從開始符號出發(fā),存在推導(dǎo)S??P?另一方面意味著,必須存在終結(jié)符串??VT,使得P??;也就是,對于P不存在永不終結(jié)的回路。我們以后所討論的文法均假定滿足上述兩條件。,第二章高級語言及其語法描述,,233形式語言鳥瞰喬姆斯基把文法分為四種類型即0型、1型、2型、3型。0行強(qiáng)于1型,1行強(qiáng)于2型,2型強(qiáng)于3型。這幾文法的差別在于對產(chǎn)生式施加不同的限制。我們說GVT,VN,S,?是一個0型文法,如果它的每個產(chǎn)生式???是這樣的結(jié)構(gòu)??VN?VT且至少有一個非終結(jié)符,而??VN?VT。0型文法也稱短語文法。,第二章高級語言及其語法描述,,如果對0型文法分別施加以下的第I條限制,則我們就得到第I型文法1G的任何產(chǎn)生式???均滿足|?|≤|?|(其中|?|和|?|分別為?和?的長度;僅S??例外,但S不得出現(xiàn)在任何產(chǎn)生式的右部。2)G的任何產(chǎn)生式為A??,A?VN,??VN?VT。3G的任何產(chǎn)生式為A??B或A??,其中??VT,A、B?VN。其中1型文法也稱上下文有關(guān)文法。這種文法意味著,對非終結(jié)符進(jìn)行替換式務(wù)必考慮上下文并且一般不允許替換成空串?。,第二章高級語言及其語法描述,,2型文法也稱上下文無關(guān)文法,注意其語言定義G的任何產(chǎn)生式為A→Β,A∈VN,Β∈(VN∪VT表明凡出現(xiàn)在產(chǎn)生式左邊的符號都是非終結(jié)符。3型文法也稱右線性文法。3型文法還有另一種形式,稱左線性文法一個文法G為左線性文法,如果G的任何產(chǎn)生式為A→B?或A→?,其中?∈VT,A、B∈VN由于3型文法等價于正規(guī)式所以也稱正規(guī)文法。,第二章高級語言及其語法描述,例題與習(xí)題解答,例21試構(gòu)造生成語言L{ANBNCI|N?1,I?0}的文法解GZZ?ABA?AAB|ABB?CB|?例22已知語言L{ANBBN|N?1},寫出產(chǎn)生L的文法。,,,第二章高級語言及其語法描述,,解GSS?AABA?AAB|B例23已知文法G{A,B,C},{A,B,C},A,P其中產(chǎn)生式P由以下組成A?ABCA?ABBCBB?BBBC?CBCCBC?CBAC?AABAC?AA問此文法表式的語言是什么,第二章高級語言及其語法描述,,解由于A為開始符。由于A?ABBC?ABBC?ABCBCC?ACBBCC?AABBCC語言為{ANBNCN,N0}例24試構(gòu)造語言L{ANBNCI|N1,I0}的文法。解GZZ?ABA?AAB|ABB?CB|?,第二章高級語言及其語法描述,,例25試寫一文法,使其描述的語言LG是能被5整除的整數(shù)集合。解GZZ?|A0|5A?0|1|2|3|4|5|6|7|8|9|AA例26已知語言L{X|X?{A,B,C},且X重復(fù)排列是對稱的(AABCBAA,AABBAA,等寫出該語言的文法。解GZZ?AZA|BZB|CZC|A|B|C|?,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 53
大?。?0.24(MB)
子文件數(shù):
簡介:基于自舉學(xué)習(xí)與指代消解的人物家庭網(wǎng)絡(luò)構(gòu)建研究,作者顧靜航、胡亞楠、錢龍華、朱巧明報告人胡亞楠蘇州大學(xué)自然語言處理實驗室,主要內(nèi)容,研究動機(jī)相關(guān)工作研究方法評價方法實驗結(jié)果展望,研究動機(jī),社會關(guān)系網(wǎng)絡(luò)在當(dāng)今信息化社會中具有重要的作用,社會關(guān)系網(wǎng)絡(luò)的分析和應(yīng)用可以提高人們的生活質(zhì)量和生活效率。家庭是人類社會最基本的組成單位,因而家庭網(wǎng)絡(luò)是社會網(wǎng)絡(luò)中的核心部分。傳統(tǒng)的社會關(guān)系網(wǎng)絡(luò)分析SOCIALNETWORKANALYSIS,SNA著眼于以人為個體,考察個體在網(wǎng)絡(luò)中的作用,忽略了家庭作為一個整體對社會網(wǎng)絡(luò)的影響。本文從構(gòu)建家庭網(wǎng)絡(luò)入手,挖掘豐富的人物家庭關(guān)系,為構(gòu)造大規(guī)模的社會關(guān)系網(wǎng)絡(luò)打下基礎(chǔ)。,相關(guān)工作,自舉學(xué)習(xí)HEARST1992基于模式匹配來抽取“ISA”關(guān)系PANTEL等2006ESPRESSO,解決模式和實例的可信度問題姚從磊等2007采用模擬退火算法發(fā)現(xiàn)網(wǎng)頁中蘊涵的人物社會關(guān)系社會關(guān)系網(wǎng)絡(luò)KAUTZ等1997REFERRALWEB,利用人名共現(xiàn)實現(xiàn)社會網(wǎng)絡(luò)挖掘MIKA等2005同REFERRALWEB,包括WEB網(wǎng)頁和用戶電子郵件,相關(guān)工作續(xù),社會關(guān)系網(wǎng)絡(luò)續(xù)唐杰等2008ARNETMINER,建立學(xué)術(shù)人物之間的社會關(guān)系網(wǎng)絡(luò)ELSON等2010、AGARWAL等2012對小說中人物的社會關(guān)系網(wǎng)絡(luò)進(jìn)行了研究,提出了隱式社會關(guān)系的概念CAMP和BOSCH等2011從人物自傳中提取帶有情感極性的人物社會關(guān)系ZHU等2009STATSNOWBALL,采用自舉方法進(jìn)行人物社會關(guān)系的抽取,融合概率模型和馬爾科夫邏輯網(wǎng)絡(luò)等方法,實現(xiàn)“微軟人立方”,研究方法,基于自舉學(xué)習(xí)的人物家庭關(guān)系抽取家庭關(guān)系定義“PARENTCHILD”和“HUSBANDWIFE”。為了便于自舉過程的進(jìn)行,“PARENTCHILD”關(guān)系類型又被細(xì)分為“FATHERSON”、“FATHERDAUGHTER”、“MOTHERSON”和“MOTHERDAUGHTER”自舉學(xué)習(xí)過程模式發(fā)現(xiàn)模式評估實例發(fā)現(xiàn)實例評估,模式發(fā)現(xiàn)給定種子“江澤民,王冶坪”抽取出文本“中國國家主席江澤民的夫人王冶坪今天下午”抽取模式,得“的夫人”,研究方法續(xù),研究方法續(xù),模式評估采用PMI衡量模式P與人物對{X,Y}之間的關(guān)聯(lián)強(qiáng)度定義模式P的可信度為RΠP,它與每個實例I的平均關(guān)聯(lián)程度有關(guān),研究方法續(xù),實例發(fā)現(xiàn)利用已有模式發(fā)現(xiàn)實例如模式“的夫人”可以得到句子“中國國務(wù)院總理李鵬的夫人朱琳8日上午來到”進(jìn)行分詞、人名識別,可以發(fā)現(xiàn)新的夫妻關(guān)系實例“李鵬,朱琳”。,研究方法續(xù),實例評估定義實例I的可信度為RLI,它與每個模式P的平均關(guān)聯(lián)程度有關(guān)PMI方法對于低頻事件有偏向性,所以引入打折因子,,研究方法續(xù),基于指代消解的人物家庭網(wǎng)絡(luò)融合人名精確匹配在不同的人物對中按照人名進(jìn)行字符串精確匹配,將具有相同名稱的人名作為連接點,通過連接點將不同的人物對聯(lián)系起來,形成初始家庭。重名消岐在人名精確匹配的基礎(chǔ)上,以文檔的全局實體特征作為人名特征,計算同名人物之間的余弦相似度,將相似度低于某一閥值的同名人物從初始家庭中分離出去。多名聚合在家庭內(nèi)部采用最小編輯距離的方法進(jìn)行人物的多名聚合,當(dāng)人名之間的相似度大于某一閥值時,將它們歸入同一指代鏈,并形成最終家庭。,研究方法續(xù),在進(jìn)行人物家庭網(wǎng)絡(luò)構(gòu)建時,即需要將擁有相同名稱的不同人物歸入各自的指代鏈,又需要將指向同一人物的多個名稱歸入同一條指代鏈,研究方法續(xù),例子A“,卡恩的妻子西蒙娜卻站出來維護(hù)自己的丈夫,說”B“,巴博的妻子西蒙娜當(dāng)日早些時候在執(zhí)政黨明確表示,法國并沒有在”C“尼日利亞國家元首阿巴查的夫人瑪麗亞姆?阿巴查26日在接受本社記者采訪”D“尼日利亞國家元首阿巴查和夫人瑪利亞姆?阿巴查、外交部長”E“這些人員中主要包括阿巴查的兒子穆罕默德?阿巴查和商人”,研究方法續(xù),以上5個例句分別來源于5篇不同的文檔其中A與B中的“西蒙娜”為不同的人物,因而A與B中的夫妻關(guān)系不同C中的“瑪麗亞姆?阿巴查”與D中的“瑪利亞姆?阿巴查”則是指同一個人,C與D中的夫妻關(guān)系相同A、B中的人物不能構(gòu)建成一個家庭C、D中的夫妻以及E中的父子可以構(gòu)建成一個家庭。,評價方法,關(guān)系抽取性能評價其中,C為抽取結(jié)果中正確的實例數(shù)目,T為系統(tǒng)抽取出的實例總數(shù)。指代消解評價方法BCUBE,,評價方法續(xù),其中,RESPONSEEI指包含名稱I的輸出鏈的中全部的元素個數(shù),RIGHTRESPONSEEI指包含名稱I的輸出鏈中正確的元素個數(shù),KEYEI指包含名稱I的參照輸出鏈中的全部元素個數(shù)??缥谋局复庹w性能的計算公式為其中,WI采用等分權(quán)值1/N。,評價方法續(xù),家庭網(wǎng)絡(luò)評價方法其中,POSITIVE為系統(tǒng)構(gòu)建的正確的家庭數(shù)目,RETAINED為系統(tǒng)構(gòu)建的家庭總數(shù),STANDARD為標(biāo)準(zhǔn)集中的家庭數(shù)目。,實驗結(jié)果,實驗語料及預(yù)處理采用GIGAWORD中文語料庫作為家庭網(wǎng)絡(luò)構(gòu)建的實驗數(shù)據(jù),共有1,033,679篇新聞報道,將其導(dǎo)入SOLR,以WEB方式進(jìn)行檢索。在進(jìn)行人物家庭網(wǎng)絡(luò)構(gòu)建時,在人物關(guān)系抽取的基礎(chǔ)上選取人名精確匹配的結(jié)果作為基準(zhǔn)系統(tǒng)。然后在基準(zhǔn)系統(tǒng)的基礎(chǔ)上進(jìn)行人工標(biāo)注,將存在錯誤的指代鏈與家庭進(jìn)行人工校正,這樣就獲得了指代鏈和家庭網(wǎng)絡(luò)的標(biāo)準(zhǔn)集。,實驗結(jié)果續(xù),關(guān)系抽取性能,實驗結(jié)果續(xù),指代消解性能,實驗結(jié)果續(xù),家庭網(wǎng)絡(luò)性能,實驗結(jié)果續(xù),構(gòu)建的示例家庭,展望,下一步的工作主要先考慮如何進(jìn)一步的擴(kuò)大家庭數(shù)目,提高召回率。如何考量不同家庭之間的關(guān)系,進(jìn)行連接,拓展家庭網(wǎng)絡(luò)??紤]如何使用依存句法樹來進(jìn)行人物關(guān)系的拓展。,THANKYOU,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 24
大?。?0.55(MB)
子文件數(shù):
簡介:第一章JAVA語言概述,西南科技大學(xué)網(wǎng)絡(luò)教育系列課程,什么是高級語言,計算機(jī)語言是計算機(jī)可以識別的語言,用于描述解決問題的方法,供計算機(jī)理解和執(zhí)行。,計算機(jī)語言的發(fā)展,機(jī)器語言由計算機(jī)硬件系統(tǒng)可以識別的二進(jìn)制指令組成的語言。執(zhí)行效率非常高,但與人的自然語言間鴻溝巨大,難懂、難記,軟件開發(fā)難度大。,匯編語言將機(jī)器指令映射為一些可以被人讀懂的助記符。與人的自然語言間的鴻溝略有縮小,但仍然不太好懂,要考慮大量機(jī)器細(xì)節(jié),制約軟件開發(fā)。,高級語言屏蔽了機(jī)器的細(xì)節(jié),提高了語言的抽象層次,程序中可以采用具有一定含義的數(shù)據(jù)命名和容易理解的執(zhí)行語句。與人的自然語言較為接近,便于聯(lián)系到程序所描述的具體事物,便于理解和記憶,大大豐富了軟件開發(fā)。高級語言有嚴(yán)格的語法規(guī)則常見的高級語言JAVAC/CBASICPASCALFORTRAN,“高級”是相對的,JAVA語言的起源及發(fā)展,1991年由JAMESGOSLING負(fù)責(zé)開發(fā)的一個分布式代碼系統(tǒng)OAK,最初是為家用消費電子產(chǎn)品電冰箱、電視機(jī)等進(jìn)行編程控制。1993年SUN公司將目標(biāo)市場轉(zhuǎn)向INTERNET。1994年將OAK語言更名為JAVA。1995年JAVA做的瀏覽器HOTJAVA被正式發(fā)布。1996年初,JAVA10正式發(fā)布。從JAVA12開始叫JAVA2,目前是15版本又叫JAVA5。,JAVA目前的主要應(yīng)用面向?qū)ο蟮膽?yīng)用開發(fā)面向網(wǎng)絡(luò)的軟件開發(fā),特別是客戶端和服務(wù)器資源間通信的中間件開發(fā)動態(tài)畫面的設(shè)計,包括圖形圖像的調(diào)用嵌入式系統(tǒng)開發(fā)企業(yè)解決方案,JAVA不是萬能的,JAVA語言的特點,平臺無關(guān)性將源程序編譯成一種結(jié)構(gòu)中立的中間文件格式,只要有JAVA運行系統(tǒng)的機(jī)器都能執(zhí)行這種中間代碼。,高級語言程序的執(zhí)行使用高級語言編寫的程序文件稱為源文件,這些源文件是不能被機(jī)器直接執(zhí)行的。翻譯程序把源文件翻譯成機(jī)器指令,然后計算機(jī)才能理解并執(zhí)行程序。兩種翻譯方式編譯方式翻譯完全部源程序再執(zhí)行解釋方式翻譯一句,執(zhí)行一句,針對具體處理器,JAVA語言有其特殊的執(zhí)行方式半編譯,半解釋。JAVA語言不針對具體的處理器進(jìn)行編譯。JAVA編譯器把源文件編譯成中間代碼文件,稱為字節(jié)碼文件。字節(jié)碼可以被任何提供JAVA運行環(huán)境的平計算機(jī)系統(tǒng)解釋執(zhí)行。JAVA運行環(huán)境會根據(jù)不同的計算機(jī)系統(tǒng),把字節(jié)碼解釋成相應(yīng)的處理器的機(jī)器指令。,面向?qū)ο笸耆敲嫦驅(qū)ο蟮模涿嫦驅(qū)ο竽芰Ρ举|(zhì)上與C一樣。面向?qū)ο缶幊淌且环N先進(jìn)的編程思想,更加容易解決復(fù)雜的問題。,多線程內(nèi)置多線程功能,使得在一個程序里可同時執(zhí)行多個小任務(wù)。帶來的好處是更好的交互性和實時控制性。,安全性JAVA代碼的執(zhí)行會比其他語言代碼更安全。JAVA語言提供的安全,比如APPLET。,動態(tài)性允許程序動態(tài)地裝入運行過程中所需要的類,這是C等語言進(jìn)行面向?qū)ο蟪绦蛟O(shè)計所無法實現(xiàn)的。,JAVA的工作機(jī)制,,平臺無關(guān)的保證,JAVA虛擬機(jī)JVMJVM是“一臺真正的機(jī)器上用軟件方式實現(xiàn)的一臺假想機(jī)”,是實現(xiàn)平臺無關(guān)性的基礎(chǔ)虛擬機(jī)包含類加載器、字節(jié)碼校驗器、以及JIT實時編譯器類加載器用來取得從網(wǎng)絡(luò)或本地的類文件字節(jié)碼校驗器確認(rèn)類文件是否有正確的格式JIT使虛擬機(jī)能提高到編譯式的運行效率,解釋執(zhí)行編譯后的字節(jié)碼,對字節(jié)碼進(jìn)行安全檢查是JVM的兩大功能,JAVA平臺,三種平臺簡介J2SE稱為JAVA標(biāo)準(zhǔn)版或JAVA標(biāo)準(zhǔn)平臺針對桌面開發(fā)以及低端商務(wù)計算體現(xiàn)JAVA的主要技術(shù),基礎(chǔ),適合教學(xué)J2EE稱為JAVA企業(yè)版或JAVA企業(yè)平臺利用JAVA平臺來簡化企業(yè)解決方案的開發(fā)、部署和管理相關(guān)的體系結(jié)構(gòu)J2ME稱為JAVA微型版或JAVA小型平臺針對消費產(chǎn)品和嵌入設(shè)備軟件的開發(fā),安裝J2SE平臺目前SUN公司已發(fā)布了SDK的15版本JAVA2SDK簡介J2SDK提供了調(diào)試及運行一個JAVA程序所必需工具的和庫J2SDK版本與JAVA版本一致,最新版本為J2SDK15安裝JAVA2SDK雙擊下載的安裝文件即可官方下載地址HTTP//JAVASUNCOM/J2SE/150/DOWNLOADJSP,如果安裝SDK選擇安裝到E\JDK15目錄下,則會生成如左圖的目錄結(jié)構(gòu)設(shè)置環(huán)境變量PATH“JAVAC和JAVA命令所在的目錄”CLASSPATH“存放字節(jié)碼文件的目錄”,僅安裝JRE如果只需要運行JAVA程序可以只安裝JAVA運行環(huán)境JRE官方下載地址HTTP//JAVASUNCOM/J2SE/150/DOWNLOADJSP,JAVA程序開發(fā),JAVA程序結(jié)構(gòu)至多有一個PUBLIC類,程序文件名必須與該類的類名相同程序可以有一個或多個其它類當(dāng)需要從某個類繼承或使用某個類及其方法時,使用IMPORT引入該類的定義,開發(fā)工具文本編輯器,如“記事本”,適合初學(xué)者集成開發(fā)工具,如NETBEANS、JCREATOR、JBUILDER,JAVA應(yīng)用程序的開發(fā)應(yīng)用程序的特點應(yīng)用程序必須有一個主類含有PUBLICSTATICVOIDMAINSTRINGARGS方法的類開發(fā)一個JAVA應(yīng)用程序需經(jīng)過三個步驟編寫源文件、編譯源文件生成字節(jié)碼、加載運行字節(jié)碼編寫源文件在編輯器中書寫,然后保存為JAVA文件良好的變成習(xí)慣一行最好只寫一條語句,并有明顯的縮進(jìn),適當(dāng)?shù)淖⑨?注釋COMMENTS單行//多行//自動文檔注釋//,單行注釋,以換行符為結(jié)束,多行注釋,注釋內(nèi)容較多,使用JAVADOC工具從源代碼和文檔注釋中將信息取出,然后轉(zhuǎn)換為HTML文件,JAVA應(yīng)用程序舉例,//這是文件名為“HELLOWORLDJAVA”的應(yīng)用程序IMPORTJAVAIO//引入包PUBLICCLASSHELLOWORLD//定義類{PUBLICSTATICVOIDMAINSTRINGARGS//MAIN方法{SYSTEMOUTPRINTLN“歡迎來到JAVA世界”//輸出數(shù)據(jù)}},定義類的關(guān)鍵字,類名,保存并運行,以JAVA為擴(kuò)展名,保存時注意類型,編譯使用JAVAC命令運行實用JAVA命令,JAVAAPPLET程序的開發(fā)開發(fā)一個JAVAAPPLET程序需經(jīng)過三個步驟編寫源文件、編譯源文件生成字節(jié)碼、通過瀏覽器加載運行字節(jié)碼APPLET程序的特點主類不再包含MAIN方法,而是擴(kuò)展了APPLET類,即它是APPLET類的子類的類只有一個主類,JAVA小應(yīng)用程序舉例,IMPORTJAVAAWTGRAPHICSIMPORTJAVAAPPLETPUBLICCLASSHELLOTOJAVAEXTENDSAPPLET{PUBLICSTRINGSHELLOPUBLICVOIDINIT{SHELLO“歡迎來到JAVA世界“}PUBLICVOIDPAINTGRAPHICSG{GDRAWSTRINGSHELLO,50,50}},,裝入系統(tǒng)類庫,保存并運行,將上頁文件保存為HELLOTOJAVAJAVA必須首先將HELLOTOJAVAJAVA文件進(jìn)行編譯JAVAC命令JAVACHELLOTOJAVAJAVA編譯成功后,文件夾下會生成一個HELLOTOJAVACLASS文件;如果源文件有多個類,將生成多個CLASS文件JAVAAPPLET由瀏覽器來運行使用命令A(yù)PPLETVIEWERHELLOTOJAVAHTML查看運行結(jié)果或者直接雙擊打開HELLOTOJAVAHTML查看,在運行之前需要編寫如下HTML代碼將文件保存為HTML文件HELLOTOJAVAHTML,SDK15編譯器的新規(guī)定,SDK15不再向下兼容用SDK15的編譯器生成的字節(jié)碼只能在安裝了SDK15或JRE15的JAVA平臺環(huán)境中運行。SDK15中增加了一些類,比如SCANER等。,
下載積分: 6 賞幣
上傳時間:2024-01-07
頁數(shù): 26
大?。?0.56(MB)
子文件數(shù):