版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái),“眾包(Crowdsourcing)”已經(jīng)成為越來(lái)越多的企業(yè)所青睞的商業(yè)模式。隨著移動(dòng)軟件的興起,人們發(fā)現(xiàn)可以把眾包模式和基于位置的服務(wù)結(jié)合在一起,傳統(tǒng)的基于位置的服務(wù),一般會(huì)通過(guò)GPS等技術(shù)來(lái)進(jìn)行定位,這些技術(shù)精度不是很高,而且無(wú)法實(shí)現(xiàn)室內(nèi)定位。不過(guò)在眾包模式下,定位不再由服務(wù)提供商來(lái)確定,而是由消費(fèi)者,也就是每個(gè)使用服務(wù)的人,自發(fā)地告訴服務(wù)提供商自己所處的位置以及周圍的信息。這樣可以帶來(lái)諸多好處:首先,位置的信息是實(shí)時(shí)的;其
2、次,用戶可以進(jìn)行室內(nèi)的定位;最后,在一片區(qū)域內(nèi),如果有很多用戶自發(fā)提供周圍的地理信息,那么服務(wù)器端就可以更精確地進(jìn)行定位??梢钥吹?,眾包在基于位置服務(wù)的應(yīng)用上有很大的優(yōu)勢(shì):高效、低成本且實(shí)時(shí)性強(qiáng)。不過(guò),這種模式也有自身的缺點(diǎn):因?yàn)樯婕暗挠脩艉芏?,?dǎo)致他們提交的信息質(zhì)量很難管理。因此,質(zhì)量控制(Quality Control)被認(rèn)為是眾包模式下的一大挑戰(zhàn)。
本課題的主要內(nèi)容是使用眾包模式采集用戶所處位置周圍的熱點(diǎn)信息,通過(guò)存儲(chǔ)、
3、檢索和分析用戶提交的海量指紋信息(fingerprint)來(lái)確定熱點(diǎn)的位置,為未來(lái)向用戶提供基于位置的服務(wù)提供基準(zhǔn)。作為被雇傭方,用戶的終端一旦連入無(wú)線接入點(diǎn),就可以選擇向服務(wù)器端發(fā)送其有關(guān)這個(gè)可以作為熱點(diǎn)的無(wú)線接入點(diǎn)的信息,比如無(wú)線接入點(diǎn)的ID和所處位置信息。而在服務(wù)器端,會(huì)根據(jù)所有收到的信息來(lái)進(jìn)行數(shù)據(jù)的質(zhì)量分析,包括數(shù)據(jù)的清洗和聚合,從而得到準(zhǔn)確的熱點(diǎn)信息,并根據(jù)該結(jié)果對(duì)所有提供信息的用戶進(jìn)行評(píng)價(jià),這個(gè)評(píng)價(jià)就代表了用戶在這次任務(wù)中將
4、會(huì)得到的報(bào)酬。
本文正是在這樣的背景下,提出了一種針對(duì)眾包模式下基于位置服務(wù)的海量數(shù)據(jù)管理的策略。首先,針對(duì)所有用戶的輸入,需要對(duì)這些數(shù)據(jù)進(jìn)行清洗和過(guò)濾,將錯(cuò)誤的數(shù)據(jù)或者價(jià)值很低的數(shù)據(jù)濾去,其中考慮了用戶可能存在欺詐行為以獲取更大報(bào)償?shù)那闆r,比如某個(gè)用戶在短時(shí)間之內(nèi)頻繁地提交相同的數(shù)據(jù),由于熱點(diǎn)的位置信息在短時(shí)間之內(nèi)是相對(duì)固定的,所以頻繁提交的重復(fù)數(shù)據(jù)是沒(méi)有意義的,或者價(jià)值很低,需要進(jìn)行清洗。經(jīng)過(guò)清洗,每一條數(shù)據(jù)都會(huì)被賦予相應(yīng)
5、的價(jià)值,代表其質(zhì)量和影響因子。
其次,我們對(duì)經(jīng)過(guò)過(guò)濾的數(shù)據(jù)進(jìn)行聚合。首先,數(shù)據(jù)的真實(shí)性應(yīng)該與數(shù)據(jù)的提交者有關(guān),所以本文為在這里定義每個(gè)用戶的誠(chéng)信度。一個(gè)誠(chéng)實(shí)的用戶提交的數(shù)據(jù)當(dāng)然應(yīng)該具有更好的可信性;反之,如果一個(gè)人一直提交錯(cuò)誤的數(shù)據(jù),那它的誠(chéng)信度就會(huì)變得很低,從而導(dǎo)致他提交的數(shù)據(jù)的接受率也會(huì)下降。結(jié)合歷史行為,可以更準(zhǔn)確的判斷數(shù)據(jù)的準(zhǔn)確性,結(jié)合每條數(shù)據(jù)的價(jià)值和數(shù)據(jù)的接受率,可以得到這條數(shù)據(jù)的真實(shí)質(zhì)量。根據(jù)所得到的質(zhì)量,我們把所
6、有指紋信息聚合來(lái)得到熱點(diǎn)的準(zhǔn)確位置,這里使用的多數(shù)人決策原則(MDA),即有多數(shù)人認(rèn)為這個(gè)熱點(diǎn)的所在位置。因?yàn)槭褂帽姲幸粋€(gè)隱含的前提就是,大部分人都是誠(chéng)實(shí)的(他們提交的數(shù)據(jù)都是相對(duì)準(zhǔn)確的)。
最后,需要對(duì)用戶的表現(xiàn)進(jìn)行正確地評(píng)價(jià),因?yàn)樵u(píng)價(jià)決定他們的報(bào)酬,而報(bào)酬影響他們下一次任務(wù)的表現(xiàn)。在本文中,提出了兩種策略,靜態(tài)階段性分析和滑動(dòng)窗口分析。在前一種方法中,我們認(rèn)為用戶的行為是階段性穩(wěn)定的,所以每過(guò)一段時(shí)間,我們把這一階段的表
7、現(xiàn)拿出來(lái)進(jìn)行一次評(píng)價(jià)。而在后一種方法中,我們會(huì)把用戶的歷史表現(xiàn)也考慮在內(nèi),并且結(jié)合之前的一段時(shí)間的表現(xiàn)綜合考慮,這種方式更加靈活而且能及時(shí)反映用戶最新的行為,不過(guò)時(shí)間消耗過(guò)大。
為了驗(yàn)證本文提出的策略的有效性,本課題模擬了真實(shí)的眾包模式的數(shù)據(jù)。這些數(shù)據(jù)具有眾包模式的特點(diǎn)。實(shí)驗(yàn)證明,本文提出的策略可以有效地對(duì)眾包模式下的數(shù)據(jù)進(jìn)行管理,尤其是質(zhì)量控制方面
值得一提的是,本課題提出的策略并不僅限于基于位置的服務(wù)方面,因?yàn)檫@
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 云環(huán)境下面向位置服務(wù)的查詢及優(yōu)化技術(shù)的研究.pdf
- 基于3G網(wǎng)絡(luò)位置服務(wù)的數(shù)據(jù)管理和用戶隱私的研究.pdf
- 移動(dòng)云計(jì)算下位置服務(wù)數(shù)據(jù)管理與應(yīng)用研究.pdf
- 面向位置服務(wù)的數(shù)據(jù)處理平臺(tái)的研究與設(shè)計(jì).pdf
- 基于位置服務(wù)的實(shí)習(xí)管理平臺(tái)研究
- 基于位置服務(wù)的位置隱私保護(hù).pdf
- 基于Hadoop的海量圖象數(shù)據(jù)管理.pdf
- 基于Hadoop的海量傳感數(shù)據(jù)管理系統(tǒng).pdf
- 位置相關(guān)信息服務(wù)中的數(shù)據(jù)管理.pdf
- 面向位置服務(wù)的物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量保證方法研究.pdf
- 海量圖像數(shù)據(jù)管理系統(tǒng).pdf
- 面向網(wǎng)絡(luò)爬蟲的海量URL數(shù)據(jù)管理技術(shù)研究.pdf
- 大數(shù)據(jù)環(huán)境下面向電信行業(yè)數(shù)據(jù)管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
- 大數(shù)據(jù)環(huán)境下面向電信行業(yè)數(shù)據(jù)管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于位置服務(wù)的數(shù)據(jù)庫(kù)查詢隱私保護(hù).pdf
- 基于位置服務(wù)的位置隱私保護(hù)研究.pdf
- 基于手機(jī)的位置服務(wù)研究.pdf
- 基于移動(dòng)眾包模式的海量商品圖像檢索的研究與實(shí)現(xiàn).pdf
- 面向移動(dòng)位置服務(wù)的短文本挖掘研究.pdf
- 基于Oracle RAC的海量數(shù)據(jù)管理系統(tǒng)優(yōu)化設(shè)計(jì).pdf
評(píng)論
0/150
提交評(píng)論