2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第1頁(yè)
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第2頁(yè)
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第3頁(yè)
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第4頁(yè)
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上 “拍照賺錢”的任務(wù)定價(jià)模型摘要本題要求分析“拍照賺錢”任務(wù)的服務(wù)模式,研究其定價(jià)規(guī)律,并設(shè)計(jì)新的任務(wù)定價(jià)方案,結(jié)合實(shí)際情況,修改定價(jià)模型,最終對(duì)新項(xiàng)目設(shè)計(jì)任務(wù)定價(jià)方案,并評(píng)價(jià)方案的實(shí)施效果。求解的具體流程如下:針對(duì)問(wèn)題一:為了研究項(xiàng)目的定價(jià)規(guī)律,分析任務(wù)未完成的原因,利用附件一的信息,在地圖上定位所有坐標(biāo)的位置,發(fā)現(xiàn)任務(wù)集中在廣東、東莞、佛山、深圳四市,分別標(biāo)明每個(gè)城市的成功任務(wù)和失敗任務(wù)。以深圳為例,對(duì)深圳市任務(wù)進(jìn)行聚類分析,結(jié)果分成5類,由相應(yīng)任務(wù)的定價(jià)可以得出,人口密集處定價(jià)較低,人口稀少處定價(jià)較高的定價(jià)規(guī)律。將附件二的位置信息同理在地圖上定位,分別計(jì)算任務(wù)周

2、圍的會(huì)員數(shù),分析其與定價(jià)的聯(lián)系。針對(duì)問(wèn)題二:由問(wèn)題一結(jié)果可知,任務(wù)定價(jià)與任務(wù)周圍人數(shù)和任務(wù)周圍人口密度等因素有關(guān)。利用網(wǎng)絡(luò)爬蟲(chóng)爬取廣州、東莞、佛山、深圳四市醫(yī)院,學(xué)校,小區(qū),超市四種人口密度較大場(chǎng)所的經(jīng)緯度,統(tǒng)計(jì)成功任務(wù)周圍十公里人口密集場(chǎng)所。用RBF神經(jīng)網(wǎng)絡(luò)模型,從而確定新的定價(jià)方案。將此方案與原方案進(jìn)行比較,得出兩種定價(jià)方案的差異。針對(duì)問(wèn)題三:為了解決用戶爭(zhēng)相選擇位置集中任務(wù)等問(wèn)題,可將多個(gè)任務(wù)聯(lián)合打包,以便用戶更好得執(zhí)行任務(wù)。利用問(wèn)題二中RBF神經(jīng)網(wǎng)絡(luò)模型求出新的定價(jià)方案下的任務(wù)定價(jià);同問(wèn)題一,求任意兩個(gè)任務(wù)之間的距離。當(dāng)兩個(gè)任務(wù)之間的距離小于一定值時(shí),便可將這兩個(gè)任務(wù)種做打包處理。對(duì)于

3、打包的任務(wù),可將每個(gè)任務(wù)的定價(jià)結(jié)合附近會(huì)員的信息求出最終定價(jià);對(duì)于未打包的任務(wù),任務(wù)定價(jià)不變。 針對(duì)問(wèn)題四:為了對(duì)新項(xiàng)目設(shè)計(jì)定價(jià)方案,并評(píng)價(jià)方案的實(shí)施效果,將新項(xiàng)目中任務(wù)的位置定位于地圖上,可以發(fā)現(xiàn)任務(wù)集中分布于兩個(gè)區(qū)域,且兩個(gè)區(qū)域距離較遠(yuǎn),可認(rèn)為互不影響。結(jié)合前面問(wèn)題的分析,可知任務(wù)定價(jià)與區(qū)域的經(jīng)濟(jì)發(fā)展情況和用戶到任務(wù)的距離有關(guān)。對(duì)用戶而言,用戶將優(yōu)先選擇距離較近且定價(jià)較高的任務(wù),因此,可以使用灰度關(guān)聯(lián)分析的方法,建立不同任務(wù)對(duì)會(huì)員的吸引力,從而對(duì)定價(jià)方案做出評(píng)價(jià)。關(guān)鍵詞:聚類分析、RBF神經(jīng)、灰色關(guān)聯(lián)分析法、網(wǎng)絡(luò)爬蟲(chóng)一、問(wèn)題重述“拍照賺錢”是移動(dòng)互聯(lián)網(wǎng)下的一種自助式服務(wù)模式。用戶下載APP

4、,注冊(cè)成為APP的會(huì)員,然后從APP上領(lǐng)取需要拍照的任務(wù)(比如上超市去檢查某種商品的上架情況),賺取APP對(duì)任務(wù)所標(biāo)定的酬金。APP是該平臺(tái)運(yùn)行的核心,而APP中的任務(wù)定價(jià)又是其核心要素。如果定價(jià)不合理,有的任務(wù)就會(huì)無(wú)人問(wèn)津,而導(dǎo)致商品檢查的失敗。1.研究附件一中項(xiàng)目的任務(wù)定價(jià)規(guī)律,分析任務(wù)未完成的原因。2.為附件一中的項(xiàng)目設(shè)計(jì)新的任務(wù)定價(jià)方案,并和原方案進(jìn)行比較。3.實(shí)際情況下,多個(gè)任務(wù)可能因?yàn)槲恢帽容^集中,導(dǎo)致用戶會(huì)爭(zhēng)相選擇,一種考慮是將這些任務(wù)聯(lián)合在一起打包發(fā)布。在這種考慮下,如何修改前面的定價(jià)模型,對(duì)最終的任務(wù)完成情況又有什么影響?4.對(duì)附件三中的新項(xiàng)目給出你的任務(wù)定價(jià)方案,并評(píng)價(jià)該方

5、案的實(shí)施效果。二、模型假設(shè)1.會(huì)員對(duì)任務(wù)沒(méi)有主觀偏好,不會(huì)因?yàn)樽陨碓虿煌瓿扇蝿?wù);2.各個(gè)任務(wù)難度相等,不影響會(huì)員的選擇;3.假設(shè)會(huì)員與任務(wù)間的距離都是直線距離,不受道路、河流等的影響;4.問(wèn)題中所有數(shù)據(jù)都真實(shí)有效。三、符號(hào)說(shuō)明符號(hào)含義r地球半徑l兩地之間的球面距離,兩地的緯度兩地的經(jīng)度差P打包后總價(jià)四、問(wèn)題分析4.1 問(wèn)題一分析問(wèn)題一要求研究附件一中項(xiàng)目的定價(jià)規(guī)律,并分析任務(wù)未完成的原因。首先應(yīng)在地圖中找出附件一中所有任務(wù)的位置,確定任務(wù)的分布規(guī)律,同時(shí)將附件二中會(huì)員的位置定位于地圖。觀察出這些數(shù)據(jù)集中分布在廣東、東莞、佛山、深圳四個(gè)城市。以深圳市為例,對(duì)深圳的任務(wù)進(jìn)行聚類分析,分析聚類結(jié)果

6、,從而得出項(xiàng)目的定價(jià)規(guī)律。分別計(jì)算每個(gè)任務(wù)與所有會(huì)員之間的距離,結(jié)合每個(gè)任務(wù)周圍十公里的會(huì)員數(shù)與任務(wù)的定價(jià),確定任務(wù)未完成的原因。4.2 問(wèn)題二分析問(wèn)題一可明顯看出任務(wù)價(jià)格與任務(wù)周圍人數(shù)和任務(wù)所在地區(qū)人口密度等有關(guān)。利用網(wǎng)絡(luò)爬蟲(chóng)爬取廣州等四市醫(yī)院、學(xué)校、小區(qū)、超市等人口密度大的場(chǎng)所,統(tǒng)計(jì)成功任務(wù)方圓十公里內(nèi)的人口密度大的場(chǎng)所個(gè)數(shù)。使用RBF神經(jīng)網(wǎng)絡(luò)分析,用所獲得的數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而確定新的任務(wù)定價(jià)方案。將新的任務(wù)定價(jià)方案與附件一中的任務(wù)定價(jià)做出比較,說(shuō)明兩種定價(jià)方案的不同情況。4.3 問(wèn)題三分析問(wèn)題三要求將任務(wù)打包發(fā)布并設(shè)計(jì)新的定價(jià)方案,以解決用戶爭(zhēng)相選擇等問(wèn)題。利用問(wèn)題二中RBF神經(jīng)網(wǎng)絡(luò)

7、模型求出新的定價(jià)方案下的任務(wù)的定價(jià);利用問(wèn)題一中兩點(diǎn)經(jīng)緯度坐標(biāo)求出兩點(diǎn)距離的計(jì)算方法求出每個(gè)任務(wù)與其他任務(wù)之間的距離,當(dāng)兩個(gè)任務(wù)之間的距離小于一定值時(shí),便可將這兩個(gè)任務(wù)種做打包處理。對(duì)于打包的任務(wù),可將每個(gè)任務(wù)的定價(jià)結(jié)合附近會(huì)員的信息求出最終定價(jià);對(duì)于未打包的任務(wù),任務(wù)定價(jià)不變。 4.4 問(wèn)題四分析問(wèn)題四要求對(duì)一個(gè)新項(xiàng)目設(shè)計(jì)定價(jià)方案,并評(píng)價(jià)該方案的實(shí)施效果,將附件三中的任務(wù)的地理位置定位于地圖上,可以發(fā)現(xiàn)任務(wù)集中分布于兩個(gè)區(qū)域。通過(guò)前面的問(wèn)題分析可知,任務(wù)定價(jià)與地區(qū)經(jīng)濟(jì)發(fā)展水平和會(huì)員距離有關(guān)。對(duì)會(huì)員而言,可以從任務(wù)的難易程度和會(huì)員到任務(wù)的距離兩個(gè)方面判斷會(huì)員對(duì)任務(wù)的偏好,從而使用灰度關(guān)聯(lián)分析對(duì)

8、的方法,建立不同任務(wù)對(duì)會(huì)員吸引力的模型,便可以對(duì)這種方案的實(shí)施效果做出分析。五、模型建立與求解5.1 問(wèn)題一模型利用地圖定位將附件一中經(jīng)度緯度定位到地圖中,發(fā)現(xiàn)這些數(shù)據(jù)集中分布在廣東,東莞,佛山和深圳四個(gè)城市中。分別分析四個(gè)城市的價(jià)格規(guī)律,以深圳市為例。考慮到城市內(nèi)部存在區(qū)的劃分,因此對(duì)數(shù)據(jù)進(jìn)行聚類分析,猜測(cè)聚類結(jié)果呈區(qū)域塊狀分布,結(jié)果同樣驗(yàn)證猜測(cè)。這是價(jià)格的分布規(guī)律,其內(nèi)部原因是受每個(gè)任務(wù)周圍會(huì)員數(shù)量的影響。分別求出任務(wù)方圓每十公里會(huì)員人數(shù),分析任務(wù)周圍的會(huì)員數(shù)與任務(wù)定價(jià)的關(guān)系,從而確定任務(wù)未完成的原因。5.1.1模型建立此題采用Q型聚類法建立模型并求解。Step1. 距離表5.1.1 數(shù)據(jù)

9、觀測(cè)值樣本變量x1x2xp1x11x12x1p2x21x22x2p nxn1xn2xnp設(shè) xik 為第i個(gè)樣本的第k個(gè)指標(biāo),數(shù)據(jù)觀測(cè)值如上表所示。在表中,每個(gè)樣本有p個(gè)變量,故每個(gè)樣本可以看作 Rp 中的一個(gè)點(diǎn),n個(gè)樣本就是 Rp 中的n個(gè)點(diǎn)。在 Rp 中需要定義某種距離,第i個(gè)樣本與第j個(gè)樣本之間的距離記為 dij ,在聚類過(guò)程中距離較近的點(diǎn)傾向于歸為一類,距離較遠(yuǎn)的點(diǎn)應(yīng)屬于不同類。所定義的距離滿足如下4個(gè)條件:(1) dij0 ,對(duì)一切i,j;(2) dij=0 ,當(dāng)且僅當(dāng)?shù)趇個(gè)樣本與第j個(gè)樣本的各個(gè)變量值相等;(3) dij=dji ,對(duì)一切i,j;(4) dijdik+dkj ,對(duì)一

10、切的i,j,k。最常用的幾種距離:(1) Minkowski(閔可夫斯基)距離dijq=k=1pxik-xjkq1q , q>0 對(duì)于q=1時(shí),對(duì)應(yīng)的是絕對(duì)值距離(2) 絕對(duì)值距離dij1=k=1pxik-xjk 對(duì)于q=2時(shí),對(duì)應(yīng)的是Euclid距離(3) Euclid(歐幾里得)距離dij2=k=1pxik-xjk2 Step2. 數(shù)據(jù)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化變換:xij*=xij-xjsj,i=1,2,n;j=1,2,p 其中,均值:xj=1nk=1nxkj方差:sj=1n-1k=1nxkj-xj2變換后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1,而且標(biāo)準(zhǔn)化后的數(shù)據(jù)與變量的量綱無(wú)關(guān)。Step3. 系統(tǒng)聚類系統(tǒng)

11、聚類法(hierarchical clustering method)是聚類分析諸多方法中用的最多的一種,其基本思想是:開(kāi)始將n個(gè)樣本各自為一類,并規(guī)定樣本之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個(gè)新類,計(jì)算新類與其它類的距離;重復(fù)進(jìn)行兩個(gè)最近類的合并,每次減少一類,直到所有樣本合并為一類。以下用 dij 表示第i個(gè)樣本與第j個(gè)樣本的距離,G1 , G2 ,表示類,DKL 表示GK 與 GL 的距離。下面所介紹的系統(tǒng)聚類法中,所有的方法開(kāi)始時(shí)每個(gè)樣本自成一類,類與類之間的距離與樣本之間的距離相同,即 DKL=dKL ,所以最初的距離矩陣全部相同,記為 D0=dij 。常用的系

12、統(tǒng)聚類法:(1)重心法類與類之間的距離定義為它們重心(均值)之間的Euclid距離。設(shè) GK 與 GL 的重心分別為xK 和 xL ,則 GK 和 GL 之間的平方距離為:DKL2=dxKxL2=xK-xLTxK-xL這種系統(tǒng)聚類方法稱為重心法(centroid hierarchical method)。它的遞推公式為:DMJ2=nKnMDKJ2+nLnMDLJ2-nKnLnM2DKL2 重心法在處理異常值方面比其它系統(tǒng)聚類法更穩(wěn)健,但是其他方面卻不如離差平方和法的效果好。(2)離差平方和法(Ward方法)離差平方和法基于方差分析的思想,如果分類分得正確,則同類樣本之間的離差平方和應(yīng)當(dāng)較小,不

13、同類樣本之間的離差平方和應(yīng)當(dāng)較大。設(shè)類GK與GL 合并成新的類GM,則GK,GL,GM 的離差平方和分別為:WK=iGKxi-xKTxi-xKWL=iGLxi-xLTxi-xLWM=iGMxi-xMTxi-xM其中xK,xL和xM分別是GK,GL和GM的重心。所以WK,WL和WM反應(yīng)各自類內(nèi)樣本的分散程度。如果GK和GL這兩類相距較近,則合并后所增加的離差平方和WM-WK-WL應(yīng)較?。环駝t,應(yīng)較大。于是定義GK和GL之間的平方距離為:DKL2=WM-WK-WL這種系統(tǒng)聚類法稱為離差平方和法或Ward方法(Wards minimum variance method)。它的遞推公式為:DMJ2=n

14、J+nKnJ+nMDKJ2+nJ+nLnJ+nMDLJ2-nJnJ+nMDKL2GK和GL之間的平方距離也可以寫(xiě)成DKL2=nKnLnMxK-xLTxK-xL由上述分析可見(jiàn),這個(gè)距離與重心法給出的距離只差一個(gè)常數(shù)倍。重心法的類間距與兩樣本的樣本數(shù)無(wú)關(guān),而離差平方和法的類間距與兩類的樣本數(shù)有關(guān)。兩個(gè)大類傾向于有較大的距離,因而不易合并,這更符合對(duì)聚類的實(shí)際要求。離差平方和法在很多場(chǎng)合下優(yōu)于重心法,是一種較好的系統(tǒng)聚類法,但它對(duì)異常值很敏感。Step4. 已知兩地經(jīng)緯度求兩地距離 和分別是兩地的緯度,北緯記為正;是兩地的經(jīng)度差,r是地球半徑。忽略各地海拔高度差異,認(rèn)為地球是理想的球面。設(shè)L是兩地的

15、距離(地球的一條弦長(zhǎng)),l是兩地的球面距離(沿地球表面的弧長(zhǎng))。則:k=sin-sin2+cos-coscos2+cossin2L=rk可求得:l=2rsin-1k2分別計(jì)算出以每個(gè)任務(wù)位置為中心,半徑為十公里的區(qū)域(即為方圓每十公里)內(nèi)會(huì)員的人數(shù)與相應(yīng)的任務(wù)定價(jià),通過(guò)成功任務(wù)和失敗任務(wù)每十公里內(nèi)的會(huì)員人數(shù)比較即可得出任務(wù)失敗的原因。5.1.2模型求解Step1. 基本數(shù)據(jù)處理清洗數(shù)據(jù),對(duì)于有明顯錯(cuò)誤的數(shù)據(jù)給予改正,例如將附件二中的“113.13148 23.”改為“23. 113.13148”。對(duì)于附件一和附件二中的任務(wù)與會(huì)員坐標(biāo),使用XGeocoding解析出每個(gè)坐標(biāo)所對(duì)應(yīng)的地理位置,得出

16、任務(wù)與會(huì)員集中分布于廣東,東莞,佛山和深圳,則可刪除極少的處于其他市的任務(wù)與會(huì)員,得到模型中使用的有效數(shù)據(jù)。表5.1.2 城市中的任務(wù)數(shù)與會(huì)員數(shù)城市任務(wù)數(shù)量會(huì)員數(shù)廣州市322665深圳市161629佛山市173216東莞市179351Step2. 確定定價(jià)規(guī)律(以深圳市為例)利用BDP在線數(shù)據(jù)分析軟件將任務(wù)信息在地圖上標(biāo)出,將深圳市中的任務(wù)聚類分析,聚類后分成了五類1,2,3,4和5。其中每一類任務(wù)在地圖上的分布如下圖:圖5.1.1 深圳市任務(wù)分類圖表5.1.3 每一類中個(gè)數(shù)和定價(jià)的均值聚類的類別個(gè)數(shù)定價(jià)均值13567.6857124566.4777831268.546266.08871577

17、6.85714顯然,這很符合實(shí)際,人口密集區(qū)任務(wù)定價(jià)偏低,如類別4所在區(qū)域?yàn)槿丝诿芗瘏^(qū),人口密度較小,相應(yīng)任務(wù)定價(jià)較低;偏遠(yuǎn)地區(qū)定價(jià)高,而且明顯高過(guò)其他類別,如類別5所在區(qū)域,任務(wù)分布很廣,但任務(wù)定價(jià)為所有類別中最高。同理可得出東莞,佛山,深圳三市的任務(wù)與價(jià)格分布。這就是項(xiàng)目的任務(wù)定價(jià)規(guī)律。Step3. 分析任務(wù)未完成原因通過(guò)Matlab編寫(xiě)程序分別求出每個(gè)任務(wù)方圓十公里內(nèi)的會(huì)員人數(shù),分析方圓十公里內(nèi)的會(huì)員人數(shù)與任務(wù)是否完成的關(guān)系。從附件一中統(tǒng)計(jì)可得,共有522個(gè)成功任務(wù),313個(gè)失敗的任務(wù)。首先求出每個(gè)成功任務(wù)與每個(gè)會(huì)員的距離,然后篩選出任務(wù)方圓十公里內(nèi)的會(huì)員人數(shù)。同理可以求得失敗任務(wù)方圓十

18、公里內(nèi)的會(huì)員人數(shù)。畫(huà)出其統(tǒng)計(jì)直方圖,如下圖所示:圖5.1.2 成功任務(wù)頻數(shù)分布直方圖圖5.1.3 失敗任務(wù)頻數(shù)分布直方圖從圖中可以看出,大部分成功任務(wù)方圓十公里內(nèi)的會(huì)員人數(shù)在150人以下,在方圓每十公里少于100人之前,隨著方圓十公里內(nèi)人數(shù)的增加,成功任務(wù)總數(shù)增加;在方圓每十公里大于100人之后,隨著方圓十公里內(nèi)人數(shù)的增加,成功任務(wù)總數(shù)減少。失敗任務(wù)方圓十公里內(nèi)人數(shù)分布比較均勻,但總體也呈先增加后遞減的規(guī)律。失敗任務(wù)頻數(shù)分布直方圖顯示雖然有一部分任務(wù)方圓每十公里會(huì)員很多,但任務(wù)仍然失敗。這可能和會(huì)員的活躍度有關(guān),導(dǎo)致會(huì)員總數(shù)雖多,但活躍會(huì)員很少。實(shí)際情況中,如果有任務(wù)未完成,可分為有人執(zhí)行任務(wù)

19、但失敗,無(wú)人執(zhí)行任務(wù)兩種情況。在第一種情況下,即有人執(zhí)行任務(wù)但執(zhí)行失敗時(shí),可能的原因有,任務(wù)本身過(guò)于困難,超出會(huì)員的能力,或任務(wù)時(shí)間過(guò)短,在規(guī)定時(shí)間內(nèi)無(wú)法完成;第二種情況時(shí),任務(wù)已在軟件發(fā)布,但無(wú)人愿意執(zhí)行該任務(wù),可能的原因有任務(wù)地點(diǎn)與會(huì)員所在地距離過(guò)遠(yuǎn),會(huì)員不愿意花費(fèi)過(guò)多的時(shí)間;任務(wù)定價(jià)過(guò)低或過(guò)于困難,會(huì)員認(rèn)為本身的勞動(dòng)價(jià)值高于任務(wù)價(jià)值;任務(wù)發(fā)布的時(shí)間過(guò)短,導(dǎo)致無(wú)人可執(zhí)行。附件二中給出了會(huì)員的信譽(yù)度,信譽(yù)度較高的會(huì)員越優(yōu)先開(kāi)始挑選任務(wù),配額也就越大。由失敗任務(wù)的直方圖可以得到,任務(wù)方圓十公里的會(huì)員數(shù)很多,任務(wù)失敗仍有一定的比例,推測(cè)可得,會(huì)員信譽(yù)度與任務(wù)完成情況有關(guān),會(huì)員信譽(yù)度越高,任務(wù)完成

20、的概率越大;反之,會(huì)員的信譽(yù)度越低,接收任務(wù)后無(wú)法完成的可能性越大。5.2 問(wèn)題二模型從問(wèn)題一中發(fā)現(xiàn),任務(wù)價(jià)格除了與任務(wù)周圍的會(huì)員人數(shù)有關(guān),也與其所在地區(qū)的人口密度和地理位置等有關(guān)。運(yùn)用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)確定新的任務(wù)定價(jià)方案。將設(shè)計(jì)出的定價(jià)方案與附件一中的定價(jià)方案進(jìn)行比較,即可得到雙方各自的優(yōu)缺點(diǎn)。5.2.1模型建立Step1. RBF神經(jīng)網(wǎng)絡(luò)(徑向基神經(jīng)網(wǎng)絡(luò))(1)網(wǎng)絡(luò)參數(shù)確定RBF神經(jīng)網(wǎng)絡(luò)由輸入層,隱含層和輸出層組成,其隱含層基函數(shù)常為高斯函數(shù)。最常用的函數(shù)為:RiX=exp-X-Ci22i2,i=1,10其中,i為徑向基函數(shù)的擴(kuò)展常數(shù),反應(yīng)函數(shù)圖像的寬度。X為輸入向量,Ci為基函

21、數(shù)的中心向量,與X有相同維數(shù)的向量;X-Ci為向量X-Ci的范式,通常表示X與Ci之間的距離;RiX在Ci處有唯一的最大值,隨著X-Ci的增大,RiX迅速衰減到0。在本題中,任務(wù)的輸入樣本共有10個(gè),即輸入層的輸入為X=x1,x2,x10;輸出為任務(wù)定價(jià),即實(shí)際輸出為Y=y,建立多輸入、單輸出的三層網(wǎng)絡(luò)結(jié)構(gòu)。RBF網(wǎng)絡(luò)輸入層與隱含層直接連接,相當(dāng)于直接將輸入變量輸入到隱含層。對(duì)于給定的輸入,只有小部分靠近X的中心被激活。當(dāng)確定了RBF網(wǎng)絡(luò)的聚類中心Ci、擴(kuò)展常數(shù)i與隱含層到輸出層的權(quán)值以后,就可求出給定某一輸入時(shí),網(wǎng)絡(luò)對(duì)應(yīng)的輸出值。 圖5.2.1 RBF神經(jīng)網(wǎng)絡(luò)建模結(jié)構(gòu)(2)樣本數(shù)據(jù)訓(xùn)練學(xué)習(xí)在

22、RBF神經(jīng)網(wǎng)絡(luò)中,需要通過(guò)學(xué)習(xí)和訓(xùn)練確定基函數(shù)的擴(kuò)展常數(shù),基函數(shù)中心向量與隱含層到輸出層的權(quán)值。一般分為步進(jìn)行:確定基函數(shù)的中心向量通過(guò)“K均值聚類法”在訓(xùn)練樣本集中隨機(jī)選擇樣本作為徑向基函數(shù)的中心,將這個(gè)聚類中心作為基函數(shù)的中心向量。確定基函數(shù)的擴(kuò)展常數(shù)確定基函數(shù)中心向量后,可求得歸一化參數(shù),令其等于基函數(shù)中心與子樣本集中樣本模式之間的平均距離,求得基函數(shù)擴(kuò)展常量。確定隱含層到輸出層的權(quán)值RBF連接權(quán)值的確定可以采用最小的均方差誤差得到。Step2. 原始數(shù)據(jù)處理采用公式對(duì)樣本的輸入、輸出數(shù)據(jù)進(jìn)行規(guī)格化處理:t=2(t-tmin)tmax-tmin-1其中,t為規(guī)格化前的變量,tmax和tm

23、in分別為t的最大值和最小值;t為規(guī)格化后的變量。利用Matlab的歸一化處理函數(shù)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將具有不同尺度屬于不同區(qū)間的樣本的分量轉(zhuǎn)換到相同區(qū)間,從而使樣本的各個(gè)分量具有相同的尺度。便于RBF網(wǎng)絡(luò)的訓(xùn)練。Step3. 網(wǎng)絡(luò)訓(xùn)練 利用Matlab提供的神經(jīng)網(wǎng)絡(luò)工具箱可實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)功能,主要使用RBF網(wǎng)絡(luò)設(shè)計(jì)函數(shù)newrbe和newrb設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)??捎玫臉颖镜膫€(gè)數(shù)為522,輸入變量的個(gè)數(shù)為512,作為訓(xùn)練集;將10組樣本作為檢驗(yàn)集,輸出變量的個(gè)數(shù)為1,中間隱含層神經(jīng)元的個(gè)數(shù),RBF網(wǎng)絡(luò)會(huì)在訓(xùn)練過(guò)程中自適應(yīng)地取定。編寫(xiě)Matlab程序進(jìn)行訓(xùn)練,可得到各因素影響下對(duì)任務(wù)價(jià)格的預(yù)測(cè)結(jié)果。5

24、.2.2 模型求解Step1. 確定訓(xùn)練樣本通過(guò)對(duì)完成任務(wù)分布與任務(wù)位置可得出,任務(wù)價(jià)格與任務(wù)周圍的會(huì)員人數(shù)和任務(wù)所在地區(qū)的人口密度有關(guān)。搜索廣州市人口密集地區(qū)的具體場(chǎng)所,將其分類為醫(yī)院,學(xué)校,小區(qū),超市,爬取網(wǎng)頁(yè)中場(chǎng)所的具體經(jīng)緯度坐標(biāo)。設(shè)每個(gè)成功任務(wù)方圓十公里的醫(yī)院數(shù)量為x1,學(xué)校數(shù)量為x2,小區(qū)數(shù)量為x3,超市數(shù)量為x4,相應(yīng)區(qū)域內(nèi)的會(huì)員人數(shù)為x5。數(shù)據(jù)經(jīng)過(guò)處理可得到下表,詳細(xì)數(shù)據(jù)見(jiàn)支撐材料:表5.2.1 成功任務(wù)方圓十公里的人口密集場(chǎng)所數(shù)量序號(hào)x1x2x3x4x5y1000012265.52000011765.55110000738551201025885Step2. 神經(jīng)網(wǎng)絡(luò)訓(xùn)練使用M

25、atlab的神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行數(shù)據(jù)訓(xùn)練與檢驗(yàn)。Matlab核心代碼如下: net1 = newrb(PN,TN) x = a(1:4,end);xn = mapminmax(apply,x,PS1); yn1 = sim(net1,xn);y1 = mapminmax(reverse,yn1,PS2); delta1 = abs(a(5,20)-y1)/a(5,20)其中,用于訓(xùn)練RBF網(wǎng)絡(luò),得到規(guī)律,以便后期預(yù)測(cè)結(jié)果;用于預(yù)測(cè)規(guī)格化的樣本自變量;用于求出預(yù)測(cè)值,并還原規(guī)格化的數(shù)據(jù);用于計(jì)算RBF網(wǎng)絡(luò)預(yù)測(cè)的相對(duì)誤差。將檢驗(yàn)基中的數(shù)據(jù)代入程序中進(jìn)行檢驗(yàn),可以得出預(yù)測(cè)定價(jià)和相對(duì)誤差,如下表:表5.

26、2.2 RBF測(cè)試檢驗(yàn)表測(cè)試組真實(shí)定價(jià)預(yù)測(cè)定價(jià)相對(duì)誤差17284.905.20%28072.0222.16%365.569.5206.17%46668.764.18%58067.837.74%68573.802.78%77269.892.93%88567.5513.09%965.566.160.02%108568.910.10%Step3. 與原方案比較結(jié)果 原方案中沒(méi)有考慮到學(xué)校,小區(qū)等密集地區(qū)對(duì)任務(wù)定價(jià)的影響,這和現(xiàn)實(shí)會(huì)產(chǎn)生很大的出入。本方案結(jié)合任務(wù)地點(diǎn)附近人口密集區(qū)對(duì)任務(wù)定價(jià)的影響。運(yùn)用具有很強(qiáng)的逼近能力,分類能力和學(xué)習(xí)速度的RBF神經(jīng)網(wǎng)絡(luò)模型得到了一個(gè)任務(wù)定價(jià)方案,經(jīng)過(guò)檢驗(yàn),結(jié)果誤差完

27、全在可接受的范圍之內(nèi)。而且,此模型具有易用性,任意已知數(shù)據(jù)帶入RBF模型即可得到定價(jià)結(jié)果。5.3 問(wèn)題三模型在實(shí)際問(wèn)題中,任務(wù)位置可能比較接近,打包發(fā)布因?yàn)閮r(jià)格較高不僅有利于調(diào)動(dòng)會(huì)員的積極性,還可以提高任務(wù)完成比率。首先,使用問(wèn)題二的神經(jīng)網(wǎng)絡(luò)模型求出全部任務(wù)定價(jià)。然后確定打包條件,當(dāng)兩任務(wù)距離小于一定值時(shí),將兩任務(wù)打包。對(duì)于打包的任務(wù),由上面求得的任務(wù)定價(jià),再結(jié)合打包任務(wù)附近會(huì)員的個(gè)人信息給出最終定價(jià)。對(duì)于沒(méi)有打包的任務(wù),價(jià)格不變。5.3.1 模型建立Step1. 應(yīng)用問(wèn)題二的神經(jīng)網(wǎng)絡(luò)模型求出所有任務(wù)的定價(jià),稱為初始定價(jià);Step2. 確定打包條件假設(shè)共有n個(gè)任務(wù),已知每個(gè)任務(wù)的經(jīng)緯度,可以求

28、出每?jī)蓚€(gè)任務(wù)之間的距離,求解方式如問(wèn)題一。由此可以得到一個(gè)n*n的矩陣:r11r12r1nr21r22r2nrn1rn2rnn其中rij表示第i個(gè)任務(wù)與第j個(gè)任務(wù)之間的距離,由此可知此矩陣是一個(gè)對(duì)稱矩陣。當(dāng)rij<2時(shí),即兩任務(wù)距離小于2公里時(shí),把第i個(gè)任務(wù)與第j個(gè)任務(wù)進(jìn)行打包處理。如果有rij,rik,ril<2,則把第i,j,k,l個(gè)任務(wù)進(jìn)行打包處理。由此可以完成所有的打包分類。Step3. 確定打包任務(wù)的定價(jià)表5.3.1 打包任務(wù)的相關(guān)信息任務(wù)ijk初始定價(jià)PiPjPk會(huì)員數(shù)/方圓十公里ninjnk信譽(yù)值總和RiRjRk假設(shè)將第i,j,k個(gè)任務(wù)進(jìn)行打包,其初始定價(jià),方圓十公里

29、內(nèi)的會(huì)員數(shù),以及會(huì)員預(yù)訂任務(wù)限額總值,信譽(yù)值總和見(jiàn)上表。Pi,Pj,Pk分別為相應(yīng)任務(wù)的初始定價(jià);ni,nj,nk分別為相應(yīng)任務(wù)方圓十公里內(nèi)的會(huì)員數(shù);Ri,Rj,Rk分別為相應(yīng)會(huì)員所對(duì)應(yīng)的信譽(yù)值總和。設(shè)打包后總價(jià)為P,則可求得最后打包總價(jià)為:P=iPi+jPj+kPk其中:i=Rj+RkRi+Rj+Rkj=Ri+RkRi+Rj+Rkk=Ri+RjRi+Rj+Rk5.3.2 模型求解Step1. 由問(wèn)題二的神經(jīng)網(wǎng)絡(luò)模型可求出所有任務(wù)的初始定價(jià),如下表:表5.3.2 所有任務(wù)的初始定價(jià)表任務(wù)號(hào)碼A001A002A0833A0834A0835初始定價(jià)70.8969.5580.8860.5483.25

30、Step2. 由附件一可知,任務(wù)共有835個(gè),由此可以得到一個(gè)835*835的矩陣:013.98108.6013.98097.94108.6097.940根據(jù)每個(gè)任務(wù)對(duì)應(yīng)的經(jīng)緯度坐標(biāo)及兩坐標(biāo)之間的距離公式,分別求出每個(gè)任務(wù)與其他所有任務(wù)之間的距離,找出其中距離小于2公里的元素所對(duì)應(yīng)的任務(wù),列舉三例:1,29,362,11,12,16,17,22,23,356,7,13,19,29。 Step3. 選取一例進(jìn)行求解例如第1個(gè)任務(wù)與第29,362個(gè)任務(wù)打包在一起。分別求出每個(gè)任務(wù)和每一個(gè)會(huì)員之間的距離,選擇在任務(wù)方圓十公里內(nèi)的會(huì)員,確定每個(gè)會(huì)員的預(yù)訂任務(wù)限額及信譽(yù)值,求和可得預(yù)訂任務(wù)限額總值及信譽(yù)

31、值總和。表5.3.3 任務(wù)的初始定價(jià)及信譽(yù)值總和任務(wù)129362初始定價(jià)70.8965.5571.22信譽(yù)值總和123413221240根據(jù)模型可求得1=0.6733,29=0.6517,362=0.6733,則總價(jià)為P=2543。Step4. 對(duì)最終任務(wù)完成情況的影響修改后的模型可根據(jù)距離將多個(gè)任務(wù)同時(shí)發(fā)布給一個(gè)用戶,這種做法可以將少有用戶選擇的任務(wù)通過(guò)與另一個(gè)用戶愿意選擇的任務(wù)同時(shí)發(fā)布,促進(jìn)任務(wù)的完成;模型加入了會(huì)員自身情況的影響,打包的任務(wù)可以吸引更多的信譽(yù)度高的用戶執(zhí)行任務(wù),獲得更多的利益,因而可以促進(jìn)新用戶的注冊(cè),使更多的人前去完成任務(wù),最終任務(wù)會(huì)完成得更多。5.4 問(wèn)題四模型將用戶

32、位置數(shù)據(jù)導(dǎo)入地圖,可以發(fā)現(xiàn),新項(xiàng)目分布在兩個(gè)塊狀地區(qū),其中大部分分布在廣州市,少量分布在深圳市周圍。兩地相距大約130公里,因此,可以認(rèn)為兩地任務(wù)之間沒(méi)有影響,可以單獨(dú)分析。圖5.4.1 新項(xiàng)目用戶分布圖由前三問(wèn)可知,任務(wù)定價(jià)水平與地區(qū)經(jīng)濟(jì)發(fā)展水平有很大關(guān)系,與會(huì)員距離任務(wù)點(diǎn)的遠(yuǎn)近也有很大關(guān)系。對(duì)于會(huì)員而言,會(huì)員的優(yōu)先選擇是選擇距離較小,定價(jià)較高,難度較小的任務(wù),不同會(huì)員對(duì)每個(gè)任務(wù)的距離,難易判別并不相同,我們選擇用灰度關(guān)聯(lián)分析的方法,建立不同任務(wù)對(duì)會(huì)員吸引力的模型。實(shí)現(xiàn)任務(wù)隊(duì)會(huì)員的實(shí)時(shí)更新。5.4.2 模型建立本文中灰度關(guān)聯(lián)分析具體步驟為:(1)確定評(píng)價(jià)對(duì)象和評(píng)價(jià)標(biāo)準(zhǔn)。本題中的評(píng)價(jià)對(duì)象是m個(gè)

33、任務(wù),評(píng)價(jià)指標(biāo)有用戶與任務(wù)的距離,任務(wù)附近的交通狀況,任務(wù)本身的難易程度。參考數(shù)列為x0=x0k|k=1,2,3,比較數(shù)列為xi=xik|k=1,2,3,i=1,2,3.(2)確定各指標(biāo)值對(duì)應(yīng)的權(quán)重。權(quán)重w=w1,w2,w3,其中wi表示第i個(gè)指標(biāo)對(duì)應(yīng)的權(quán)重。(3)計(jì)算灰度聯(lián)系關(guān)系:ik=minsmint|x0t-xst|+maxsmaxt|x0t-xst|x0k-xik|+maxsmaxt|x0t-xst|為比較數(shù)列xi對(duì)參考數(shù)列x0在第k個(gè)指標(biāo)上的關(guān)聯(lián)系數(shù),其中0,1為分辨系數(shù)。其中,minsmint|x0t-xst|、maxsmaxt|x0t-xst|分別為兩級(jí)最小差及兩級(jí)最大差。一般來(lái)

34、講,分辨系數(shù)越大,分辨率越大;越小,分辨率越小。(4)計(jì)算灰色加權(quán)關(guān)聯(lián)度?;疑訖?quán)關(guān)聯(lián)度的計(jì)算公式為ri=k=1nii(k)其中,ri為第i個(gè)評(píng)價(jià)對(duì)象對(duì)理想對(duì)象的灰色加權(quán)關(guān)聯(lián)度。(5)評(píng)價(jià)分析。根據(jù)灰色加權(quán)關(guān)聯(lián)度的大小,對(duì)各任務(wù)進(jìn)行排序,可建立任務(wù)的關(guān)聯(lián)序,關(guān)聯(lián)度越大,其對(duì)會(huì)員來(lái)說(shuō)越有吸引力。5.4.3 實(shí)施效果 通過(guò)灰度關(guān)聯(lián)分析的方法,可以實(shí)現(xiàn)會(huì)員對(duì)任務(wù)的執(zhí)行意愿的排序。根據(jù)以往定價(jià)數(shù)據(jù),進(jìn)行精準(zhǔn)定價(jià)分析,每一個(gè)會(huì)員都可以得到一個(gè)任務(wù)價(jià)目表,促進(jìn)任務(wù)的能順利完成,極大提高了用戶體驗(yàn),使用戶與公司雙方都獲得收益。同時(shí)可以減少未完成任務(wù)的數(shù)量,使發(fā)布的任務(wù)更加可靠的完成。六、模型優(yōu)點(diǎn)與缺點(diǎn)優(yōu)點(diǎn)1

35、. 模型易懂,實(shí)際應(yīng)用價(jià)值高;2. 問(wèn)題二中考慮因素較多,使結(jié)論更為準(zhǔn)確;3. 運(yùn)用網(wǎng)絡(luò)爬蟲(chóng),結(jié)合實(shí)際情況,從多種角度進(jìn)行分析。缺點(diǎn)1.問(wèn)題一研究定價(jià)規(guī)律和分析任務(wù)未完成原因時(shí)考慮因素不全面,沒(méi)有把會(huì)員的因素考慮到模型中;2.問(wèn)題四模型沒(méi)有數(shù)據(jù)進(jìn)行驗(yàn)證。七、參考文獻(xiàn)1 司守奎 孫璽菁,數(shù)學(xué)建模算法與應(yīng)用,北京,國(guó)防工業(yè)出版社,20152 劉載文,水環(huán)境系統(tǒng)智能化軟測(cè)量與控制方法,北京,中國(guó)輕工業(yè)出版社,20133 姜啟源 謝金星 葉俊,數(shù)學(xué)模型,北京,高等教育出版社, 20034 Robert I.Kabacoff 著,王小寧劉擷芯黃俊文等譯,R語(yǔ)言實(shí)戰(zhàn)(第2版),北京,人民郵電出版社,201

36、6年5劉曉鋼,眾包中任務(wù)發(fā)布者出價(jià)行為的影響因素研究,重慶大學(xué),2012附錄1.成功任務(wù)與會(huì)員之間的距離和成功任務(wù)方圓十里內(nèi)的會(huì)員數(shù)for j=1:522 for i=1:1878 D=distance(huiyuan(i,1),huiyuan(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis1(j,i)=dx; endendx1=dis1<10;x1=sum(x1');2.成功任務(wù)與學(xué)校之間的距離和成功任務(wù)方圓十里內(nèi)的學(xué)校數(shù)for j=1:522 for i=1:395 D=distance(school(i,1),school(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis2(j,i)=dx; endendx2=dis2<10;x2=sum(x2');3.成功任務(wù)與小區(qū)之間的距離和成功任務(wù)方圓十里內(nèi)的小區(qū)數(shù)for j=1:522 for i=1:400 D=distance(community(i,1),community(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis3(j,i)=dx; endendx3=dis

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論