空間眾包:任務發起者利用智能手機等移動設備的定位信息,請求與具體位置緊密相 關的數據,自願參與完成任務的用戶行駛到任務指定的具體地點收集相關的數據, 然后將數據返回給任務請求者。(①空間眾包平台上的工人只能參與完成分布在其附近的一小部分任務②完成任務的必要條件是在任務過期之前,實際行駛到任務指定的地點)
空間眾包應用:新聞、旅游、情報、災害響應和城市規划等
空間眾包分類:
1.工人的動機: ①基於獎勵的眾包機制 ②自我激勵的眾包機制
2.任務發布模式:
①以用戶為中心的模式(WST)
優點:工人可自主選擇附近的任何任務,無需為每次任務向
服務器透露自己的位置。
缺點:①SC服務器對空間任務分配沒有任何的控制權,這
可能導致某些空間任務從未被分配,而其他任務則被
冗余分配。
②工人根據自己的目標選擇任務,這不一定是SC服
務器的的最終目標
②以平台為中心的模式(SAT)
優點:可以在最大化整體任務分配(即,全局優化)的同時為
每個工人分配他的附近任務。
缺點:工作人員應為每項任務向SC服務器報告其位置,這
可能構成隱私侵犯
3.任務分配方法(驗證空間任務的有效性):
①基於單人的任務分配
在此分配方法中,一般假設工人是受信任的,他們可以正確完成
空間任務,而且沒有惡意意圖。因此,每個空間任務僅分配給一
個工人(最好分配給最近的工人)
②帶冗余的任務分配
在此分配方法中,基於群體智慧的直觀假設,大多數人都可以信
任。因此,具有多數票的數據是正確的。每個空間任務應由k個
附近的工人完成,其中k由發出任務的請求者定義。因此,k值
越大,任務完成的正確率就越大。
本論文要解決的問題是什么?
前提條件:SAT模式、自我激勵、基於單人的任務分配
眾包從業者,將其任務查詢請求發送到SC服務器。工人的任務查詢請求包括其位置以及一些約束條件(例如,區域),以告知SC服務器他有空工作。因此,接受到工人請求的SC服務器將其附近的任務分配給每個工人。在此類空間眾包中,主要的優化目標是在符合工人的約束條件的同時最大化總體的任務分配數量。
最大化任務分配數量(MTA)
(SC服務器不斷接收空間任務,並從工人那里不斷地接收任務查詢請求,因此,SC服務器只能在每一個時間點最大化任務分配(即,局部優化),無法知曉未來)
預備工作:
空間任務 <l,q,s,δ>表示需在二維空間位置l處應答查詢q,查詢q在時間s時被發出,並將在時間s+δ過期。(只有當工人實際位於位置l時,才能應答空間任務的查詢q)
空間眾包查詢 (<t1,t2,…>,k)是請求者發出的一組空間任務和參數k,其中每個空間任務ti將被完成k次。(注意,在單人任務分配模式下,SC服務器應將每個空間任務僅分配給一個工人,即k=1)
工作者 用w表示工人,工人是自願完成空間任務的移動設備的載體。工人可以處於在線狀態或者離線狀態。工人要在在線狀態接收任務。(請注意,在自我激勵機制下,工人自願執行空間任務,工人一旦上線,他就會向SC服務器發送任務查詢請求)
任務查詢 任務查詢是當在線工人w准備去工作得時候向SC服務器發送的一個請求。請求中含有w的位置信息l,以及兩個約束空間區域R和可接受任務的最大數目maxT。工人在矩形表示的空間區域R中接受任務,該區域以外的任何任務都將被工人拒絕。maxT是工人願意執行的任務的最大數量。(任務查詢是針對SAT模式定義的,在此模式下,工人將其位置發送給SC服務器以正確的分配任務。工人還可以在他們的任務查詢請求中指定其他約束(例如,任務的類別,他們有多少時間)。但在此文中我們將考慮兩個約束(R和maxT))
任務分配實例集 記Wi={w1,w2,…}為時間si時的在線工作者集,同時記Ti={t1,t2,…}為時間si時的可用的的任務集。Ii表示的任務分配實例集,由<w,t>形式的元組組成。元組表示空間任務t被分配給工人w,並且滿足工人w的約束條件。li表示在時間si時分配的任務數。(任務分配實例集必須符合工人的約束條件。對於每個元組<w,t>∈Ii,空間任務t的位置必須在工人w的空間區域R內。此外,每個工人最多可以分配maxT個任務(即,Ii中包含w的元組的數量最多為maxT))
最大任務分配 給定一個時間集合∅={s1,s2,…,sn},讓Ii為時間時刻si上分配的任務數。最大任務分配是一個在時間∅內向工人分配任務,使總的任務數量(即,∑_(i=1)^n▒〖Ii〗)最大化。(理想情況下,所有任務都將分配給所有工人。但是由於,工人的約束條件,這不太可能實現。因此,本文的目標是使分配的的任務數量最大化)
一個例子
本論文解決問題的方法:
將問題轉換為最大流量問題。
1.貪婪策略(GR):通過在每個時間點最大化任務分配來達到局部優化策略。貪婪策略在工人的約束條件下分配給每個工人其附近的任務。Ford-Fulkerson算法等計算最大流量的算法。
2.最小區域信息熵優先級(LLEP):利用區域信息熵來改進貪婪策略。如果空間任務位於工人數量較多的區域(即,較高的區域信息熵),則將來更有可能執行該空間任務。因此,LLEP方法將較高的優先級分配給區域信息熵較低將來不太可能完成的空間任務,從而改善總體任務分配。LLEP策略通過計算每個時間實例的最小成本最大流來解決MAT問題,其中成本是根據任務的區域信息熵來定義的。
3.最近鄰優先級(NNP):由於工人應親自前往某個位置以執行任務,因此工人的差旅成本也是一個重要因素。此方法通過為差旅成本較低的任務分配更高的優先級,將工人的差旅成本納入任務分配。
用工人w和空間任務t之間的歐幾里得距離表示工人w到任務t的旅行成本,記為d(w,t)。因此,通過計算每個工人與其空間區域內的任務的距離,可以將較高的優先級與較接近 的任務相關聯。可以將一定成本,即工人w與任務t之間的距離,與工人w和空間任務t之間的每條邊相關聯。因此,問題為在每個時間實例中分配最大數量的任務,而分配的總成 本最低。在此方案下,問題變成最小成本最大任務分配實例問題,可以使用與2類似的解決方案,但具有不同的成本函數來解決此問題。
評估方法:
性能指標:①分配的任務總數 ②工人執行空間任務的平均差旅成本,差旅成本根據工人與任務位置的之間的歐幾里得距離(其他指標也時用,例如網絡距離)來衡量。
整個的空間面積為50km50km,時間集合∅={s1,s2,…,sn}為100天,時間實例的粒度為1天,每個空間任務的持續時間設置為40天(即δ=40),任務數量默認為100k(變化范圍50k-200k),工人數量固定為10k,maxT范圍1-20,R范圍整個區域的0.01~0.05。區域信息熵范圍30m30m。
1.第一組實驗:改變空間任務的數量
2.第二組實驗:最大可接受任務約束的影響
3.第三組實驗:空間區域約束的影響
代碼:
思路:求解某一時刻的最大任務分配,從文件中讀取數據,點數,邊數,源點序號,匯點序號,每邊的起點,終點,容量。依據數據構建網絡流圖是,使用dinic算法求解最大流。
想法和體會:
1.實驗中未考慮任務的時效性
2.工人接受任務的最大數量和行動范圍應該是不確定的
論文文獻:GeoCrowd: Enabling Query Answering with Spatial Crowdsourcing