軌跡數據挖掘



《軌跡數據挖掘》由會員分享,可在線閱讀,更多相關《軌跡數據挖掘(10頁珍藏版)》請在裝配圖網上搜索。
1、XXXX 大學計算機學院XXX 級本科生課程報告課程名稱創新創業教育與實踐扌艮告時間學生姓名學 號專 業任課教師任課教師評語任課教師評語(對課程基礎理論的掌握;對課程知識應用能力的評價;對課程報 告相關實驗、作品、軟件等成果的評價;課程學習態度和上課紀律;課程成果和報告工 作量;總體評價和成績;存在問題等):成績:任課教師簽字:摘要軌跡數據作為泛在地理信息環境中社會遙感數據的主要表現形式之一,為 從個體的視角研究群體的空間移動規律,提供了新的數據支撐和研究思路。在 當前的大數據背景下,通過軌跡數據發掘人類的移動規律和活動模式,進而探 求蘊含的深層次知識,是解決城市問題的重要途徑,軌跡數據挖掘也
2、由此成為 地理信息科學及相關學科的研究熱點。本文首先闡述了人類移動規律研究常用 的軌跡數據集及在該數據集上開展的相關研究和典型應用;然后從城市空間結 構功能單元的識別及城市韻律分析、人類活動模式的發現與空間移動行為預 測、智能交通的時間估算與異常探測、城市計算的其他 4 個方面,綜述了軌跡 數據挖掘在城市中的應用;最后,指出了軌跡數據挖掘面臨的挑戰和進一步的 發展方向。關鍵詞:軌跡;數據挖掘;城市計算;人類移動;人類活動模式AbstractThe trajectory datasets record a series of position information at different t
3、imes, so they become the new data sources to study the laws of human mobility. As a main form of social remote sensing data, trajectory datasets also bring a new individual viewpoint to study geographical phenomena. With the emergence of big data, trajectory data mining becomes a hot topic in geogra
4、phical information science, urban computing and other correlative disciplines. In this paper, we gave a brief review on trajectory data mining and its applications in cities. First, we listed the data sets frequently adopted by human mobility research, gave the classification and their typical appli
5、cations using FCD data, mobile phone data, smart cards data, check- in data, etc. Then, we summarized its application in solving citiesproblems from four aspects: (1) the identification of urban spatial structure and function unit; (2) the patterns recognition of human activity and the behavior pred
6、iction of human movement; (3) the traffic time estimation and the anomaly detection of intelligent transportation; (4) other applications in urban computing such as in urban air and noise pollution, disaster prevention and rescue, even in intelligent tourism and information recommendation. At the en
7、d, we pointed out the challenges and further research directions of trajectory data mining.Key words: trajectory data; data mining; urban computing; human mobility; human activity patterns1 引言人地關系一直是地理學研究的核心問題,人本化的趨勢使研究視角從宏觀 走向微觀,更加側重于從個體角度來研究空間問題。隨著傳感器網絡、移動定 位、無線通訊、移動互聯網、高性能計算與存儲技術的快速發展,數據采集與 計算單元的
8、外延不斷延伸,加之地球電子皮膚的逐漸形成、人人都是傳感器概 念的付諸實施,特別是 3G/4G 技術的廣泛使用,以手機為代表的智能移動終端 的普及,使時空數據獲取的粒度不斷細化,加速了地理信息的泛化過程。長期 以來,個體數據依靠傳統的活動日志調查等手段獲取,精度低且缺少對時空活 動軌跡的連續和完整的描述,難以大規模、長時間地觀測和記錄人的空間移動 行為。泛在網絡環境下智能移動設備的普及,使得為用戶提供無處不在的位置 服務成為可能。同時,這些智能設備也詳細記錄了個體在真實世界中的活動軌 跡,如實反映了人們的生活與行為模式。觸手可及的軌跡數據給地理學中基于 個體視角的研究提供了新的數據源和研究契機。
9、軌跡數據不僅記錄了人在時間序列上的位置,也隱喻了人與社會的交互、 人在地域上的活動,乃至人與人之間的關系等社會屬性。單一對象的活動反映 了個體自身的行為特征,群體的活動反映了該群體共同的行為特征,而同一城 市大量移動對象的活動,則反映了該城市總體的社會活動特征。所以,軌跡中 蘊含的知識也是目前智慧城市、城市計算、社會遙感等認識城市行為、優化城 市決策不可或缺的因素。通過軌跡數據挖掘發現隱含的知識,探求深層次的城 市動力學機制,也是解決城市交通、城市環境、突發事件應急等重大社會問題 的有效手段。2 人類移動軌跡研究常用數據集軌跡數據是帶有時間戳標記的一系列位置的集合。目前,已有多個數據集 應用到
10、人類移動規律的研究探索中,其中應用較廣泛的是出租車、手機和志愿 者數據集等。這些數據集在時間、空間的尺度和粒度上差別較大,分別適用于 不同的研究。人類移動規律研究的數據集及其典型應用如表 1 所示。表1人養樓動硏究中常用的軌跡數據集Tab. 1 The trajMrv (iiita sets on Ji liman nwlMlity study軌跡驗據類型丄要冊九人員Lu,IJ畀能交通Zheng151-11環星監刪、能孵捷揮P曲町城市叨匪區識別于機數據另包自出租車牧曲散據竽1軌|汕:|沖1車信恩肥等手擾所住的基姑、手瞇 佶狀恚Pci陰城朮功能鳳識別Tfasail?11城市功態Phit(iakk
11、ittiuki,:,垠祈行為甘析eulife(GFS)Zhengc,,就DC利于機EttWTHnii 啊廳沏分新與曲測張怕華叫呂刖班M軌跡港丈化、|打燈息崔取別卡地點、撫數蔗棄空1可結徇、功能區誘別與迪勤關孝鑒到禮交網爭的企到信衽口0繪濟地岬分析和區域底泉聊3軌跡數據挖掘的城市應用軌跡數據體現個體的活動規律,蘊含個體的行為模式、活動方式、活動范 圍及社會網絡關系等特征。個體群組的群體移動軌跡可推斷出城市的人群聚集 規律,體現著城市的韻律與動力機制,這是解決城市問題的核心所在。所以, 軌跡數據在城市規劃、城市交通、城市動態、城市計算、公共安全等領域得到 廣泛的應用。3.1城市功能單元識別與城市韻
12、律分析城市人群移動的時空規律反映了城市人口在時間和空間上的動態變化,體 現城市的韻律,隱含城市的功能分區,表征城市活動的動力學機制。城市功能 區劃分的目的是識別出工業、商業、住宅等不同的城市活動單元。傳統上一般 采用遙感影像識別的方法,這對于識別土地利用類型是比較有效的,但卻無法 識別出人類活動產生的功能單元,如職住區的區別等。軌跡隱藏著豐富的人群 活動模式,不同城市功能區的人流變化模式不同,依據人群在特定空間上的活 動強度和時空序列模式,通過聚類或者分類方法,能有效地識別出不同的活動 單元。但這種識別方法精度不高,因為:(1)同一個地理單元會存在多種不同 類型的功能分區,如商住區就是商業和居
13、住區的混合等;(2)城市功能分區本 身就存在一定的模糊性和不確定性。但可通過POI語義化信息來精化土地利用 類型的識別結果,以提高城市功能分區識別的精度。不僅在城市尺度上通過軌跡數據可進行有效的功能區劃分。在城域尺度 上,劉瑜等利用手機通話數據,通過社區分割等算法擬合出符合某種條件的邊 界,這種邊界和行政區域具有高度的相關性,并證明了這種相關性除了空間近 鄰關聯外,還與文化、經濟和歷史等各種因素有關。軌跡數據時空序列的規律性波動,表達了城市的動力與韻律,職住分離與 通勤是城市韻律的表現形式,軌跡數據為城市職住分析與城市通勤研究提供了 新的思路。特別是手機數據由于數據量大、普及面廣,在統計規律上
14、比交通出 行行為的問卷調查更具有優勢,因而得到廣泛的應用?;谑謾C數據進行職住 地分析,一是根據特定時間段內的通話頻度來識別;二是依據通話的位置分布 特征并結合活動時間來判斷。Ratti等使用手機的位置信息研究了米蘭的城市活 動強度及其時空分布特征,Calabrese等利用手機網絡數據進行了羅馬城市活動 的實時監測并研究了城市的活動強度。手機數據盡管總體上數據量很大,但是 數據的時間和空間粒度較粗,難以刻畫城市動態的精細特征。除使用 GPS 和手機定位的軌跡數據外,公交智能卡的刷卡數據具有連續性 好、信息全面且動態更新等優點,也開始用于城市空間結構方面的研究。龍瀛 等依據北京市 850 萬張公
15、交卡的刷卡記錄結合北京市居民出行調查和土地利用 類型數據,分析了北京市職住關系和通勤出行特征;Joh等使用首爾大都市區 的 1000 萬次的刷卡記錄,分析了出行軌跡與該地區的土地利用特征之間的關 系;Roth等使用倫敦的Oyster卡記錄地鐵乘客的移動數據分析了城市多中心 的空間結構特征。公交卡數據盡管能有效地分析持卡者的移動行為,分析城市 的職住區分布和通勤特征。但是,公交卡的覆蓋范圍有限,對北京等出差人數 較多的城市,人群流向分析的精度尚待驗證。上述城市功能單元識別的相關研究,總體上還處于對其他地理學方法已發 現規律基礎上的驗證層次,就是通過軌跡挖掘再現已知規律。通過軌跡數據發 現新規律、
16、新結論的研究相對偏少。下一步的研究重點應考慮細粒度的 POI 信 息及其語義特征,結合軌跡體現的社會屬性,提高城市功能單元識別的時空粒 度,使相關研究從宏觀走向微觀,以進行精細化的城市韻律研究,為城市規劃 及相關社會學的研究提供更為精準的科學支持。3.2人類活動模式與移動行為預測 人類移動行為預測,一直是行為地理學和時間地理學關注的熱點。長期以 來,相關研究一直認為人的行為是不可預測的,但是, Song、Gonzalez 等的研 究發現,個體行為看似隨機無序的背后具有高度的時空規律性,甚至推斷出人 類活動行為具有 93%的可預測性,此后人類活動預測的相關研究陸續開展起 來。軌跡中的錨點、出行范
17、圍和形狀,體現著用戶的活動區域、工作性質和生 活模式等信息,在了解活動模式的基礎上,可進行個體移動行為的預測并實現 位置推薦。出租車軌跡數據是研究人類活動模式的一個重要數據集,通過軌跡中上下 客位置的密度分布與時間間隔,不僅能發現上下車的熱點區域,還能發現 OD 流的移動方向,從而分析人群的移動規律,進行社區結構的劃分。在了解人類 活動模式的基礎上可進行移動行為的預測,如Veloso等利用出租車軌跡數據預 測了給定條件下的上客點的位置; Li 等根據出租車軌跡預測出一個區域每個時 間段的乘客數量;齊觀德等使用出租車軌跡數據通過計算乘客等候時間的概率 分布預測出某時某地等候出租車的時間,具有較高
18、的精度。手機數據也開始用于人類移動行為預測的研究, Phithakkitnukoon 等使用 手機數據研究了日本的手機用戶的旅行規律;Csaji等使用葡萄牙10萬手機用 戶的數據發掘了用戶的活動模式; Chen 等根據手機數據猜測了手機用戶的活 動位置;Ahas等通過手機數據研究了愛沙尼亞的季節性旅游的游客活動模式。 被動式的手機數據盡管為研究人類活動模式提供了有力的數據支撐,但是,該 數據集往往只記錄位置信息或者通話數據,缺乏進一步的數據描述。為此,國 內外研究者主動采集了多個數據集以進行更精細的研究。志愿者數據集比較知名的有Nokia的MDC數據集和微軟中國研究GeoLife 數據集。No
19、kia的LDCC計劃產生的MDC數據集,不僅記錄了手機用戶所處 的基站數據,還記錄了通話與短信、WiFi與藍牙設備及各種App的使用情況。 Trinh等依據該數據集進行了下一個位置與將使用的App的預測研究Etter等在 該數據集上開始了從一個位置預測將要去的下一個位置的研究,這2 項研究均 取得了較好的效果。鄭宇等在Geolife數據集上,也開展了移動行為預測的研 究,并根據軌跡的相似性計算用戶的相似性,進行了個性化的位置推薦試驗, 取得了較好的研究效果。在活動模式與行為預測上,出租車數據體現的是某一輛車的規律,無法定 位至特定的人,故難以使用該數據進行人的行為預測,實際上是車的行為預 測。
20、手機數據記錄的是基站的位置,空間覆蓋范圍較大,也無法在POI層次上 研究人的移動軌跡,基于該數據的活動模式判別和行為預測也是一種粗粒度 的、概略性的探測。志愿者數據集特別是GPS采集的數據集(如Geolife)的 時間和空間密度很大,能滿足精細化的研究需求,活動模式判定和行為預測也 具有較高的精度,但是其缺乏長時間序列的數據存儲,難以表征人的行為在時 間上的不同和演變。人的活動模式研究的直接應用,是進行移動行為的預測?,F有的研究是先 從歷史軌跡中推斷出規律性的活動,然后依據靜態的模式進行下一個位置的判 斷。人的行為的復雜性決定了人的移動是一個受多種因素綜合影響的自適應過 程。進一步的研究除應考
21、慮動態的上下文環境、人的社會關系等對人的活動趨 向的影響,更應考慮個人的偏好和興趣特征等因素,發展新的模型和算法以提 高預測的精度。3.3智能交通時間估算與異常探測 軌跡數據特別是出租車軌跡,能直接反映城市的交通狀態,交通時間估 算、交通異常探測,是軌跡數據在智能交通上最直接的應用。 Chen 等使用軌 跡數據進行的短時交通預測取得了較好的效果; Wang 等進行的通行時間估算 也具有較高的時間精度。通過軌跡探測交通流中的一些異常行為也取得了較好 的實驗效果。Pang等使用LRT模型進行了交通異??焖贆z測方法的研究; Kanoulas 等使用軌跡數據進行了交通擁堵路段監測和交通異?,F象發現的研
22、 究。 Liu 等探測了交通流中交通異常的時空因果關系; Chawla 等推斷了交通流 量異常的根本原因; Pan 等根據人群移動和社會網絡進行了交通異常中的擁堵 感知方面的研究。這些研究為交通異常的快速識別與處置提供了有效的方法支 持。目前,軌跡數據上傳與處理的速度難以滿足實時性的需求,上述研究的時 間估算與異常探測是基于歷史數據得出的。因此,這些方法的處理效率,能否 滿足實時性的需求還待進一步研究。軌跡數據還可用于交通路線的優化與設計。出租車作為城市人群運移的重 要工具,出租車司機對道路情況往往比較熟悉,他們的行車路線可被認為是兩 點之間的最優路徑(經典路徑),因此,可通過出租車軌跡的統計
23、規律發現最快 的行車路線。Yuan等在T-Drive項目中根據出租車軌跡數據,解算出個性化的 最快線路設計,不僅為每 30 min 駕車路程節約 5 min 時間,還可通過為不同 用戶選擇不同的道路來緩解可能出現的擁堵。同時,通過最優的路線對比也能 發現不合理的道路規劃,為城市交通路線設計提供依據?,F有的交通時間估算和異常探測研究,是在歷史數據集上截取不同的時間 片段,開展模型與算法的測試與驗證。盡管軌跡數據集體量巨大,但是,具體 到單項研究可用的數據往往非常稀疏,導致交通時間估算特別是短時交通時間 估算總體上不甚理想,而這是動態導航的基礎。因此,下一步的研究應側重于 提高高速動態數據的獲取、
24、處理與分析的效率,實現動態導航路徑的實時及面 向個體的可視化表達,并進行合理的交通誘導,以提高現有路網的通行調配能 力。3.4 城市計算的其他應用 智能交通、城市功能區識別和活動模式與行為預測是軌跡數據挖掘的主要 研究方向。作為城市計算的主要數據源,軌跡數據已開始應用于城市環境監 測、能源消耗及疾病健康等領域的研究,并取得了初步的成果。 Zheng 等使用 有限個地面監測站的空氣質量數據,結合交通流、道路結構、興趣點分布、氣 象條件和人口流動規律等大數據,推斷出整個城市細粒度的空氣質量,取得了 較好的實驗效果;同時,對于噪聲污染精細粒度的監測也在監測點數據,并結 合簽到數據等的基礎上取得了預期
25、的效果。更有一項創造性的研究是通過出租 車軌跡數據,計算在加油站點的排隊等候時間,估算能耗及汽車尾氣在PM 2.5 排放量中的占比。城市公共安全也是城市管理的一項重要職能, Pang 等通過軌 跡研究發現交通流的紊亂從而判定城市突發事件;Song等研究了 160萬人在日 本大地震和福島核事故以后的移動規律;Lu等研究了海地大地震的災民移動軌 跡,后 2 項研究旨在發現災后大規模人群的移動規律,以期為災后應急救援提 供理論支持。除此之外,軌跡數據挖掘在智慧旅游、商業定投、信息推薦等方面的研究 也取得了一定的成果。軌跡數據挖掘能探求軌跡背后深層次的知識,已成為大 數據背景下研究社會、城市等復雜問題
26、的重要數據支撐和解決方法。4 結論以出租車數據、手機數據、志愿者數據等為代表的社會遙感數據,踐行著 人人都是傳感器的理念,感知著人類的社會活動,體現著城市的韻律。作為位 置大數據的典型形式,軌跡數據不僅在于表現空間定位信息,更在于引申出人 的社會屬性、社交網絡及所處的社會環境信息。通過軌跡數據能有效地發現個 體的活動模式、群體的移動規律,使人們以前所未有的深度認知自己的生活軌 跡、社交行為,乃至是環境的變動和城市的演進等。泛在網絡下個體活動信 息,得到了前所未有的廣度和深度的記錄,時空粒度的不斷細化為社會科學的 定量分析提供了可能,同時也給地理信息科學提出了新的挑戰。今后軌跡數據挖掘的研究重點
27、應關注如下 4 個方面的問題:(1)由于軌跡 數據的體量巨大、信息碎片化、結構化程度差,涉及到高動態移動對象的存儲 與分析,對現有的數據庫管理軟件及現有的數據處理、存儲、分析技術,都提 出了更高的要求,關系數據庫的管理模式和時空索引技術,對處理大規模的軌 跡數據顯得力不從心,需研究和發展新的數據管理與存儲、分析的手段。(2) 軌跡數據的高動態、高實時性使其更加關注數據感知、管理與分析的速度,對 算法的時間和空間復雜度提出了更高的要求,并行計算等高性能計算模式應更 深入地融合進軌跡數據的計算中。(3)隱私問題是軌跡數據處理與分析過程中 的一個不可回避的問題,其不僅是一個技術問題,也是一個道德與法律問題, 應引起進一步的關注。(4)多學科研究方法的交叉和融合將進一步延展,在傳 統的計算機科學等學科融合的基礎上,將進一步和物理學、復雜系統、社會 學、管理學,甚至是自然語言處理等學科領域結合,從不同側面發展新的方法 和技術,共同推動軌跡數據的深度應用與創新??傊?,還需在軌跡大數據的智能感知、智能提取、智能服務等幾個環節投 入更多的研究,以更準確地感知城市脈搏,使城市更加智能,提供更個性化、 更精準的位置服務。
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新DOC
最新PPT
最新RAR
- 同位素膠囊自動分裝系統SolidWorks三維圖
- 同位素膠囊自動分裝系統設計【9張CAD圖紙+畢業論文+SolidWorks三維圖】
- 一種高溫防砂節流器SolidWorks三維圖
- 臥式采油樹生產主閥CAD裝配圖
- 同位素膠囊自動分裝系統CAD圖紙9張
- 壓縮機底座零件鉆孔專機SolidWorks三維圖
- 吸塵器時尚造型設計CAD圖紙7張
- 吸塵器時尚造型SolidWorks三維圖
- 吸塵器時尚造型設計【7張CAD圖紙+畢業論文+SolidWorks三維圖】
- 壓縮機底座零件鉆孔專機CAD裝配圖
- 吸塵器時尚造型CAD裝配圖
- 一種氣動震源機械系統的設計【9張CAD圖紙+畢業論文】
- 同位素膠囊自動分裝系統CAD裝配圖
- 圓錐破碎機的設計CAD圖11張
- 壓縮機底座零件鉆孔專機設計【6張CAD圖紙+畢業論文+SolidWorks三維圖】