跳到主要內容區

Behavior pattern mining from mobile phone sensory data

ImgDesc

       今天請彭教授來講授有關behavior pattern mining的部分,這部分對我來講可能算是比較陌生一點,所以聽這個演講前,我們必須知道到底甚麼是behavior pattern mining呢?要了解這個東西之前,我們可能要先了解「Data mining」的相關背景知識是甚麼,這邊稍微科普一下,Data mining的中文叫作資料探勘,主要是指利用一個龐大數據庫建立模型,並從中找出隱藏的特殊關聯性及特徵。例如:某公司握有自身客戶的資訊(包含:年齡、資產、交易頻率、交易量等),利用此資料庫找出其客戶消費的模式、習慣,並據此將客戶群分類,藉此針對不同客群做出精準行銷,就是所謂的資料探勘。而資料探勘其實又分成很多層面,首先是分類分析(Classification),做研究的期間,我們必須透過研究數據庫中的特徵,將已知資料做出分類,並根據已知的特徵預測未經分類的新進數據,是做研究中很重要的一部分;再來是群集分析(Clustering),簡單來說就是要歸納出每一組資料間的差異性及相似性、並透過迴歸分析(Regression)來分析透過一系列的現有數據去預測未知數據的可能值,還有包含像時間序列分析(Time Series Forecasting)、關聯分析(Association)、順序型態分析(Sequential Pattern Analysis)等細節部分這邊就不多提了,所以可以看到behavior pattern mining是有非常多東西要去進行考慮的部分。
       再來彭教授就是分享論文實作的東西,這篇論文主要是在介紹有關個人消費行為的實作,光從主題來看,就知道這個方面非常的不好做,首先,dataset訓練量要非常充足,還有時間空間資訊要怎麼取得?更甚至人類的消費行為要如何去做分析,其實都是難點,因為每一個人的消費行為都是不一樣且特殊的,而且資料量不夠大的話有些細節的東西會沒有辦法去做辨識,因此彭教授他們想到一個方法,就是促進使用者作更多消費的動作,且對某些商家做合作的動作,來去做引導消費,這樣就能夠解決資料量的問題。再來彭教授他們就是開始要利用演算法的部分,去找出消費者的消費輪廓,並預測消費者的消費行為為何,因此最後評估的結果就是他們要利用到trajectory data來做分析,trajectory data講簡單一點就是通過對一個或多個移動對象運動過程的採樣所獲得的數據信息,包括採樣點位置、採樣時間、速度等,這些採樣點數據信息根據採樣先後順序構成的軌跡數據。有了trajectory data作為支撐,剩下的時間區段只要當成輸入帶到演算法去做判斷,就能夠輸出個人可能消費的的區域及種類可能為何,真的算是非常的厲害。
       而類似做這樣行為偵測的部分,其實我只知道大概像是Openpose,keypoint等等比較常用的演算法架構而已,在聽這一次演講之前,我認為行為辨識的相關資料真的很少,甚至能用的資源感覺應該也不太多,但今天彭教授講完有關behavior pattern mining的部分,瞬間覺得這部分的資料量可能會比我所想的要來的更多,而且根據實用性來說,也是非常高的,相信依靠數據統計的力量再把資料量給撐大,這個系統只會隨著時間長久,達到更完善更完美的地步,這個系統我認為一堆家庭主婦會很愛用,因為人不可不買東西,所以這個系統絕對是會有實用性的。
       最後在這邊也非常感謝彭教授這一次演講所分享的東西,雖然今天講述的部分behavior pattern mining的領域沒有一些先被知識的話應該會有些不好懂,因為不了解Data mining的話,說真的彭教授如果講到比較技術的層面,應該也是不太能去理解中間過程到底在做甚麼,其實我也是在課堂中間有稍微查了一下資料,才比較能夠聽得懂裡面比較有一些技術相關的內容,不然對不是做AI相關領域的來說,這次的演講我認為聽的可能會有點吃力,但內容部分必須說真的是做得非常好,如果有評分分數的話我一定是給滿星好評無誤。

瀏覽數: