以機器學習演算法分析kinect骨架資料實踐即時的姿勢識別功能

目前,AI最廣泛常用的範疇不外忽是聲紋辨識、自然語言溝通、影像辨識等應用。但似乎在動作肢體方面的辨識或特徵評估卻較少被探討和實作。然而,肢體動作表現是每個人從事日常活動非常重要且基本的能力之一,同時不同的肢體型態和動作模式也代表著各自的涵義,更進一步來說,以醫學的角度而言,動作模式的異常往往與疾病的特徵相關,如中風病患會因為張力過強而表現出多關節聯合的協同動作,因此,當發現一個人具有異常的動作特徵或肢體變化,便可推測或評估出是否發生某種潛在疾病或健康問題。

然而,除了經過專業的醫療人員以人為觀察的評估外,我們是否還有別的方法能夠獲得辨識身體動作或姿勢、肢體變化的結果?根據一篇科學期刊的研究報告顯示,運用機器學習的技術來從事肢體動作的識別和解讀似乎是個可行之策。

此篇研究的作法簡要的來說,如下圖所示,是利用3D動作偵測器取得人體骨架的座標數據資料,再將此原始骨架資料進一步處理轉化為向量特性的肢段參數並給予指定的姿勢標籤(共18種),由於不同的肢段向量參數組合出不同的身體姿勢,所以運用機器學習演算法完成的預測模型便能自動化的辨識出使用者現在的姿勢狀態而指認出正確的姿勢類型。

ML實驗流程

為了進行骨架資料的分析處理進而利於後續姿勢識別的作業,每一時間點的骨架資料會被拆解成數個向量變數,如下圖所示,此向量變數顯示出各個關節點相對在空間上的位置關係,可想而知,透過此資訊的分析便可推測出最終有意義的姿勢特徵或動作屬性。

肢段參數

當然,運用原始的身體骨架資料來執行姿勢識別只是眾多應用的案例之一,未來一定有更多新的情境,需要採用機器學習技術去解析複雜的肢體動作模式的狀況,而不限於靜態姿勢的評估而已。十分期待和看好機器學習技術在往後的發展,尤其在動作分析領域,許多像是利用動作控制為基礎的人機互動系統使用或在醫療端有效的替代人力進行肢體表現評估皆得以受益於此科技的幫助,值得大家用心實踐與研發。

Y. Choubik and A. Mahmoudi, “Machine Learning for Real Time Poses Classification Using Kinect Skeleton Data," 2016 13th International Conference on Computer Graphics, Imaging and Visualization (CGiV), Beni Mellal, 2016, pp. 307-311.