




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、心理學報2009, Vol 141, No 11, 35-43A cta Psychologica S in icaDO I :10. 3724/SP. J. 1041. 2009. 0003535收稿日期:2007-11-133全國教育科學“十一五”規劃教育部重點課題(DCA080141 、浙江省自然科學基金資助項目(Y604275 、浙江省哲學社會科學規劃后期資助項目(08HQZZ038 資助。通訊作者:許百華, E 2mail:bhxu305zju. edu . cn人機交互過程中認知負荷的綜合測評方法3李金波許百華(浙江大學心理與行為科學學院, 杭州310028摘要設計模擬網絡引擎搜索
2、和心算雙任務實驗, 分析主觀評定、績效測量和生理測量三類評估指標對認知負荷變化的敏感性; 采用因素分析、BP 神經網絡和自組織神經網絡三種建模方法, 探索人機交互過程中認知負荷的綜合評估建模方法。結果顯示:心理努力、任務主觀難度、注視時間、注視次數、主任務反應時、主任務正確率6個指標對認知負荷變化敏感; 采用多維綜合評估模型對雙任務作業認知負荷進行測量總體上比采用單一評估指標的測量更為有效。BP 網絡和自組織神經網絡兩種神經網絡模型對認知負荷的測量結果優于傳統的因素分析方法。關鍵詞人機交互; 評估; 認知負荷; 神經網絡; 建模分類號B841. 21前言隨著計算機和自動化技術的發展, 人在人機
3、系統中的職能發生了很大變化, 狀態的監控任務, ( 大加重。、雜人機系統中, 容易出現認知負荷過高, 甚至超負荷現象。過高的認知負荷將嚴重影響人的工作效率、操作可靠性和身心健康, 進而影響整個人機系統的效率和可靠性。因此, 認知負荷已成為人機系統評價的主要指標之一。最早對認知負荷開展研究的是美國心理學家M iller (1956 。此后, 國外一些學者對認知負荷的含義、結構和測評方法進行了大量的研究。Cooper (1990 將認知負荷定義為在特定的作業時間內施加于個體的工作記憶的心理活動總量。Paas 和van Merrienboer (1994 認為認知負荷由多維度構成, 是執行一項具體任
4、務時施加于個體認知系統的負荷。認知負荷目前尚不能直接進行測量, 而只能用間接的方法對其進行評估。常用的評估技術有任務績效測量、主觀評定和生理測量等三大類(Paas &Mer 2rienboer, 1994; B runken, Plass &Leutner, 2003;Faircl ough, Chris, Dan 2iel A lan, 2berg, 2006 。它的基本假設是, 隨著作業難度的提高, 對人的信息加工資源的需求相應地增加, 當認知負荷對個體的要求超出其可支配的資源總量時, 作業績效將出現不同程度的下降。主任務測量常用的指標有操作準確性、反應時、信號漏失率和虛報
5、率等。次任務測量采用雙任務作業情境, 要求作業者除執行主作業外再完成一項額外的作業(次作業 , 通過考察雙任務作業情境下次作業績效受影響的程度(相對于單任務情境 來間接評價主作業的認知負荷。生理測量是通過測定作業者在進行指定作業過程中出現的生理反應來間接地評估認知負荷, 常用的生理指標有瞳孔直徑、心率和事件相關電位等(Chirs, Daniel &A lan, 2007; Ahlstr om &Fried man 2berg, 2006 。主觀評定技術是由作業者根據主觀感受與體驗來評估認知負荷, 通常涉及個體知覺到的心理努力、任務難度和時間壓力等方面。上世紀80年代以來, 國外
6、一些研究者相繼開發出了多種認知負荷主觀評定方法, 如Paas 和Van Merrienboer (1994 使用九級評定量表測量被試在理解任務材料上投入心理努力的程 36心理學報41卷度, 進而對認知負荷進行評估。Kalyuga, Chandler和S weller (1997 使用由作業者自我報告任務難度的方法來測量認知負荷。此外, Sal omon (1983 、Tabbers (2004 、Paul (2006 等也分別提出了相類似的認知負荷主觀評定方法。已有的研究表明, 上述3類測評技術各有優點和局限性。例如, 主任務測量比較直接, 對作業本身無干擾, 但只在中等負荷水平時較敏感; 次
7、任務測量相對比較敏感, 效度較高, 但容易對主任務產生干擾。此外, 任務績效與認知負荷的關系不一定是簡單的線性關系。例如, Meister (1976 將認知負荷等同于任務需求, 發現任務需求與工作績效之間是曲線的關系; 而W aard (1996 則認為, 任務需求與任務績效之間呈“倒U ”形的關系。主觀評定無干擾, 操作簡便, 但要求被試采用內省的方法來評定負荷水平, 因而容易出現較大的偏差。此外, 主觀評定結果與個體特征、認知策略以及個體的心理和生理狀況等多種因素有關, 即使同一個人對同樣的任務, 在不同的作業時間段也有可能出現不同的評定結果。Paas 和Van Merrienboer
8、(1994 卷為例, 覺, 的關聯程度, 于任務過難, (Reed, Bur 2t on &Kelly, 1985 。同樣, Kalyuga, Chandler 和S weller 使用讓個體自我報告任務難度差異方法所得出的結果也很可能是由于所需要完成的任務難度、個體個人能力水平等原因造成的。生理測量指標具有客觀性和實時性, 但是它們與認知負荷之間只是間接的聯系, 并且也可能會受到注意或情感等方面因素的影響(B runken, Steinbacher &Plass, 2002 。因此, 由認知負荷引起的某一生理指標的變化可能會被其它因素放大或縮小; 而且不同的任務可能會產生不同
9、的生理反應, 一項生理指標對某一類任務適用, 而對另一類任務則可能不適用。一般認為, 不同測評技術分別適用于不同的情境、不同的負荷水平范圍。因此, 利用多種技術對認知負荷作綜合評估以替代基于單一方法或指標的評估是比較合理的選擇; 同時, 認知負荷的多維度特性也決定了對其作綜合評估的必要性。近年來, 國外一些學者運用多指標綜合評估方法在心理工作負荷(Men 2talWorkl oad 的測評中進行了一些探索性研究。這些研究以多個單一評估指標的測量結果作為依據, 采用一定的建模技術對心理工作負荷進行多維度綜合評估。目前在這一領域較常用的建模技術主要有因素分析、回歸分析和人工神經網絡建模等。例如,
10、Kilseop 和Myung (2005 運用主成分分析將三種生理指標(腦電、眼動和心率 和主觀負荷組合成一個綜合評估指數, 發現綜合指數較單項指標能更準確地區分不同難度任務中被試的負荷水平。此外, 他們還通過回歸分析來考察主觀負荷與生理指標之間的關系, 以生理指標的測量結果來預測被試的主觀評定的負荷狀況。人工神經網絡簡稱神經網絡, 在國外有關的研究中, 運用神經網絡模型對負荷進行多維度綜合評估主要有兩種模式。一種模式是將主觀負荷、作業績效指標或生理指標的測量結果作為網絡的輸入項, 通過建立不同的神經網絡模型對負荷進行評估或等級劃分。例如, Roger, Robecca 和Gory (2003
11、 , 收集了5個績效指標作為輸入項BP 神經網絡模型, 66. 9%96. 0% N (2001 在一項飛行作業的30個EEG 指標的測量, 然后運用主成分分析法將這些指標歸并為少數的幾個指標, 以它們作為網絡的輸入項建立起自組織神經網絡模型。結果顯示, 借助自組織神經網絡模型能比較準確地預測信息加工要求不同的任務中負荷發生的變化。此外, 其他的研究者利用相類擬的方法也得到了較理想的結果(Laine, Bauer &J r Tef 2frey, 2002; Noel, Bauer &Lanning, 2005; Gr ootjen, Neerincx &Velt m a
12、n, 2006; Shayeghi, Shayanfar, 2006; Shayne, Penel ope &Andre w, 2007 。第二種模式是將影響負荷的主要因素作為輸入項, 通過建立神經網絡模型, 對不同任務難度條件下被試的負荷狀況進行評估。例如, D ing 和Sheue (1999 將影響監控作業的跨度(Span 、差異度(discri m inate 、可預測度(p redict 和注意轉換(transfer attenti on 4個因素作為輸入項建立BP 神經網絡對負荷進行評估, 并將神經網絡評估結果與負荷上限值進行比較, 超過上限值就認為是超負荷, 并據此對監控
13、作業過程中的負荷狀況進行實時分析和任務的動態分配。但從總體上來看, 國外學者利用神經網絡對負荷進行評估或等級劃分還處于起步階段, 并且已有的研究中, 任務條件各異, 神經網絡輸入變量不同, 因而所得的結果也難以進行比較。此外, 有的研究者還運用多層次模糊綜合評價方法對負荷進行綜合評估研究(Currie, 1997 。 1期李金波等:人機交互過程中認知負荷的綜合測評方法37在認知負荷綜合評估方面, 國外學者也進行了一些嘗試, 如Paas 和van Merrienboer (1993 、Tuovinen 和Paas (2004 將心理努力與主任務績效這兩類指標結合起來對認知負荷進行綜合測評, 獲得
14、了利用單一評估指標無法得到的許多重要信息。他們還發現, 采用多種技術對認知負荷進行多維綜合評估可顯著提高評估敏感性。但到目前為止, 對認知負荷的綜合評估研究還是零碎的, 缺乏建模方法的系統研究和不同方法之間的比較研究。在國內, 目前還未見這方面的研究報道。借鑒國外已有的多指標綜合評估方法在心理工作負荷測評中的運用, 本研究擬結合復雜人機系統中視覺信息加工作業的特點, 通過模擬實驗, 分析主觀評定、績效測量和生理測量三類評估指標對認知負荷變化的敏感性, 然后基于經篩選的認知負荷評估指標的測量結果, 分別采用因素分析、BP 神經網絡和自組織神經網絡三種建模方法, 構建雙任務作業中認知負荷的多維綜合
15、評估模型, 并對這三種綜合評估模型進行比較, 2方法2. 1擎搜索(Chen, , 在計算機屏幕上相繼呈現二幅畫面, 第一幅畫面呈現搜索目標, 包括要搜索的產品名稱和兩個指定特征(如形狀、顏色 ; 第二幅畫面呈現搜索結果, 包括5個與搜索目標同類型的產品, 每個產品包含4個方面的特征(如品牌、顏色、形狀和價格 。告知被試5個產品中有1至4個符合搜索目標要求的目標項, 要求被試查找出所有的目標項, 同時記住目標項的另外二個特征(如品牌和價格 ; 第二幅畫面呈現時間為16秒, 被試完成搜索后按鍵或在16秒后第二幅畫面消失, 被試口頭報告搜索到的各個目標項的另外二個特征。次任務作業為心算作業, 即在
16、呈現第二幅畫面后隨機呈現一個心算問題, 要求被試作兩個個位數相加而后除以3的心算, 并對兩數之和能否被3整除在計算機鍵盤上盡快作出相應的按鍵反應。主任務分成3種復雜水平, 通過改變第二幅畫面5個搜索結果中包含的目標項數目來加以控制, 分別為5個搜索結果中包含1、2和4個目標項, 代表低、中、高三種主任務復雜水平。實驗采用被試內設計, 每種實驗任務條件下實施8次搜索和心算作業, 持續時間約35m in, 不同實驗任務之間休息3分鐘。2. 2被試共33名大學生和研究生參加了實驗, 其中男生15名(占45. 5% 、女生18名(占54. 5% ; 被試年齡在20至27歲之間, 平均年齡為22. 4歲
17、, 所有被試視力正常, 優勢手均為右手。2. 3實驗儀器和測試工具實驗在計算機上進行, 眼動測量采用美國應用科學實驗室(App lied Science Laborat ory, AS L 生產的AS L 504非頭盔式眼部跟蹤記錄儀。實驗中認知負荷主觀評定分心理努力和任務主觀難度二個方面。心理努力評定采用Paas 等人(1994 制定的量表, 經Paas 驗證, 該量表的信度系數為0. 90(Paas &Van Merrienboer, 1994 。由于“心理努力”是一個專業術語, , 可能不容易理解; 為此, 完7級, 17中選擇一7努力程度依次遞增, 1表示, 表示中度努力, 7
18、表示非常努力。任務主觀難度采用Kalyuga, Chandler 和S weller (1999 制定的量表, 同樣采用7級評分制, 從1到7任務難度依次遞增, 1表示非常容易, 4表示中等難度, 7表示非常困難。研究表明, 使用該量表能夠較準確地測查出認知負荷的變化。本研究利用E 2p ri m e 實驗心理專用軟件編制程序, 實現主任務、次任務呈現時間的控制和測量相應的反應時等數據。2. 4實驗程序實驗對每個被試單獨進行。實驗前, 被試完成8次單任務的心算作業, 以這8次心算的平均時間作為被試的心算作業反應時的基礎測量值(BM 。接著, 安排被試仔細閱讀計算機上呈現的指導語, 然后進行兩次
19、雙任務作業的練習, 主任務為網絡搜索作業, 次任務為心算作業。正式實驗中, 主任務分低、中、高3種任務復雜水平。在每種任務復雜水平的條件下。被試按指導語進行8次由網絡搜索與心算相結合的雙任務作業。實驗完成后, 被試在心理努力和任務主觀難度兩個量表上對認知負荷大小作出主觀評定。主任務的3種復雜水平的實驗順序在被試之間做了平衡。2. 5數據收集與整理每一輪實驗完成后, 收集和整理以下一些數據:主任務正確率:在每次試驗后, 被試準確口頭報 38心理學報41卷告一個特征就計為一個正確回答, 每種實驗任務條件下8次試驗正確回答的特征數占所有正確特征數的比例就作為該實驗任務條件下的主任務正確率。主任務反應
20、時:利用E 2p ri m e 編制的程序自動記錄每次試驗中從搜索結果頁面呈現到被試按鍵的時間, 計算被試每種實驗任務條件下完成8次試驗的平均時間, 以它作為該實驗任務條件下的主任務反應時。次任務正確反應時變化:在雙任務條件下測得的心算反應時間稱為被試雙任務心算反應時測量值(DT M 。將DT M 減去單任務心算反應時測量值, 即C WR =DTM -BM , 計算8次試驗中回答正確的C WR 平均值就是次任務正確反應時變化。注視時間、注視次數、眼跳距離和瞳孔直徑:利用AS L504眼動儀記錄眼動指標數據。眼睛如果在較短的時間(100m s 穩定在相對的空間閾限范圍內(1° , 速度
21、低于閾限(每秒15100° 記為一個注視點。注視點的數量就是注視次數; 每個注視點的平均所占時間就是注視時間; 從當前注視點位置到下一個注視點位置之間間隔長度就是眼跳距離; 每次注視時瞳孔的平均大小就是瞳孔直徑。心理努力和任務主觀難度:每種實驗任務條件結束后用主觀評定量表分別獲得心理努力和任務主觀難度的評估值。收集到的數據利用SPSS 軟件進行分類匯總, 并進行探索分析, 去除其中的奇異值。3結果與分析3. 1任務復雜性對認知負荷的影響利用SPSS 軟件計算各個認知負荷評估指標在不同任務復雜性條件下的均值, 并分別對各個評估分析, 結果見表1。表1評估指標高MF p心理努力4. 21
22、5. 4821. 130. 002任務主觀難度333. 735. 1520. 140. 003注視時間66. 0183. 3383. 688. 910. 000注視次數283. 82366. 91388. 5518. 730. 000眼跳距離50. 7248. 5850. 600. 360. 701瞳孔直徑31. 5631. 8231. 910. 020. 977主任務反應時12385. 8515444. 4415866. 4158. 580. 000主任務正確率0. 920. 770. 55117. 440. 000次任務正確反應時變化1607. 151988. 451404. 871. 0
23、70. 346從表1可以看出, 隨著任務復雜性增加, 心理努力投入和任務主觀難度增大, 注視時間、注視次數、主任務反應時增加, 主任務正確率降低, 瞳孔直徑變大, 而眼跳距離和次任務正確反應時變化則沒有表現出規律性的變化。方差分析結果顯示, 在不同的任務復雜性條件之間, 心理努力、任務主觀難度、注視時間、注視次數、主任務反應時、主任務正確率均表現出極顯著的差異(p <0. 01 。而眼跳距離、瞳孔直徑和次任務正確反應時變化的差異不顯著(p >0. 05 。由此可見, 對任務復雜性變化敏感的評估指標主要有心理努力、任務主觀難度、注視時間、注視次數、主任務反應時、主任務正確率等。3.
24、2基于BP 網絡的認知負荷綜合評估模型BP 網絡是一種單向傳播的多層前向網絡, 它能在無需事先了解輸入輸出模式映射關系數學方程的情況下, 通過對樣本進行學習訓練, 建立由n 維輸入項到m 維輸出項之間的非線性映射。BP 網絡由輸入層、輸出層和隱含層構成, 其具體設計包括輸入/輸出項設計、網絡結構設計、網絡訓練與測試等幾個方面。輸出項神經元個數即所要區分和識別的認知負荷水平的等級數。在實際的作業情境中, 認知負荷水平受任務特征、個體特征及兩者交互作用的影響, 但在某個特定的時刻或較短時間內, 個體特征又具有相對的穩定性, 而任務特征是決定認知負荷大小的關鍵因素(Paas &van Mer
25、rienboer, 1994 。參照國外同類研究, 本研究通過改變任務特征(任務復雜性 來改變認知負荷水平, 根據前述的實驗設計, 按照任務復雜性的不同將認知負荷分成3個 1期李金波等:人機交互過程中認知負荷的綜合測評方法39等級, 與此相對應, BP 網絡設計中輸出項神經元個數設置為3個。輸入項的確定實際上就是特征量的提取, 對于特征量的選取, 主要考慮它是否與認知負荷有比較確定的相關關系。由上述分析可知, 與認知負荷顯著相關的因素有心理努力、任務主觀難度、注視時間、注視次數、主任務正確率和主任務反應時變化共6個。因此, 輸入項神經元個數設置為6個。網絡結構中的網絡層數采用單隱層的三層網絡,
26、 根據初測結果, 隱層神經元個數選擇14個, 隱含層傳遞函數采用S 型的正切函數, 輸出層傳遞函數采用S 型的對數函數, 訓練函數選擇trainl m 函數(Leven 2berg -Marquardt 算法 , 期望收斂精度為0. 001。隨機選擇33個被試中的24個共72組數據作為訓練樣本, 其余的9個被試共27組數據作為測試樣本。利用MAT LAB 軟件編制程序進行網絡訓練和測試。訓練之前, 將所有輸入項進行歸一化處理, 轉化成0, 1區間的數據, 輸出項用0-1二分數據形式表示。訓練好的網絡采用測試樣本進行測試可得到測試負荷值, 式, ( 進行比較。的絕對誤差、( , 、相對誤差絕對值
27、和均方誤差, 求取每種負荷水平下所有被試測試負荷值與期望負荷之間絕對誤差、相對誤差絕對值和均方誤差的均值; 同時計算三種負荷條件下絕對誤差、相對誤差絕對值和均方誤差的總均值, 結果見表2。表2基于BP 網絡建模的綜合評估結果期望負荷值測試負荷值絕對誤差相對誤差(% 均方誤差10. 83-0. 1717. 200. 1521. 79-0. 2110. 400. 2232. 93-0. 152. 300. 05絕對誤差均值=-0. 15相對誤差均值(% =9. 97均方誤差均值=0. 14注:表中期望負荷值1、2、3分別表示低、中、高三種認知負荷水平, 以下同。從表2可以看出, 在不同負荷水平條件
28、下, 期望負荷值與測試負荷值的絕對誤差、相對誤差和均方誤差不同。相對而言, BP 網絡模型在高負荷水平時其綜合評估結果最為準確(絕對誤差、相對誤差、均方誤差均最小 。3. 3基于自組織神經網絡(S OM 的認知負荷綜合評估模型自組織特征映射網絡(S OM 是一類無教師、自組織、自學習網絡, 它能將輸入項有序地映射在輸出層上, 實現將樣本的高維空間在保持結構不變的條件下投影到低維空間。因此, 可以應用于認知負荷水平的等級劃分和識別研究中。S OM 網絡由輸入層和競爭層組成, 我們同樣選擇與認知負荷有顯著相關的6個單維度評估指標作為網絡的輸入項。輸出層的設計涉及神經元個數和神經元排列的設計兩個方面
29、。神經元個數設定為3個, 本研究僅對認知負荷的水平進行等級劃分, 因而神經元的排列采用一維線陣來表示。訓練樣本與測試樣本與BP 網絡相同, 經測試, 1000次以上時, , 3。3絕對誤差相對誤差(% 均方誤差11. 100. 1010. 000. 1022. 100. 1025. 000. 5032. 80-0. 206. 670. 20絕對誤差均值=0. 00相對誤差均值(% =13. 89均方誤差均值=0. 27從表3中可以看出, 利用構建S OM 網絡模型對認知負荷水平進行分類其相對誤差要高于BP 網絡模型。3. 4基于因素分析的認知負荷綜合評估模型利用因素分析可以從眾多的評估指標中抽
30、取少數幾個綜合指標(公共因素 , 并根據特征根和因素負荷計算被試在公共因素上的得分。由于每個公共因素的方差貢獻率表示該因素對總體變異的解釋程度, 反映了該因素的相對重要性, 因而可以作為各個因素的加權系數。計算被試的因素得分的加權總和, 這個總和值就可以作為認知負荷的綜合評估指標值(王權, 李金波, 2002 。選擇上述6個認知負荷評估指標, 利用主成分分析方法抽取公共因素, 當抽取公共因素為3個時, 累計方差貢獻率已達89. 86%。經方差極大正交旋轉后其因素負荷矩陣見下表4。 40 表 4 評估指標的因素分析結果 評估指標 1 V1 心理努力 V2 難度感知 V3 注視時間 V4 注視次數
31、 V5 主任務反應時 V6 主任務正確率 - 0. 76 0. 94 0. 95 0. 09 0. 12 0. 17 3. 04 40. 09 心 理 學 報 41 卷 公共因素 2 - 0. 36 0. 02 0. 08 0. 22 0. 96 0. 83 1. 56 29. 90 3 0. 15 0. 15 0. 16 0. 95 0. 07 0. 47 0. 79 19. 87 知負荷 (任務復雜性 之間存在正向的相關 (系數為 0. 72,見表 6 。當任務非常容易時 , 由于個體利用 自動化知識就可以完成任務 ,因而其認知負荷低 ,投 入的心理努力少 ,績效水平能保持在最高水平 ;
32、當任 務難度增大時 ,個體需要動用更多的陳述性知識 ,心 理努力投入增加 ,認知負荷也相應增大 ,而績效水平 則會出現下降 。因而績效與認知負荷 (任務復雜 性 的關系是一種負向的相關關系 , 表 6 顯示認知 負荷與主任務正確率的相關系數為 - 0. 82; 而與任 務主觀難度的相關為 0. 69。注視時間 、 注視次數與 認知負荷 (任務復雜性 的關系也是一種正向的相 關關系 (相關系數分別為 0. 39 和 0. 53 。這說明認 知負荷 (任務復雜性 對任務即時加工有著重要的 影響 ,認知負荷 (任務復雜性 越大 , 注視時間越長 , 注視次數越多 ,反映個體在對任務加工過程中需要 接
33、收 、 、 編碼 儲存的元素數目越多 。本研究的這一結 果支持 Sweller的認知負荷理論 。 本研究中 ,眼跳時間 、 瞳孔直徑和次任務反應時 在不同的認知負荷 (任務復雜性 水平下無顯著變 化 ,這與 Paas ( 1994 等人報道的瞳孔反應對認知負 荷變化具有高度敏感性的實驗結果不一致 。但如果 對本研究得出的不同任務復雜性下瞳孔直徑的均值 作一分析 ,可以發現 , 隨著認知負荷 (任務復雜性 增大 ,瞳孔直徑還是表現出增大的趨勢 。眼跳距離 與認知負荷 (任務復雜性 的關系存在兩頭高 、 中間 低的特點 ,即任務復雜性低或高時眼跳距離較大 ,任 務復雜性中等時眼跳距離較小 ; 而次
34、任務正確反應 時變化與認知負荷 (任務復雜性 的關系則相反 , 呈 現出兩頭低 、 中間高的特點 。 4. 2 單個指標測評方法與多維綜合評估方法的 比較 抽取測試樣本在 3 種實驗條件下的各個單一評 估指標測評值 ,以及基于 3 種多維綜合評估模型得 出的評估值 ,分別計算他們與相應實驗條件下認知 負荷水平的 Spearman相關 ,結果見表 6。 從表 6 可見 ,各項測評結果與認知負荷水平均 存在顯著相關 ; 相比之下 , B P 網絡評估值與認知負 荷水平的相關性最高 (相關系數為 0. 93 , 其次為 SOM 網絡 ,而后是主任務正確率和因素分析評估 。 由此可見 ,基于綜合評估模
35、型的評估結果與認知負 荷水平的相關總體上要高于單項評估指標測評值與 認知負荷水平的相關 , 這說明采用多維綜合評估模 型對認知負荷進行評估總體上比采用單一評估指標 更為有效 。而在采用單項指標的幾種測評方法中 , 特征根 方差貢獻率 ( % 根據特征根 、 因素負荷 ,計算被試在 3 個公共因 素上的得分 ,以每個公共因素的方差貢獻率作為加 權系數計算 3 個公共因素得分的加權總和 。并將其 一一轉化為 1, 3 區間內相應的值 , 以便與期望負 荷值進行比較 ,結果見表 5。 表 5 基于因素分析的綜合評估結果 期望負荷值 測試負荷值 1 2 3 0. 82 1. 79 2. 42 絕對誤差
36、 相對誤差 ( % 均方誤差 - 0. 18 - 0. 21 - 0. 58 51. 18 18. 63 19. 48 0. 32 0. 23 0. 47 絕對誤差均值 = - 0. 32 相對誤差均值 ( % = 29. 76 均方誤差均值 = 0. 34 4 討論 4. 1 評估指標對認知負荷變化的敏感性 目前 ,國內外學者對認知負荷的研究大多采用 實驗室實驗方法 ,即通過控制任務的難度 (復雜性 來改變認知負荷水平 , 在此基礎上分析各種評估指 標值隨任務難度 (復雜性 改變的規律 , 進而判斷各 個指標用于評定負荷狀況的意義 。本研究通過改變 任務復雜性來控制認知負荷水平 , 并測量不
37、同任務 復雜性水平下的主任務與次任務績效 、 生理反應和 主觀評估指標 。以此為基礎 , 探討認知負荷與各個 評估指標之間的關系 。結果顯示 ,心理努力 、 任務主 觀難度 、 注視時間 、 注視次數 、 主任務反應時和主任 務正確率共 6 個評估指標對認知負荷的變化有顯著 的敏感性 。 目前 ,在對心理努力與認知負荷 (任務復雜性 的關系的解釋上存在兩種相互矛盾的假設 , Gim ino ( 2000 認 為 兩 者 之 間 是 正 向 的 線 性 關 系 , 而 Salomon ( 1983 則認為兩者是“ U 形 ” 倒 的曲線關 系 。本研究結果支持 Gim ino 的假設 ,心理努力
38、與認 1 期 李金波 等 : 人機交互過程中認知負荷的綜合測評方法 41 主任務正確率與認知負荷水平的相關性最高 。 表 6 單個指標測評值 、 綜合評估結果值與認知負荷水平值的相關 心理努力 認知負荷水平 : 3 p < 0. 001 注 模型 B P神經網絡 SOM 神經網絡 0. 72 3 任務主觀難度 0. 69 3 注視時間 0. 39 3 注視次數 0. 53 3 主任務反應時 0. 65 3 主任務 正確率 - 0. 82 3 BP網絡 SOM 網絡 因素分析 評估值 0. 81 3 評估值 0. 93 3 評估值 0. 82 3 4. 3 三種綜合評估模型評估結果之間的比
39、較 負荷評估指標的敏感性會不一樣 。因此 , 本研究建 立的認知負荷綜合評估模型不完全適用于各類人機 系統中認知負荷的測評問題 。本研究的意義在于提 供了如何構建認知負荷多維綜合評估模型的方法 , 并對幾種建模方法作了比較 。在實際運用這些建模 方法時 ,對于不同性質的作業 ,需要對本研究建立的 模型作出適當的修改 。 參 對三種綜合評估模型的評估結果進行整理 , 結 果見下表 7。 表 7 三種綜合評估模型評估結果的比較 絕對誤差均值 相對誤差均值 ( % 均方誤差均值 - 0. 15 0. 00 9. 97 13. 89 29. 76 0. 14 0. 27 0. 34 因素分析 - 0.
40、 32 考 文 獻 由表 7 可以發現 , 在相對誤差均值上 , B P 網絡 的 相 對 誤 差 最 低 ( 9. 97% , 其 次 是 SOM 網 絡 ( 13. 89% ,兩者均明顯低于因素分析 ( 29. 76 % 。 在絕對誤差均值上 , SOM 網絡最低 , B P 網絡次之 。 而在均方誤差方面 , B P 網絡最低 , SOM 網絡次之 。 可見利用神經網絡模型對認知負荷作綜合評估總體 上要優于傳統的因素分析方法 。神經網絡通過使用 非線性映射關系來貼近復雜的非線性系統 , 擺脫了 傳統的線性分析工具 ,而更適用于認知負荷的測評 。 5 結論 本研究通過分析任務特征 (任務復
41、雜性 與認 知負荷評估指標 (作業績效 、 主觀評估 、 生理指標 的關系 ,發現心理努力 、 任務主觀難度 、 注視時間 、 注 視次數 、 主任務反應時 、 主任務正確率這 6 項指標對 認知負荷的變化具有較高的敏感性 。以這 6 項指標 的測量結果為依據 , 分別采用因素分析法 、 P 神經 B 網絡和 SOM 神經網絡建模技術構建認知負荷多維 綜合評估模型 ,發現在雙任務情境下 ,采用多維綜合 評估模型對認知負荷進行評估比采用單一評估指標 更為有效 。而在 3 種多維綜合評估模型中 , B P 網絡 和自組織神經網絡 ( SOM 兩種神經網絡模型對認 知負荷 的 測 量 結 果 優 于
42、 采 用 因 素 分 析 法 構 建 的 模型 。 本研究由視覺搜索與心算組成的雙任務實驗結 果來分析認知負荷評估指標的敏感性 , 然后基于對 搜索作業負荷變化敏感的評估指標 , 建立起認知負 荷的多維綜合評估模型 。然而 ,作業性質不同 ,認知 A h lstrom , U. , Friedm an 2berg, F. 38, 53 - 61. C hen, C. T. C h ris, B. , D aniel, L. , A lan, Y. ( 5 , 231 - 244. C ooper, G. - 113. C u rrie, N. J. D ing, Y. L. , S heue,
43、 L. H. 281 - 298. G im ino, A. E. C alifo rn ia. ( 2006 . U sing eye m ovem ent activ ity as a co rrelate of cognitive w o rk load. Interna tiona l J ou rna l of Industria l E rgonom ics, 36, 623 - 636. B runken, R. , P lass, J. , L eu tner, D. ( 2003 . D irect m easu rem en t of cogn itive load in
44、m ultim edia learn ing. Educa tiona l Psycho log ist, B runken, R. , S teinbacher, S. , Plass, J. ( 2002 . A ssessm en t of m em o ry tasks. Avia tion, Sp ace, and Environm enta l M ed icine, 78 m en ta l w orkload via fuzzy set app lica tions. unp ub lished D octo rial D issertation, U niversity of
45、 H ouston. Fairclough, S. H. , V enab les, L. , Tattersall, A. m en ta l effo rt in academ ic tasks: a va lida tion and exp lo ra to ry study . unp ub lished D octorial D issertation, U n iversity of Sou thern cogn itive load in m ultim edia learn ing using dual2task m ethodology. Exp erim enta l P
46、sychology, 49 ( 1 , 109 - 297. ( 2006 . C ognitive p rocessing du ring w eb sea rch: the role of w orking m em o ry load in selective a tten tion and inh ib ito ry con trol unpub lished D octorial D issertation, Ind iana U niversity. . ( 2007 . EEG co rrelates of task engagem en t and m en tal w o r
47、k load in v igilance, learn ing, and ( 1997 . The developm ent of a comp osite index of ( 1999 . U se of neu ral netw o rks to achieve dynam ic task allocation: a flex ib le m anufactu ring system exam p le. Interna tiona l J ou rna l of Industria l E rgonom ics, 24 ( 2 , ( 2005 . The influence of t
48、ask dem and and learn ing on the psychop hysiological resp onse. Interna tiona l J ou rna l of P sychology, 56, 171 - 184. ( 1990 . C ogn itive load theo ry as an aid for instructional design. Austra lian J ou rna l of Educa tiona l Technology, 6 ( 1 , 108 ( 2000 . F acto rs tha t influence studen t
49、s investm en t of 42 G rootjen, M. , N eerincx, M. A. , V eltm an, J. A. 心 理 學 報 ( 2006 . Pau l, A. 41 卷 ( 2006 . U sing sub jective m easu res to detect variations of C ognitive task load in a naval sh ip con trol centre: from identification to p red iction. E rgonom ics, 49 ( 12 , 1238 - 1264. Kal
50、yuga, S. , C handler, P. , Sw eller, J. ( 1999 . M anag ing sp lit2 in trinsic cognitive load w ithin p roblem s. L ea rn ing & Instruction, 16 ( 5 , 389 - 400. R eed, W. M. , B u rton, J. K. , Kelly, P. ( 1985 . The effects of atten tion and redundancy in m ultim edia instruction. App lied C og
51、nitive P sycho logy, 13, 351 - 371. K ilseop, R. , M yung, R. w riting ab ility and m ode of d iscou rse on cognitive cap acity engagem en t Resea rch in the Teaching of Eng lish, 19, 283 - 297. . R oger, W. S. , R obecca, L. G. , G o ry, B. R. ( 2003 . M odel of ( 2005 . Evalution of m en tal w o r
52、k load w ith a com b ined m easure based on p hysio log ical ind ices du ring a M ental W o rk load. In terna tiona l J ou rna l of Industria l E rgonom ics, 28 ( 2 , 381 - 407. Salom on, G. ( 1983 . The d ifferen tial investm en t of m en tal effo rt in dual task of tracking and m en tal arithm eti
53、c. Interna tiona l J ou rna l of Industria l E rgonom ics, 35, 991 - 1009. L aine, T. I , B auer, K. W. , J r Teffrey, W. . ( 2002 . S election of learn ing from differen t sources. Educa tiona l P sychologist, 18 ( 1 , 42 - 50. Shayne, L. , Penelope, S. , A ndrew , N. ( 2007 . M odeling and inpu t
54、featu res across subjects for classify ing crewm em ber w o rk load using artificial neural netw o rks. IEEE Transactions on System s, M an, and cybernen tics 2 a rt A: System s and H um ans, 32 ( 6 , 691 p - 704. m odel fo r m en tal w o rk load classfication. IEEE Transactions on N ew York: W iley
55、 Press. System s, M an, and cybernentics 2 rt A: System s and H um ans, 31 pa ( 6 , 1822 - 1825. ( 1976 . B ehavio ra l founda tions of system developm ent . ( 1956 . The m ag ical num ber seven, p lus o r m inus tw o: som e lim its on ou r capacity fo r p rocessing info rm ation. P sycho log ica l
56、Review, 63, 81 - 97. ( 2005 . Im p rov ing 32, 2713 - 2730. ( 1993 . The efficiency of perform ance m easu res. H um an F acto rs, 35, 737 - 743. ( 1994 . Instructional con tro l of cogn itive load in the train ing of com p lex cogn itive tasks. Educa tiona l P sycho logy Review, 6 ( 4 , 351 - 371.
57、p ilo t m en tal w o rk load classification th rough featu re exp lo itation and com b ination: a feasib ility study. C omp uter &O p era tions Resea rch, instructional cond itions: A n app roach to com b ine m en tal effo rt and ( 2001 . Self 2 rgan izing M ap ( SOM O Predicting M en tal W o rk
58、 load in En R ou te A ir T raffic C ontro l: C ritical R ev iew and B roader Im p lications. H um an F acto rs, 49 ( 3 , 376 - 399. Shayeghi, H. , Shayanfar, H. A. ( 2006 . A pp lication of ANN technique based on 2synthesis to load frequency con trol of in terconnected p ow er system. In terna tiona
59、 l J ou rna l of E lectrica l Pow er & Energy System s, 28 ( 7 , 503 - 511. Tabbers, H. , M artens, R. L. , van M errienboer, J. ( 2004 . M azaeva, N. , N tuen, C. M eister, D. M iller, G. A. M ultim edia in structions and cogn itive load theo rys : Effects of m odality and chang. B ritian J ourna l of Educa tiona l Psycho logy, 74,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年版個人借款合同模板大全
- 金屬成形機床行業先進復合材料應用考核試卷
- 肇慶市封開縣2025年八年級《語文》上學期期末試題與參考答案
- 航空航天股權收益互換與技術研發合作協議
- 跨省家庭探視權協議
- 2025年中國薄膜涂層行業市場前景預測及投資價值評估分析報告
- 2025年中國薄壁注塑ABS行業市場前景預測及投資價值評估分析報告
- 抖音短視頻合作終止與內容更新協議
- 游艇俱樂部會員專屬保險經紀合同
- 2025年中國鈀金行業市場前景預測及投資價值評估分析報告
- 江蘇省南通市海門市海門中學2025屆高考物理四模試卷含解析
- 2025年中考物理模擬考試卷(帶答案)
- 希沃白板5培訓知識點
- deepseek的使用技巧與實際應用培訓課件
- 污水處理站設備采購及配套方案(技術標)
- 攪拌站申請書
- 抖店運營流程
- 印刷廠印刷安全事故應急預案
- 《西安市建筑工程安全生產標準化圖冊(2023版)》
- 光伏發電監理規劃
- 《譫妄護理查房》課件
評論
0/150
提交評論