在可用性測試中,如何做好義務(wù)評估模型與計(jì)量體例?
金蝶云之家用戶研究員-鄭少娜:在可用性測試中,如何去評估測試的場景或流程呢?應(yīng)該包含哪些維度?每個(gè)維度要如何測量?怎樣在不同的義務(wù)間做橫向?qū)Ρ龋勘疚木痛酥鹨恢v述。
公司的產(chǎn)品最近發(fā)布了一個(gè)版本,上線了比較多的新功能。所以必要針對這些新功能做一輪可用性測試。
可用性測試算是用研的一個(gè)入門級技能,即使是從業(yè)年限不多的我也已經(jīng)做過多次,基本的方法和流程都比較認(rèn)識了。但是之前做過的可用性測試有個(gè)缺陷:沒有建立一個(gè)嚴(yán)謹(jǐn)、科學(xué)的義務(wù)評估模型。在可用性測試中如何去評估測試的場景或流程呢?應(yīng)該包含哪些維度?每個(gè)維度要如何測量?怎樣在不同的義務(wù)間做橫向?qū)Ρ龋?/p>
評估模型
iSO9241中對「可用性」的定義是:特定用戶在特定的使用場景中,為了達(dá)到特定目標(biāo)而使用某產(chǎn)品時(shí),所感受到的有用性、服從和寫意度。
也就是說,在定義好了用戶、場景和目標(biāo)的前提下,可用性包含了下面三個(gè)維度:
- 有用性(Effectiveness):用戶完成特定目標(biāo)的精確和完備程度。
- 服從(Efficiency):用戶完成特定目標(biāo)的服從,與消費(fèi)的資源(如時(shí)間)成反比。
- 寫意度(Satisfaction):用戶使用產(chǎn)品時(shí)感受到的主觀寫意程度。
優(yōu)秀的可用性必須能夠同時(shí)知足有用性、服從和寫意度三個(gè)條件,但是這三個(gè)維度也有條理之分,一樣平常來說,有用性題目>服從題目>寫意度題目。
在可用性測試中,僅僅了解每個(gè)功能的可用性水平還不夠。即使兩個(gè)功能的可用性水平一樣,若一個(gè)是產(chǎn)品的基本功能、一個(gè)是價(jià)值不大的邊緣功能,我們照舊必要優(yōu)先去優(yōu)化價(jià)值更高的功能。也就是說,在評估一個(gè)義務(wù)時(shí),除了可用性之外我們還必要考慮功能自己的價(jià)值。尤其是在上線了新功能,或者我們對待測功能的價(jià)值還不太確信的時(shí)候。
功能的價(jià)值可以簡單分為兩部分:用戶價(jià)值和商業(yè)價(jià)值。盡管偶然候必要在商業(yè)價(jià)值和用戶價(jià)值之間權(quán)衡,但是作為一個(gè)體驗(yàn)導(dǎo)向的產(chǎn)品,照舊應(yīng)該將用戶價(jià)值放在第一位。在用戶價(jià)值之上,若能夠知足商業(yè)價(jià)值,則是更令人寫意的效果。
所以,在可用性測試中可以用下面這個(gè)模型來對測試的義務(wù)進(jìn)行評估:
測量方法
在上述模型中,有用性、服從、寫意度都是常見的評估維度,有一些經(jīng)驗(yàn)方法可以參考,用戶價(jià)值也可以通過用戶評價(jià)獲得。而商業(yè)價(jià)值則必要根據(jù)產(chǎn)品的現(xiàn)實(shí)情況進(jìn)行評估,并且這一樣平常是既有的知識,不必要在可用性測試過程中收集這個(gè)數(shù)據(jù)。因此在可用性測試中我們必要收集的數(shù)據(jù)就只包含四個(gè)維度:有用性、服從、寫意度和用戶價(jià)值。
1.有用性
可以用義務(wù)的完成情況來評估有用性,這個(gè)數(shù)據(jù)通過觀察用戶的操作過程即可獲得。
義務(wù)完成情況的測量重要參考NNG的建議,將每個(gè)用戶的操作效果標(biāo)記為失敗、部分完成或悉數(shù)完成。
失敗:假如用戶認(rèn)為本身完成不了而摒棄了義務(wù),或者超過了限制時(shí)間仍然無法完成義務(wù),則標(biāo)記為失敗。
必要對每個(gè)義務(wù)都設(shè)置一個(gè)限制時(shí)間。要求對功能特別很是認(rèn)識的人(相干的產(chǎn)品、設(shè)計(jì)師都可以)按照義務(wù)提醒進(jìn)行操作,記錄完成操作所需的時(shí)間,稱為諳練用時(shí)。假如想要進(jìn)步諳練用時(shí)的測量正確度,可以多找?guī)讉€(gè)熟手操作然后取其用時(shí)平均值。義務(wù)的限制時(shí)間根據(jù)諳練用時(shí)確定,一樣平常是諳練用時(shí)的3-10倍,但是最高也不要超過10分鐘(沒有效戶會(huì)有耐心花10分鐘完成一個(gè)義務(wù),假如真的必要這么久,說明義務(wù)設(shè)計(jì)得太復(fù)雜了)。
可以根據(jù)義務(wù)的難度確定倍數(shù),假如義務(wù)對于小白用戶來說確實(shí)很有難度,那么可以適當(dāng)延伸義務(wù)限時(shí);假如義務(wù)很簡單,或者其中包含一些輸入的操作,那么可以適當(dāng)削減義務(wù)限時(shí)(由于打字每每比較費(fèi)時(shí),而且對功能認(rèn)識的人打字未必比用戶快)。
部分完成:用戶只完成了一部分的義務(wù),沒有完成義務(wù)卡上的所有要求。比如,你盼望用戶創(chuàng)建一個(gè)日程并約請小王加入,用戶成功創(chuàng)建了日程但是卻不知道如何(或者忘了)約請小王,這就是部分完成。之所以要區(qū)分「部分完成」這個(gè)類別,是由于它跟100%完成有差距,但是又不能與失敗混為一談。
完成:這個(gè)很容易理解,就是在限制時(shí)間內(nèi)完成了義務(wù)卡上的所有要求。
最后,我們必要根據(jù)這些數(shù)據(jù)計(jì)算每個(gè)義務(wù)的成功率。NNG的建議算法是:義務(wù)成功率=(完全完成的用戶數(shù)+部分完成的用戶數(shù)*0.5)/用戶總數(shù),即完全完成率+部分完成率的一半。
除了用完成、部分完成和失敗來評價(jià)義務(wù)完成情況外,還可以考慮另一種體例:順利完成、碰到停滯后完成、失敗。這是我之前使用的計(jì)分體例。這種體例下,以上所述的部分完成會(huì)被歸于失敗的類別(但假如用戶犯的是無傷大雅的錯(cuò)誤,比如輸入錯(cuò)誤,可以視為完成)。而成功完成的用戶會(huì)被細(xì)分為順利完成的和碰到停滯后完成的。之所以如許區(qū)分是由于這兩種情況揭示了不同的可用水平——能讓用戶輕松地完成的功能可以說是相稱易用的。
2.服從
服從可以用時(shí)間測量,對用戶的操作過程計(jì)時(shí)。
可以從用戶拿到義務(wù)卡開始計(jì)時(shí),在用戶公布本身已經(jīng)完成、或者限制時(shí)間到了的時(shí)候即結(jié)束計(jì)時(shí)。不要等到用戶讀完義務(wù)卡、開始操作時(shí)才計(jì)時(shí),由于有的用戶風(fēng)俗讀完再操作,有的卻喜好一邊讀一邊做。也不要在看到用戶完成了就結(jié)束計(jì)時(shí),而要等用戶本身認(rèn)為他已經(jīng)完成了,由于用戶偶然候會(huì)在做完操作之后去檢查本身的操作是否成功了,這也應(yīng)該算作義務(wù)用時(shí)的一部分。
計(jì)時(shí)不必要太正確。手動(dòng)計(jì)時(shí)存在幾秒鐘的偏差都算是正常的,而且用戶在操作過程中多說了句話、或者應(yīng)用相應(yīng)速度慢了些,這些都會(huì)影響義務(wù)的完成時(shí)間(并且許多影響因素跟可用性并沒有關(guān)系)。所以計(jì)時(shí)只要正確到秒就好了,進(jìn)步記錄的正確度也沒故意義。
在計(jì)算每個(gè)義務(wù)的服從水平的時(shí)候,可以用用戶的平均用時(shí)除以諳練用時(shí)所得的倍數(shù)透露表現(xiàn)(數(shù)值越大透露表現(xiàn)服從越低)。
這是為了便于義務(wù)間的橫向比較,由于不同義務(wù)的復(fù)雜度不同,A義務(wù)平均用時(shí)1分鐘、B義務(wù)平均用時(shí)4分鐘,也不能說明A的操作服從比B高。通過平均用時(shí)/諳練用時(shí)的比值,可以知道新手與熟手之間的差距,從而了解由于體系的可用性及學(xué)習(xí)成本給用戶帶來的操作時(shí)間損耗。
3.寫意度
寫意度涉及到用戶的主觀評價(jià),因此必要通過用戶自評量表來收集。
這里參考的是Jakob Nielsen使用的一個(gè)單題項(xiàng)七點(diǎn)量表,并根據(jù)必要對標(biāo)題進(jìn)行了修正:
4.用戶價(jià)值
用戶價(jià)值是指用戶感知到的功能價(jià)值,也必要通過用戶的評價(jià)獲得。
由于我們做的是一款辦公軟件,所以通過扣問功能對工作的幫助來了解用戶價(jià)值:
寫意度和用戶價(jià)值都必要用戶評分,因此用戶在完成每個(gè)義務(wù)之后都會(huì)拿到同樣的兩個(gè)標(biāo)題,要求對該義務(wù)做出評價(jià)。我會(huì)把不同義務(wù)的標(biāo)題打印在統(tǒng)一張紙上,如許用戶在評價(jià)時(shí)可以參考本身對前面的義務(wù)的評價(jià)來調(diào)整分?jǐn)?shù)。
義務(wù)橫向?qū)Ρ?/strong>
用有用性、服從、寫意度、用戶價(jià)值四個(gè)維度對義務(wù)進(jìn)行評價(jià)后,我們可以根據(jù)這些數(shù)據(jù)對不同的義務(wù)做橫向?qū)Ρ?,可以通過類似下方如許的折線圖對比不同義務(wù)的情況。
比如從上面這個(gè)示例圖中,我們可以看到義務(wù)2的可用性水平是比較低的(有用性水平低、完成時(shí)間長、用戶寫意度低),但是它的用戶價(jià)值處于相對較高的水平;而義務(wù)3的用戶價(jià)值最高,可用性水平居中。
有用性、服從和寫意度都是用來評估可用性水平的。假如根據(jù)這三個(gè)數(shù)值計(jì)算出可用性水平,直接用可用性去做橫向?qū)Ρ?,是否更方便呢?前文提到在可用性中,有用性題目>服從題目>寫意度題目,所以在計(jì)算可用性水平時(shí)它們應(yīng)該有不同的權(quán)重;并且因?yàn)槎攘矿w例的不同,它們的量綱有較大差異(從上圖可以看出),必要做標(biāo)準(zhǔn)化處理。
因此,我們必要對有用性、服從、寫意度分別做標(biāo)準(zhǔn)化處理,然后按照5:3:2的權(quán)重計(jì)分(或者其他權(quán)重,按需調(diào)整):
可用性水平=Z(有用性)*0.5-Z(服從)*0.3+Z(寫意度)*0.2(服從處用減號是由于其用時(shí)間測量,數(shù)值越大服從越低)
如許我們得以在同個(gè)量綱上比較不同義務(wù)的可用性水平,結(jié)合對功能價(jià)值的評估,可以得出類似如許的四象限圖:
如許的象限圖不僅可以幫助我們比較測試的各個(gè)功能的情況,還能幫助確定體驗(yàn)優(yōu)化的優(yōu)先級。功能價(jià)值高、可用性差的功能應(yīng)該列入最高優(yōu)先級,其次是功能價(jià)值較低、可用性差的功能。
題目優(yōu)先級
除了上述的評估模型外,在可用性測試中我們還會(huì)發(fā)現(xiàn)許多可用性題目,這些題目也許是可用性測試產(chǎn)生的最緊張的數(shù)據(jù)了。那么,這些可用性題目是否必要進(jìn)行優(yōu)先級評估呢?
可用性題目當(dāng)然是有優(yōu)先級之分的,一個(gè)題目是影響了功能的有用性、服從照舊寫意度,就決定了這個(gè)題目的優(yōu)先級如何。我認(rèn)為可以在每個(gè)義務(wù)之內(nèi)按照這個(gè)標(biāo)準(zhǔn)對發(fā)現(xiàn)的可用性題目進(jìn)行排序,但是不必要把所有義務(wù)發(fā)現(xiàn)的所有題目羅列出往來來往排列優(yōu)先級。
優(yōu)化可用性題目時(shí)應(yīng)該以功能(即可用性測試中的義務(wù))為單位,而不是以題目為單位——以題目為單位容易只見樹木不見森林,可能在修改了許多細(xì)節(jié)后仍然算不上好用。所以排列題目優(yōu)先級時(shí),也建議根據(jù)上面的四象限圖先確定功能的優(yōu)先級,然后再去查看每個(gè)功能詳細(xì)的可用性題目的優(yōu)先級。
迎接關(guān)注微信公眾號:「UXD-Cloudhub」
本文地址:http://irelandcustomcontracting.com/tutorial/di3922.html
您可能還喜歡
- Macaron 馬卡龍系色譜 ;附HC(16進(jìn)制碼
- 7個(gè)手機(jī)版網(wǎng)頁設(shè)計(jì)的原則
- 折紙多邊形網(wǎng)頁背景效果制作教程
- 龐門正道:好好玩耍的點(diǎn)線面(上)
- 網(wǎng)頁設(shè)計(jì)中的常見頁面布局方式
- WAP APP的柵格設(shè)計(jì)
- 八種很漂亮的排版方法和技巧分享
- 網(wǎng)頁設(shè)計(jì)的首屏標(biāo)準(zhǔn)你了解多少?
- 字體大寶庫:40款為網(wǎng)頁設(shè)計(jì)師準(zhǔn)備的時(shí)
- 視覺設(shè)計(jì)分享—專題頁面設(shè)計(jì)篇
- 專訪:石墨文檔產(chǎn)品總監(jiān)羅穎
- UI設(shè)計(jì)不得不知的移動(dòng)端UI尺寸適
- 光音移動(dòng)設(shè)計(jì)規(guī)范 — 表單類
- 體驗(yàn)設(shè)計(jì)中的排序問題
- 網(wǎng)頁設(shè)計(jì)精粹 網(wǎng)頁中那些迷人的按
- aliued:響應(yīng)式設(shè)計(jì)的現(xiàn)狀與趨勢
- 10個(gè)智能對象處理的ps技巧
- 網(wǎng)頁UI - 原子設(shè)計(jì)理論(上)
- 如何通過設(shè)計(jì)提升banner點(diǎn)擊率?
- 晉小彥視覺設(shè)計(jì)系列文章(二):全屏