破洛洛文章簡介:調研問卷中多選題的分析方法探討.
引子
使用調研問卷的定量研究中,為了更全面地了解研究內容、更廣泛地收集信息,經常會用到多選題,但由於多選題多指向性的特點,除了頻數表和交叉表(只能與單選題做交叉),較少用到其他的分析方法,損失了很多有用的信息。其實,如果調研時能善用多選題,並在分析時選取適當的方法,就能夠充分利用多選題包含的信息,得到更有價值的結論。
上一篇文章談到調研問卷中帶有分類性質的多選題如何進行分析,本文將側重說一下帶有求和性質的多選題如何進行深入分析,另外,還可以得出分組結果做後續應用。
帶有求和性質的多選題
問卷調研中,常會通過多選題考察用戶在某個方面的多樣性、或意識、能力等,此時,選項求和所得總分能夠反映用戶在這個方面的綜合情況,也是一種分析問題的方法。
其實,帶有求和性質的題目,多半是由量表題轉換而來,而量表題涉及到N級量表,相當於每個選項都是一個題目,為了節約用戶的填答成本,常用多選題代替。當然,量表題的相關選項求和,更能反映用戶在某一方面的綜合水平,此不贅述。
帶有求和性質的多選題一般具備以下幾個特征:
1、題目本身具有求和的價值,如賣家常用的第三方服務工具(考察工具應用的多樣性)、賣家日常采用的安全保護措施(考察預防意識)、用戶常用的網絡功能(考察網絡使用能力)等,這類題目的選項求和所得總分,對於綜合分析問題有一定的參考價值。
2、選項涵蓋的內容較全面,選項應該盡量包含考察方面的主要細節點,如果考察的方面,范圍相對較窄,最好能夠窮盡主要細節點;如果考察的方面,范圍相對較廣,最好能由淺入深、或同級區隔,分成若干層面,逐個選取主要細節點。
3、選項一般超過5個,選項太少沒有求和的必要,只有超過一定數量,求和才有價值,求和的目的是為了通過歸納的方式,從總體認知的角度,概括地解讀用戶的行為或心理。
4、通常不限選,如果限選,求和後,總分值差距不大,不易找出樣本在考察方面的差異,很難達到綜合評估的目的。
5、數據為0/1格式,即每個選項一個變量,選中為1,未選中為0,多選題轉換成此種格式,宜於做深入分析。
當有了帶有求和性質的多選題,就可以采用下文介紹的方法進行深入分析。
本文中兩個網絡問卷調研的例子,分別是上個季度做的《賣家安全需求調研》,研究模型中用一道多選題,考察了賣家安全保護措施的意識;四年前寫畢業論文《生活形態與即時通訊使用的關聯性研究》時,基礎題目中用一道多選題,考察了網民對網絡的使用能力。
直接求和
直接求和的方法非常簡單,由於多選題選項的數據是0/1格式,直接加和後,即可表示在考察方面,樣本的總得分,反映綜合水平。
賣家安全保護措施意識的案例,稍微復雜一些,因為選項含有互斥關系,各選項的頻率如下表:
求和時,不能直接相加,需要簡單處理一下,因為“沒有什麼預防或應急措施”與其他答案互斥,有兩種處理方法:
1、將“沒有什麼預防或應急措施”的答案0/1做反向處理(recode處理:0變1、1變0),之後所有選項加和,若總分為0,則表示“安全預防意識”為0,若總分大於0,則表示采取了一定的措施,反映了安全預防意識的程度;
2、根據情況計算總分,若“沒有什麼預防或應急措施”被選中,則選項加和變量直接為0;若“沒有什麼預防或應急措施”未被選中,則剩余選項加和求得總分。此時,選項加和的結果與方法1相同。
本例中,賣家總體的安全預防意識平均值為2,結合總分的分布圖也可以看出,賣家的安全預防意識並不強,手段比較單一,風險較高。
跟其他變量交叉分析後,也可以分析出各細分群體,在安全預防意識方面的差異。
直接求和,除了需要注意選項間的互斥情況,最重要的是要判斷,各選項對於考察方面,是否處於同等級別,近似平等。用案例來說,就是每個選項中的措施代表安全預防意識的程度相近,而並非某個措施的難度特別大,或非常不易達成。
如果各選項對於考察方面,並非處於同等級別,不能近似平等,那麼就需要采用其他的求和方法。
加權求和
考察網民對網絡的使用能力,如果直接詢問被訪者,“網絡使用能力達到什麼水平?”,可能不易得到可靠的數據,可以間接地采用多選題的方式,請被訪者選出懂得如何操作的網絡應用,選項應該包含初、中、高級的網絡應用,以便全面評估。
由於初、中、高級的網絡應用之間,級別不同等,不能近似平等,也就不能直接求和,簡單相加會造成很大誤差,不能如實反映網絡使用能力。
因此,先對選項進行信度檢驗,然後通過加權法,對需要能力較高的網絡應用給予比較大的權數,能力要求不太高的網絡應用給予較小的權數。如此,得到的加權後總分越高,表示網絡使用能力越高。
在實踐中經常采用的加權方法是,將直接測量值x(得分或比例等)轉化為標准正態得分Z,再轉化為加權值W,即可求得描述綜合水平的測量值X。
本例中,網絡能力多選題的Cronbach’s Alpha信度檢驗,得到Alpha=0.841,達到較高水平;然後將各項的樣本比例P轉化成標准正態得分Z,由Z的相對大小來決定加權數W,即可計算出每個樣本的網絡使用能力。分析可知,樣本的網絡使用能力均值為27.9,標准差為12.96。計算過程如下表:
利用總分進行分組
求和得到總分後,可以對樣本進行分組,一般會找出高分組和低分組,對比高低分組在其他關鍵變量的情況,也是一種分析問題的視角。
對總分進行分組通常有兩種方法:
1、高分組的下限可以是(均值+1個標准差);低分組的上限可以是(均值−1個標准差),一般這種方法求得的高低分組的樣本量,均不一定會達到樣本總量的1/4,需根據研究目的判斷是否合適。研究小眾產品時,可用此方法。
2、另一種方法,是將總分升序排列,從上往下,在樣本總量27%的位置記錄樣本得分,作為低分組的上限臨界值;從下往上,在樣本總量27%的位置記錄樣本得分,作為高分組的下限臨界值。這種方法得到的高低分組的樣本量,能滿足大部分研究的需要。研究大眾產品時,可用此方法。
小結
綜上所述,帶有求和性質的多選題,分析的流程如下:
1、確定多選題的選項求和後,總分是否存在解讀價值、應用價值;
2、根據選項的特點,選取適當的求和方法:直接求和、加權求和;
3、使用關鍵變量(如星級、注冊時長等)對樣本總體分群,查看各細分群體在多選題總分上的差異,深入分析;
或利用總分對樣本進行分組,重點分析高低分組在其他變量上的表現。