(1)以主观建议题为判断依据,剔除回答不符合逻辑的问卷。
(2)剔除存在漏填、多填或含有缺失值的问卷。
(3)剔除极端答案问卷问题数量在二十个左右,因此团队有理由认为:若
某问卷的填答用时不超过100秒,则该份问卷不是在受访者理性情况下的作答的。故对受访者平均回答时间小于100s的问卷进行剔除。
3.数据的编码与录入
通过问卷调查获得的资料转变为SPSS能够识别的数据文件,为各种统计分析做好准备。在调查中结束后,根据问卷的编码顺序,将每份问卷中每个问题对应的编码输入电脑中,通过Excel和SPSS软件实现。
4.数据的清洗
为了解决数据适量问题,使其更适合做挖掘,团队的录入后超出范围、有极端值、逻辑上不一致的数据,进行异常值处理。具体方法如下:对于缺失值的处理:使用该项的变量取值的平均数来代替少量的缺失值,数据缺失较多则将整条数据作废。
http://www.dxsbao.com/shijian/549971.html 点此复制本页地址