(二)主题模型
主题模型是机器学习和自然语言领域中用来处理在一系列文档中发现抽象主题的一种统计模型,是利用词频的贡献频率来进行浅层次的统计词组聚类的一种分析方法,通过分析词语出现的频率有效地将主题相近的词与词组聚成一类,通过词项在文档中的共现信息抽取出语义相关的主题集合。
(三)描述统计分析
描述性分析是社会调查统计分析的第一个步骤,对调查所得的大量数据资料进行初步的整理和归纳,以找出这些资料的内在规律——集中趋势和分散趋势。主要借助各种数据所表示的统计量,如均数、百分比等,进行单因素分析。
在数据分析的时候,一般首先要对数据进行描述性统计分析,以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。
http://www.dxsbao.com/shijian/551086.html 点此复制本页地址