未来之心探索金寨第十九弹

时间：2023-02-20 17:47:17 来源：安徽财经大学经济作者：安安

基于决策树模型分析不同人群对于金寨电商模式的认可程度

1.模型的准备

决策树算法是一种用于归纳分类的算法，它通过对训练集的学习，挖掘有用的规则，用于对新集进行预测。决策树是一种用于对实例进行分类的树形结构。决策树由节点（node）和有向边（directed edge）组成。节点的类型有两种：内部节点和叶子节点。其中，内部节点表示一个特征或属性的测试条件（用于分开具有不同特性的记录），叶子节点表示一个分类。决策树构建的原理是通过对各个属性的不断划分使得决策树的分支节点所包含的样本尽量属于同一类别，即节点的纯度越来越高，而决策树构建的关键在于纯度的度量。CART分类树算法使用基尼系数代表模型的纯度，基尼系数越小，则不纯度越低，特征越好。

分类树中，假设某个样本空间有k类，对于生成好的一颗决策树的某叶子节点，假定该叶结点含有样本数目为m，可以分别统计该叶子节点下每个分类的频数。每个类别的概率，于是这个叶子节点的信息熵就是。信息熵越小，系统的区分度越明显。所以最终对于一棵分类树的评价可以用下面的公式来评判（叶子节点的权重，可以更具样本数目来决定）：。对于不同的算法，并不完全都是用信息熵，也可以采用基尼系数来代替信息熵。具体的，假设一K类样本占全部样本的比值为，则D的基尼系数计算公式如下：。

2.模型的建立

以问卷搜集到的信息中的个人情况中的性别信息、职业信息、年龄段，以及被调查者对于金寨电商模式的认可程度和对金寨电商模式的发展前景的看法的文本为分析对象，在构建决策树时，我们选取1158个人的信息作为训练集，290人作为测试集。最后通过测试集测试模型训练的准确率可以达到84.5666%。下图为所构建决策树的整体分析情况，Python运行代码见附件。

其中，为防止过拟合现象，需要对决策树进行剪枝，即预剪枝和后剪枝。预剪枝：树还没完全分裂的时候，设定好阈值，阻止其分裂。后剪枝：当树完全分裂之后，开始进行剪枝：由完全树开始，剪枝部分结点（叶子节点，或者子节点）得到，再次剪枝部分结点得到 …，直到剩下树根的树（就是根节点）；在验证数据集上对这k个树分别评价，选择损失函数最小的树。

采用CART代价复杂度剪枝方法（CCP）：

1、决策好一颗树，除去叶子节点后有；

2、计算每个子节点剪枝后的表面误差率增益

其中，，loss（t）是剪枝后的损失函数，loss（T）是剪枝前的损失函数，leaf（T）是剪枝前T节点下面的叶子节点数。

3、，剪枝最小的节点。

http://www.dxsbao.com/shijian/547992.html 点此复制本页地址

最新发布

“乡村振兴背景下农村地区发展情况”第1弹: 针对此次研究，我们在实地调研的基础上设计问卷，主要通过问卷网的问卷服务以分层抽样和两阶段抽样相结合的方式对全国范围的居民进行调查。并利用描述性统计分析和列联表分析初步了解调查人群基本信息以及对…

未来之心探索金寨第二十二弹: 一、“互联网+”绘制金寨脱贫发展蓝图（一）“三个农民”——互联网+农特产品一年之际在于春。早春时节，“三个农民”迅速按下了“启动键”，挂了“前进档”。发出帮扶，是三个农民做强做大电商的‘金钥匙’…

未来之心探索金寨第二十一弹: 一、“互联网+”绘制金寨脱贫发展蓝图（一）“三个农民”——互联网+农特产品一年之际在于春。早春时节，“三个农民”迅速按下了“启动键”，挂了“前进档”。发出帮扶，是三个农民做强做大电商的‘金钥匙’…

未来之心探索金寨第二十弹: 精准乡村振兴战略的明确提出为我国脱贫攻坚任务指明了前进的方向，旅游乡村振兴作为我国脱贫的创新手段之一，旅游乡村振兴政策的制定和旅游乡村振兴规划的实施正面临着许多现实困境。因此，通过问卷调查，采…

未来之心探索金寨第十八弹: 基于列联检验对受访者不同特征的相关性分析1.理论基础列联表检验分析是问卷调查中常用的判断某个问题的两个或多个不同特征之间是否存在联系的统计分析方法，包括卡方独立性检验、一致性检验和拟合优度检验。…

未来之心探索金寨第十七弹: 二、基于列联分析对被调查者金寨发展认知及金寨发展力度的探究（一）基于列联表分析对被调查者金寨发展认知的特征分析在初步了解受访者对金寨发展的认知度后，团队将研究对象细化为金寨发展的认知情况，在此…

未来之心探索金寨第十六弹: 一、问卷调查分析本次调研共投放网络问卷1600份，有效填写人次1540，回收率为96.25%，涉及26个问题，包括用户基本信息、家庭居住金寨生态以及自己家乡金寨生态三个方面。1.调查样本性别分布情况在参与调查问卷的160…

未来之心探索金寨第十五弹: 1、调查对象与范围在正式调查中，共发放问卷1200份，金寨县具有代表性的地区农民，最终有效问卷1084份，问卷的有效率为90.3%。2、抽样设计（1）抽样方法由于全县的人口众多，调查总体过大，且采取网上问卷的方式…

未来之心探索金寨第十四弹: 调查方式1、文案调查法文案调查法是市场调查前期必选的方法，并贯穿其实施的全过程。文案调查法根据研究目的与任务的需要，通过一定手段与技术搜集二手资料信息。文案调查法的目的是搜集截止到目前，已经形…

未来之心探索金寨第十三弹: 实践具体规划流程安排互联网，作为信息时代的优秀产物，已经不仅仅是一种工具，更是一种思维。现如今，中国要全面实现建成小康社会目标，乡村振兴脱贫成为关键所在。如果将符合信息时代的互联网思维这对螺旋…

未来之心探索金寨第十九弹

相关内容

聊城大学传媒技术学院考研大满贯宿舍413——夜灯长明照题海青春共赴研梦来

五四薪火聊传新篇－传媒技术学院主题朗诵献礼表彰盛典

聊城大学传媒技术学院开展“解读恋爱信号打造健康恋曲”阳光心理大讲堂活

传媒技术学院参加聊城大学2025年广播体操比赛

聊城大学传媒技术学院开展西部计划线上培训活动

聊城大学传媒技术学院开展西部计划宣讲活动

聊城大学传媒技术学院开展“青春筑爱颐养同行”志愿服务活动

【传媒】积极参与“‘就选山东’起航齐鲁”聊城大学2025届毕业生春季就业双

推荐内容

聊城大学传媒技术学院考研大满贯宿舍413——夜灯长明照题海青春共赴研梦来

五四薪火聊传新篇－传媒技术学院主题朗诵献礼表彰盛典

山东大学学生唐仲英爱心社成功举办仲英学者助益计划系列讲座

湖南科技学院走进敬老院开展志愿服务活动

新乡工程学院外国语学院举办2025年大学生志愿服务西部计划宣讲会

最新发布