第八章 对中医药市场监管部门问题的研究
一、关联规则算法简介
(一)理论介绍
关联分析(Association Analysis)就是从给定的数据集发现频繁出现的项集(又称为关联规则,Association Rule)。识别两个或两个以上变量之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。
1.规则置信度(Confidence)
规则置信度(Confidence)是对简单关联规则准确度的测量,描述了包含项目 X 的事物中同时也包含项目 Y 项的概率,反映 X 出现条件下 Y 出现的可能性, 其数学表示为:
其中,表示包含项目 X 的事务数,表示同时包含项目 X 和项目 Y 的事务数。
2.规则支持度(Support)
测度了简单关联规则的普遍性,表示项目 X 和项目Y 同时出现的概率,其数学表示为:
其中,表示总事务数,表示同时包含项目 X 和项目 Y 的事务数。
3.规则提升度(Lift)
规则提升度(Lift)是置信度与后项支持度的比,其数学表示为:
规则提升度反映了项目 X 的出现对项目 Y 出现的影响程度。一般大于 1 才有意义,意味着 X 的出现对 Y 的出现有促进作用。规则提升度越大越好。
http://www.dxsbao.com/shijian/549229.html 点此复制本页地址