牛顿插值法在自动确定支持度阈值中的应用

发布时间:

维普资讯http://www.cqvip.com
第27卷第1期 
Vol_27 No.1 2006 
青岛理工大学学报 
Journal of Qingdao Technological University 
牛顿插值法在自动确定支持度阈值中的应用 
朱习军 ,刘照军。 
1.青岛理工大学理学院,青岛266033‘2.泰山医学院信息科学系,泰安271000) 
要:研究怎样利用以前挖掘所用的支持度 置信度参数信息,来估计当前挖掘的最佳支持度和 
最佳置信度的牛顿插值算法.首先研究牛顿插值能否用于自动确定支持度/置信度阈值,最后结合 实例给出了牛顿插值法用于自动确定支持度/l信度阁值的方法,并验证了该方法的正确性与有 
效性. 
关键词:牛顿插值,关联规则,支持度阈值,置信度 中圈分类号:TP301 
支持度和置信度阈值的函数定义 
笔者提出一种可以利用以前挖掘所用的支持度、置信度参数信息来估计当前挖掘的最佳支持度和最 佳置信度的插值算法.牛顿插值多项式在关联规则挖掘中的应用,主要是根据以前挖掘采用的支持度和置 信度阈值,以及算法输出的关联规则的数目,联系系统当前的挖掘目标,来预计当前挖掘应当采用的支持 度阈值,使得挖掘出的关联规则对用户的兴趣度高,而且关联规则的数目接近用户的期望值或控制在合理 的范围内.为此,可以把支持度阈值作为因变量,把关联规则的数目或质量作为自变量,形成一被插值函数 ,.这里仅以频繁关联规则挖掘为例,提出频繁模式挖掘下预计支持度阈值的被插值函数形式为n]: 
min-support=f(h(c)n/g(m)),其中, 
f:置信度,根据用户的要求而定,在整个过程中可变. 

算法输出的关联规则数目. 
(c):置信度的函数,控制置信度在整个过程中所起作用的大小. m:数据库中属性的数目. 
g( ):m的函数,使整个自变量z= (f)n/g(m)在某一范围内,如,O~100. 
牛顿插值多项式选择较优阈值的方法 
2.1运用以前挖掘的相关信息来确定支持度阈值 
首先要建立牛顿插值多项式,然后利用它来确定本次挖掘应当采用的支持度阈值建立牛顿多项式的 
方式。根据以前每次挖掘算法运行后的关联规则的数目 及采信的置信度阈值c,计算出每次算法运行所 对应的被插值函数的自变量x=h(c)n/g(m),得到~系列的节点z 及其对应的函数值, ,据此建立牛顿 插值多项式[].建立牛顿插值多项式后,就可以运用牛顿插值多项式及用户期望的关联规则数目和置信度 阈值,来确定本次挖掘应当采用的支持度阈值. 2.2第一次挖掘时如何确定支持度阈值 
如果整个挖掘算法是第一次运行,而且要挖掘的数据集很大,用户决定支持度阈值的方式如下. 从整个待挖掘的数据库中按一定的比例随机地选取一小部分数据集,在此小部分数据集上运行挖掘 
收稿日期{2OO5一O1—17 

牛顿插值法在自动确定支持度阈值中的应用

相关推荐