找回密码
 注册
关于网站域名变更的通知
查看: 499|回复: 1
打印 上一主题 下一主题

[毕业设计] 基于特征项分布的信息熵及特征动态 加权概念漂移检测模型

[复制链接]
  • TA的每日心情
    奋斗
    2020-9-8 15:12
  • 签到天数: 2 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2021-3-23 10:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    摘 要: 现有的概念漂移算法大多建立在数据流的分类模型上,忽略了特征空间与样本空间的分布特点,以及 特征选择和加权的重要性.针对此问题提出了一种基于特征项分布的信息熵及特征动态加权算法,从概念漂移的动态 演化性出发,根据样本和特征空间的拟合程度,运用特征信息熵理论对数据流中的概念漂移现象进行捕捉,以实现新 旧概念的过渡.利用改进的隐含 Dirichlet模型特征动态加权算法,以解决当前特征与历史特征的权重确定和无效特征 的裁剪问题.在公开的语料库 CCERT和 Trec06上的测试实验证明了所提出算法的有效性.   z3 s: t# }% u( |
    % J( M  T) ^" M: R* c
    关键词: 概念漂移;LDA模型;特征项分布;信息熵
    7 m( r! x* x: y/ v0 H& r/ H' H, q3 o) J7 O$ d- @
      f! C2 F; v# P( t! q- a

    3 ^/ i) i! a$ I. u      近年来,随着信息技术的高速发展,数据流作为承 载信息的重要媒介受到越来越广泛的关注,其与生俱有 的实时性、随机性、多样性和开放性等特点,为数据的分 析带来极大挑战[1].概念漂移(conceptdrift)是大规模数 据流中存在的普遍现象,它是指随着时间的推移,数据 流内部发生动态变化,使得原有训练数据与应用数据发 生不匹配的现象.概念漂移问题的提出为数据流的优化 决策提供了一条有效的途径,其相关研究在搜索引擎, 入侵检测,网络安全等领域得到了较多的关注[2~4]。: S) S/ y) ^: @0 l

    6 U4 F) e+ |6 i- @& s4 ]5 R

    & W3 e4 A! A5 c附件下载:
    游客,如果您要查看本帖隐藏内容请回复
    / ^) q/ U& \5 b
  • TA的每日心情
    慵懒
    2020-8-28 15:16
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    2#
    发表于 2021-3-23 13:16 | 只看该作者
    提出算法的有效性?
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-7-19 16:06 , Processed in 0.109375 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表