科技计划:
成果形式:新技术、其他
合作方式:技术咨询、技术服务
参与活动:
专利情况:
正在申请 ,其中:发明专利 5 项
已授权专利,其中:发明专利 0 项
聚类集成技术具备诸多优点,已成为机器学习领域的研究热点之一。本课题研究文本聚类集成中的共识函数设计问题,首先从子空间相似度的角度形式化描述该问题,并从矩阵Frobenius范数低秩近似的角度进行求解,从而设计出高效率、高质量的大规模文本聚类集成模型。主要研究内容包括:文本聚类成员产生方法研究;共识函数设计问题形式化描述方法研究;基于矩阵Frobenius范数低秩近似的共识函数设计方法研究。
1、从矩阵低秩近视的角度出发,将聚类集成问题转化为向量之间欧氏距离平方和最小化问题。
2、将单个谱聚类算法作为聚类成员,并引入谱聚类算法思想来解决聚类集成问题。
3、将K均值与谱聚类算法相结合的方法引入到聚类集成问题中,提出代数变换方法降低算法计算复杂度。
本项目技术达到国际先进水平,对于规模为7094文本集,在聚类集成阶段耗费的CPU时间仅为1.25,聚类精度(NMI值)比主流算法略高。
本项目相关成果累计发表学术论文23篇,其中SCI 4篇,EI 15篇,申报发明专利5项,获批软件著作权5项。