成果、专家、团队、院校、需求、企业在线对接

基于矩阵低秩近似的大规模文本聚类集成方法研究

成果编号:09267
价格:面议
完成单位:盐城工学院
单位类别:其他高校
完成时间:2014年
成熟程度:其他
服务产业领域: 电子信息
发布人:徐森 离线
聚类集成技术具备诸多优点,已成为机器学习领域的研究热点之一。本课题研究文本聚类集成中的共识函数设计问题,首先从子空间相似度的角度形式化描述该问题,并从矩阵Frobenius范数低秩近似的角度进行求解,从而设计出高效率、高质量的大规模文本聚类集成模型。主要研究内容包括:文本聚类成员产生方法研究;共识函数设计问题形式化描述方法研究;基于矩阵Frobenius范数低秩近似的共识函数设计方法研究。
595 次浏览 分享到

最近对接

南京田申田信息系统有限公司
2015-08-29

成果介绍

科技计划:
成果形式:新技术、其他
合作方式:技术咨询、技术服务
参与活动:
专利情况: 正在申请 ,其中:发明专利 5
已授权专利,其中:发明专利 0
成果简介
成果概况
聚类集成技术具备诸多优点,已成为机器学习领域的研究热点之一。本课题研究文本聚类集成中的共识函数设计问题,首先从子空间相似度的角度形式化描述该问题,并从矩阵Frobenius范数低秩近似的角度进行求解,从而设计出高效率、高质量的大规模文本聚类集成模型。主要研究内容包括:文本聚类成员产生方法研究;共识函数设计问题形式化描述方法研究;基于矩阵Frobenius范数低秩近似的共识函数设计方法研究。
创新要点
1、从矩阵低秩近视的角度出发,将聚类集成问题转化为向量之间欧氏距离平方和最小化问题。 2、将单个谱聚类算法作为聚类成员,并引入谱聚类算法思想来解决聚类集成问题。 3、将K均值与谱聚类算法相结合的方法引入到聚类集成问题中,提出代数变换方法降低算法计算复杂度。
主要技术指标
本项目技术达到国际先进水平,对于规模为7094文本集,在聚类集成阶段耗费的CPU时间仅为1.25,聚类精度(NMI值)比主流算法略高。
其他说明
本项目相关成果累计发表学术论文23篇,其中SCI 4篇,EI 15篇,申报发明专利5项,获批软件著作权5项。
完成人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看
联系人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看
附件

咨询与解答