腾讯分分彩组三杀号 > 数据挖掘 >

AMAX 深度学习解决方案加速数据挖掘算法的研究

2018-07-13 13:21

  南京大学计算机软件新技术国家重点实验室是在南京大学计算机科学与技术系和计算机软件研究所多年进行软件研究的基础上于年建成,并通过国家验收,被批准向国内外开放,屡次被评为信息科学领域优秀类国家重点实验室。实验室的主要研究方向是:新型程序设计与软件方法学、软件质量保障与自动化技术、分布计算与系统安全技术、机器学习与智能化信息处理技术、媒体计算与内容处理技术。

  作为实验室研究方向之一的机器学习也是人工智能的核心研究领域之一,其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。

  南京大学计算机科学与技术系软件新技术国家重点实验室在数据挖掘上进行深度应用研究,为机器学习的发展提供了有效的数据基础。数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。在最快的时间内识别数据并从海量数据中将需要的数据挖掘出来成了数据挖掘的关键点。

  南京大学计算机科学与技术系软件新技术国家重点实验室利用多核进行多线程任务检索,对同一个数据分别进行不同类型的对比,利用多并发的特点加速挖掘的过程。AMAX针对该应用需求,提出了CPU+GPU的混合检索模式,在主程序题中,利用Intel处理器的高逻辑能力,进行多任务的线程分配,利用单机GPU的多核能力对海量数据进行的不同类型的对比分析,以此达到提升数据挖掘速率的效果。

  MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。

  AMAX提供的CPU+GPU混合模式为数据挖掘提供了有效的硬件平台,南京大学计算机科学与技术系软件新技术国家重点实验室采用AMAX的硬件平台搭配自己的软件应用技术,在机器学习和数据挖掘上取得了很好的研究成果。实验室对此评价“AMAX用他们专业的技术眼光,根据我们的应用环境,严格调试每一个硬件之间的兼容性能,最大效率的发挥了硬件的能力,让我们的计算资源得到了有效利用,同时AMAX工程师积极配合我们的软硬调优,给我们计算提供了很大便利。”返回搜狐,查看更多