南大PASA大数据实验室联合阿里巴巴和美国Databricks公司荣获国际Cloud Sort大赛世界冠军
2016年11月10日,有“计算界奥运会”之称的国际著名Sort Benchmark 全球数据排序大赛(http://sortbenchmark.org/),官网公布了2016年全球大数据排序性能评测大赛结果。南京大学计算机科学与技术系PASA大数据实验室(http://pasa-bigdata.nju.edu.cn)联合阿里巴巴和美国Databricks公司组成的参赛团队NADSort,经过几个月的深度研究和持续努力,击败了多个世界级参赛团队,刷新了大赛之前的世界纪录,荣获2016年CloudSort大数据排序世界冠军。
Sort Benchmark是著名的图灵奖获得者Jim Gray发起组织的全球性数据排序基准性能评测大赛,自1987年开始每年举办一次,已经持续组办了30年。每年都有众多全球顶尖公司和学术机构参加该赛事,以评估软硬件系统架构能力及最新研究成果。著名的大数据计算系统Apache Hadoop(2008年)和Apache Spark(2014年)都曾在该基准评测赛事中保持世界记录。大赛分多种不同性能指标的评测竞赛项目。近几年来,随着全球大数据技术发展热潮的来临,大赛主要面向大规模数据的排序性能测试竞赛,设置了排序速度、成本、能耗等不同性能指标下的大规模数据排序评测竞赛项目。
本次NADSort团队所参加的是基于公有云的CloudSort评测竞赛项目。CloudSort又被称为“云计算效率之争”,该项目比拼的是完成100TB数据排序谁花费更少,也是Sort Benchmark的各项比赛当中最具现实意义的项目。 NADSort团队使用了阿里云ECS,并按照公开的按量付费价格来比拼性价比。排序计算平台由394个阿里云虚拟服务器节点配置构成计算集群,使用Apache Spark大数据计算平台,在大规模并行排序算法以及Spark系统底层进行了大量的优化,以尽可能提高排序计算性能并降低存储资源开销,最终在阿里云平台上以144美元的成本完成100TB标准数据集的排序处理,创下了每TB数据排序1.44美元成本的最新世界纪录,比2014年夺得冠军的加州大学圣地亚哥分校TritonSort团队每TB数据4.51美元的成本降低了近70%。
NADSort团队由南京大学(Nanjing University)PASA大数据实验室、阿里巴巴(Alibaba),以及美国Databricks公司技术人员联合组成(Databricks是Spark商业化公司,由美国伯克利大学AMP实验室著名的Spark大数据处理系统多位创始人联合创立)。
本次NADSort团队中PASA大数据实验室的参与人员为王千同学、顾荣同学、以及黄宜华老师。
(计算机科学与技术系 科学技术处)
下一篇::老干部党委集体学习党的十八届六中全会精神
- “跟着纪先生学书法活动走进口岸实验学校
- 江苏省高校实验室研究会2016年年会在我校召开
- 先进制造实验室第二届学术委员会第一次会议在宁召开
- 陈骏校长参加校办信息办联合党支部组织生活会并上专题党课
- 我校成功申报省重点实验室
- 江苏省经管类虚拟仿真实验教学研讨会在我校召开
我有话说
成人高考
最新文章
- 1学校召开一届三次教职工暨工
1月16日上午,校一届三次教职工暨工会会员代......
- 2校领导到姜堰区慰问困难家庭
1月15日下午,我校党委副书记、副校长田浩带......
- 3我校创业代表与人大代表、政
1月15日下午,共青团泰州市委在泰州市蜂鸟创......
- 4科研处大力推进2017年国家基
为落实2016年学科科研工作暨2017年项目申报......
- 5数理学院专程请扬大专家作国
1月17日,在学校科研处和数理学院负责人的带......
推荐文章
热门文章
- 1校领导出席“第八届中韩大学校长
11月24日,我校程崇庆副校长一行出席了在济南...
- 2专家学者研讨我校军事谋略思维通
11月19日,南京大学《军事谋略思维》通识课程...
- 3我国著名无机化学家游效曾院士逝
中国共产党党员,中国科学院院士,我国著名无...
- 4我校举办“两个第一”行动计划20
11月20日,南京大学“两个第一”行动计划201...
- 52016年中国国际关系学会专题研讨
11月20日,中国国际关系学会“国际关系理论与...