美国天普大学计算机与信息科学系的教授应3044am永利集团的邀请,于2019年6月5日晚上,在3044am永利集团308学术报告厅室作了“Design erasure-coded data centers towards reliability, availability, and serviceability (RAS)”的学术报告。报告会由3044am永利集团经理胡志华教授主持,3044am永利集团科研骨干、科研读书班全体成员参加了报告会。
报告会上,何教授首先介绍了存储节点故障引起的数据修复极大地影响擦出编码数据中心的数据可靠性,可用性和可维护性(RAS)的现实问题。与被广泛研究和优化的数据修复的恢复阶段相比,数据修复的故障识别阶段较少被研究。此外,在传统的故障识别方案中,所有组块共享相同的识别时间阈值,失去了进一步改进RAS的机会。
在本次讲座中,何教授概述了他在数据存储和I/O系统方面的研究工作。具体介绍RAFI,一种新颖的风险感知故障识别方案,通过使用不同的时间阈值来识别经历不同数量的故障块的条带中的块故障。对于高风险条带中的那些块,采用较短的识别时间,提高整体的数据可靠性和可用性。对于低风险条带中的那些块,采用较长的识别时间,减少修复网络流量。这样可以同时改善RAS。
学术报告结束后,参加会议的师生与何教授进行了交流与讨论,会场气氛活跃,学术氛围浓烈。
何绪斌博士简介:
美国天普大学(位于美国东岸宾夕法尼亚州的费城)计算机与信息科学系的教授,同时也是存储技术与架构研究(STAR)实验室主任。何博士于2002年在美国罗德岛大学获得电子与计算机工程专业博士学位,分别于1997年和1995年获得华中科技大学计算机科学专业硕士和理学学士学位。他的研究领域是数据存储和I/O系统,包括大数据、云存储、非易失性存储以及大型存储系统的可扩展性研究。他在国际著名期刊和会议上发表了100多篇论文,如IEEE并行和分布式系统期刊(TPDS),并行和分布式计算期刊(JPDC),ACM存储期刊和IEEE TDSC期刊,以及各种高级别的国际会议,如USENIX FAST,USENIX ATC,Eurosys,IEEE / IFIP DSN,IEEE INFOCOM,IEEE IPDPS,MSST,ICPP,MASCOTS,LCN等。他是IEEE NAS'2009的大会联合主席,也是IPCCC'2017,ICPADS'2016,MSST'2010,IEEE NAS'2008和SNAPI'2007的程序委员会联合主席。他曾担任NSF的提案审查小组成员和该领域许多专业会议的委员会成员。何博士于2004年获得ORAU Ralph E. Powe初级教师提升奖,2010年和2005年获得TTU的Sigma Xi研究奖,2010年获得TTU ECE最杰出教学奖,2015年获得VCU ECE杰出研究员奖。何博士是多项研究项目的首席研究员,其项目资金总计超过300万美元,主要由美国国家科学基金会(NSF)赞助。他拥有一项美国专利。何博士也是IEEE的高级成员,IEEE计算机协会和USENIX的成员。