精彩回顾 | 2019年南山博士论坛426期:喻之斌《自主学习,让云计算系统更优化》
云计算、大数据、人工智能已经走入寻常百姓家,给人们的生活带来了便利。然而,当前的云计算系统中存在着一对巨大的矛盾,云服务质量和资源利用率的矛盾。如何在云计算系统中既提高资源利用率,又提高性能、保证服务质量是一个世界性的难题。10月13日下午,南山博士论坛在南山图书馆报告厅如期举行。论坛邀请中国科学院深圳先进技术研究院研究员、数字所副所长喻之斌博士,讲解“如何利用机器学习的方法来优化云计算系统的性能”,即让云计算系统自主学习自己在性能方面和影响性能的因素的特征,然后自己优化自己,达到高性能的目的,不仅大大改善了用户体验,还能提高云计算系统的资源利用率。喻博士通过科普的方式将他的团队在大数据和云计算系统方面的研究深入浅出地介绍给在场听众,让大家对大数据方面的研究有了更直观深入的了解。
“大颗粒数据”背后 仍面临多重挑战
据介绍,随着计算机技术和物联网的发展,绝大部分行业都出现了大数据 的现象。比如像城市交通、医疗健康、药 物设计、金融电信、海洋天空、政府商业 等领域。喻之斌在论坛中举例介绍在医 疗健康领域现在有很多数字化设备,数 字化设备产生的数据都可以存下来,存 下来之后就可以帮助我们做很多的事 情。大数据在医学里叫“大颗粒数据”, 所谓大颗粒就是说一个文件就有好几十 兆甚至几百兆这么大的数据。
喻之斌表示,虽然大数据已经正在 给我们带来好处,而且将来会带来越来 越多的好处,但这其中也存在着很多问 题。这些问题包括如何低成本地达到企 业的 P 级存储需求?如何使存储容量和 计算能力跟上数据增长的速度?还有大 数据的能耗高得惊人,处理平台规模庞 大,难以管理等。这就是大数据目前所 面临的挑战,全世界做计算机系统的人 都在想办法怎么解决它,特别是美国计 算机排名在前面的学校,美国的谷歌、 FACE BOOK,中国的华为、阿里巴巴,也 包括中科院的科研机构。
机器学习+大数据 实现优化建模
喻之斌认为解决这些问题还是要用一些数学的方法,从杂乱无章的东西中找出规律,并利用这个规律做一些 优化或者设计。他表示做科学研 究首先要做的就是观察,观察完 了 之 后 做 理 论 分析,就是假说。 实际上假说在科学研究中非常重 要,如果你的假说是能解释,能说 得通的,那么这个假说对于科学 研究就是非常有帮助的。
据介绍,喻博士的团队 主要研究的解决方法是 把机器学习和大数据 这 些 东 西 用 在 计 算 机系统里面来实现 优化,用机器学习 的 办 法 来 建 模 型 。 他 解 释 道 : “这个模型就是 配 置 参 数 做 了 模 型 的 输 入 。 模型要有输入和 输 出 ,这 些 按 钮 你给个值给这个模 型,它就会给你输出。” 经过多次试验,为了减 少精度误差,喻之斌 的 团 队 提 出 了 自 己 的办法“层次化模型”。喻之斌表示他们 的努力就在于挖掘大数据更多的价值, 开拓更多的技术。
本次论坛还增加了有奖问答的环 节,共准备了五本《为创新而生》给现场 的听众,新书是由著名财经作家吴晓波 作序并推荐,这本书详细介绍了深圳先 进院的创新人物故事和创新成果,是国 内的第一本反映创新型科研机构和海 归创业的中国创新样本。现场的听众 踊跃参与,现场氛围十分 热烈。
互动问答