近日
2023年世界互联网大会领先科技奖公布
15个具有国际代表性的项目获奖
清华大学计算机系孙茂松教授团队
“多层次多元知识融通的
自然语言深度学习基础方法”
李国良教授团队
“GaussDB:分布式数据库”
两个项目荣获该奖项
2023年世界互联网大会领先科技奖颁奖典礼
世界互联网领先科技成果区分关键技术、基础研究、工程研发三种类型,得到了全球互联网领域的广泛关注和积极响应,共征集到来自中国、美国、俄罗斯、芬兰、意大利、阿联酋等国家和地区的成果,涵盖人工智能、5G/6G、车联网、大数据、网络安全、高性能芯片、数字医疗等前沿领域。
深度学习瓶颈从自然语言突破
近年来,自然语言处理发展迅猛,从Word2Vec到ChatGPT,实现了自然语言处理从离散符号系统到连续向量空间的技术范式革命。但词表示和句子表示机制不完善、语言模型与知识系统结合不紧密的突出问题依然存在。
孙茂松作分享
“让计算机理解语言,是实现通用人工智能的关键。”孙茂松指出,“多层次多元知识融通的自然语言深度学习基础方法”成果面向词级嵌入表示对语言知识综合利用能力不足、句级语言模型对世界知识主动感知能力不足、语言模型对知识系统深度利用能力不足等三个深刻挑战。
经过持续研究,建立了较为完整的多层次多元知识融通的自然语言深度学习基础方法体系,探索突破自然语言深度学习的若干瓶颈制约,提升了自然语言处理模型的基本能力。
自然语言深度学习基础方法体系
“基于该方法体系,我们形成了一套语言与知识融通的深度学习开源系统。”孙茂松介绍,相关成果己成功应用于华为云,服务150余个国家和地区。
以数为擎,赋能政企赢在数字未来
“数据库是基础软件皇冠上的明珠,千行万业数字化都深度依赖数据库。”在成果分享中李国良指出,分布式数据库作为数据承载工具,为企业数字化转型提供了有力的支撑,但在运维管理方面仍面临着诸多挑战:
海量数据高性能和大并发挑战
支撑数据库服务的高可用挑战
实现削峰填谷的弹性伸缩挑战
大量数据库实例智能优化挑战
保障数据安全防篡改的防护挑战
李国良作分享
为应对这些挑战,GaussDB围绕“五高”构建技术竞争力:
高性能,突破分布式查询优化和事务处理技术,性能达到业界领先水平。
高可用,突破故障自感知的多层级容灾技术,打造中国首个同城双集群“RPO=0”方案,实现机房级、区域级、城市级等多层级的高可用。
高弹性,突破计算存储分离与弹性伸缩技术,实现业务无感的弹性伸缩。
高智能,突破AI赋能的数据库优化技术,实现数据库自治优化。
高安全,突破多方位安全技术,打造全密态、防篡改数据处理能力,保护敏感数据安全隐私。
简而言之,GaussDB以数据为驱动,建设高效运营体系,助力企业数字化转型,赋能行业高质量发展。
其中,华为已全面上线GaussDB,服务4亿+用户,处理效率相比旧系统提升10倍以上。中国邮储银行基于GaussDB,打造新一代个人业务核心系统,为全行6.5亿用户提供日均20亿笔、峰值6.7万笔/秒的交易能力。
最新数据显示,“GaussDB”的全球下载量已超过220万,覆盖100多个国家和地区。
此外,清华大学因在2023年世界互联网大会领先科技奖奖项申报组织工作中成效突出,获得了“卓越组织单位”称号。
“卓越组织单位”奖牌兼证书
每一份荣誉都是前行的鞭策
行稳方可致远
清华人躬耕不辍
不断攀登新的科技高峰!