公司动态
行业新闻

全球厂商之最华为17篇论文入选国际数据库顶会ICDE 2024

  • 发布时间:2024-05-23 17:39:30
  • 浏览次数:

  麻将胡了最新官方版下载ICDE收录了各大研究机构以及科技企业在数据库领域最前沿、顶级的研究成果。ICDE2024是第40届IEEE国际数据工程大会,华为17篇论文的入选,是华为科研团队与外部团队或组织友好合作共同努力的结果。下面将摘选华为在本次大会入选的部分论文。

  原生库内机器学习框架,简称GaussML,将机器学习训练作为执行算子,利用数据库并行和分布式能力,展示出超越业界同类产品10倍以上机器学习推理和训练的性能优势,主要能力包括:

  第一,论文首次提出数据库内原生AI机器学习引擎的架构,机器学习算法训练和推理融合在SQL执行流程中,借助数据库的优化器、负载管理、并发处理、分布式并行能力,实现机器学习训练和推理的极致高效;

  第二,GaussML同时构建库内AutoML能力,可以自适应进行参数调整,根据负载变化进行模型更正,设计一种端到端模型自动调优的能力,简化用户调整模型参数代价,提升数据库内模型的使用便利;

  第三,GaussML通过在数据库内置原生机器学习训练和推理流程,实现端到端自动调优能力,构建完整的库内机器学习引擎,支撑客户业务的智能实时分析。该框架通过提供SQL-like接口,简化数据科学家使用机器学习训练和推理代价,支持常用的机器学习算法,满足绝大多数客户使用。

  综上,论文中提出一种全新的机器学习引擎,在多个公开数据集上该引擎表现出卓越的高性能优势,向数据库智能化发展上迈出了更远一步。

  第一,采用同步时钟的去中心化方法,地理分布式数据库系统解决了中心化事务管理器的性能瓶颈问题,实现了中心化的事务管理到去中心化分布式事务管理之间无缝过渡,提供了更加灵活、便捷的部署方式,实现一套集群全球化部署。

  第二,在分片数据的远程读取和长距离日志传送问题上,地理分布式数据库系统支持在异步副本上读取,强一致性,可调整的新鲜度保证,以及动态负载均衡。在跨地域集群上的实验结果表明,与中心化基线相比,该方法提供了高达14倍的只读性能,标准数据集TPC-C吞吐量高出50%以上。

  第一,提出了特征快照(FeatureSnapshot)的概念,用于整合被忽略变量的影响,如数据库旋钮、硬件等,以提高查询成本模型的准确性。

  第二,设计了差异传播特征减少方法,通过剪枝无效特征,进一步提高模型训练和推断效率。

  第三,引入了简化的SQL模板设计,以提高计算特征快照的时间效率。

  第四,在广泛的基准测试中,展示了QCFE相对于现有方法在时间-准确性效率方面的优势,包括TPC-H、job-light和Sysbench等。

  综上,该研究的创新点在于提出了一种有效的特征工程方法,能够显著改善查询成本估算的时间和准确性。

  第一,通过对抗性工作负载的有效生成,可以准确评估indexadvisor的鲁棒性,因为这些工作负载不会偏离原始工作负载,但可以识别由于工作负载漂移而导致的性能漏洞。

  第二,为设计更具鲁棒性的基于学习的indexadvisor,采用细粒度的状态表示和候选剪枝策略可以提高性能。

  第三,对于设计更具鲁棒性的基于启发式的indexadvisor,考虑索引选择过程中的索引交互作用和多列索引的使用是至关重要的。

  作为首篇采用时频掩码对比的时序异常检测论文,论文研究围绕以下三点进行:

  第一,提出了基于时间域和频率域掩码的时间序列异常检测对比准则,其代替传统重建误差确定异常检测阈值,这是一个不受分布偏移影响的判断准则。

  第二,提出了基于窗口的时间域掩码策略和基于幅度的频率域掩码策略以消除序列中潜在的异常观察和模式。因此,TFMAE是一个抗异常偏置模型。

  第三,五个真实世界数据集与两个合成数据集上实验表明,TFMAE在检测性能与速度方面均取得提升。

  本次大会华为入选论文研究方向涉及AI4DB、时序数据库、查询优化、数据库内机器学习算法训练和推理……如此多的科技成果得益于华为长期在数据库前沿技术领域的探索和实践,以及与全球顶尖学术机构共同解决数据库领域世界难题,通过产、学、研、用深度融合,将前沿创新研究融入产品技术,构建健康的数据库产业生态,为客户提供创新的、有竞争力的数据库产品和服务。

  未来,华为将在数据库领域持续创新,持续深耕,引领行业发展走出新高度。

服务热线:400-123-4567
手机号码:138-0000-0000
电子邮箱:jsdldt.com
公司地址:广东省广州市pg模拟器试玩入口

关注我们

Copyright © PG电子·模拟器·试玩平台(中国)官方网站 版权所有