腾讯云发布自研向量数据库,助力大模型训练
网络
2023-07-11
7月4日消息,腾讯云今天宣布推出全新的自研向量数据库(Tencent Cloud VectorDB)。这一数据库将于8月份在腾讯云官网上线,为企业提供更高效的大模型训练服务。
根据腾讯云数据库副总经理罗云的介绍,向量数据库已经在腾讯旗下的QQ浏览器、腾讯视频、腾讯游戏、QQ音乐、搜狗输入法等30多个业务场景中成功应用。为了打造这一数据库,腾讯云自主研发了分布式向量数据库核心引擎Olama,该引擎最早在2019年4月开始孵化。经过持续的研发和优化,Olama现在已经支持十亿级别的单行向量数据索引,并能够达到每秒百万次的查询量,响应延迟仅为20毫秒。
据了解,腾讯云的向量数据库源自腾讯集团日常处理千亿次检索的向量引擎(OLAMA)。该数据库单个索引支持10亿级别的向量规模,适用于AI运算和检索,与传统方案相比,数据接入AI的效率提升了10倍。
除了向量数据库的发布,腾讯云还在今年6月19日首次公布了其行业大模型研发进展。通过腾讯云TI平台,他们计划建立一个行业大模型精选商店,为客户提供一站式的MaaS(Model-as-a-Service)服务。此外,腾讯云还在今年4月发布了专为大模型训练设计的全新一代HCC高性能计算集群。该集群采用最新一代的腾讯云星星海自研服务器,具备行业最高的3.2Tbps互联带宽,并且算力性能提升了3倍。
腾讯云的向量数据库的发布将进一步推动大模型训练的发展,提高企业在AI领域的竞争力。随着腾讯云不断推出创新技术和解决方案,中国的云计算市场将迎来更加活跃的发展态势。