Zilliz 在第三届稀土开发者大会 (XDC 2023)上的分享可以解答一二。近日,由稀土掘金技术社区主办的 XDC 2023 成功开幕。Zilliz 受邀参与并和业界同仁一起围绕开源生态与产业发展,探索和发现产业中最具价值的新技术,探讨在技术变革中的应对策略,期望携手万千技术开发者在激荡的环境中,共同探寻前行的方向。

在大模型与 AIGC 论坛上,Zilliz 开发者关系及市场运营负责人、客户成功与生态发展负责人李晨进行了名为《向量数据库:面向 AIGC 的海量记忆体》的主题演讲。

为大模型落地而生!向量数据库Zilliz Cloud 为何能成 AIGC 开发者必备神器?

李晨指出,当前大模型面临的主要问题之一是“AI 幻觉”,而构建知识库是解决该问题的有效方法。向量数据库可以作为知识库的扩展插件,为大模型提供知识增强的能力。

为大模型落地而生!向量数据库Zilliz Cloud 为何能成 AIGC 开发者必备神器?

向量数据库是为人工智能而生的数据库。作为全球第一款开源的向量数据库,Milvus 具备云原生分布式、超高性能、可插拔引擎以及云端一体化的特点。通过与 NVIDIA Rapids 的合作,Milvus 成为全球首个支持 GPU 的向量数据库,查询性能提升了 3 倍;而与 OpenAI 的合作,则使得 ChatGPT 的插件具备了向量检索的条件。

为大模型落地而生!向量数据库Zilliz Cloud 为何能成 AIGC 开发者必备神器?

当然,向量数据库的玩法远不止于此,在配合大模型的基础上叠加如今火热的 LangChain、LlamaIndex、Semantic Kernel 等框架项目,向量数据库可以将记忆体的效果发挥到极致,帮助开发者实现 12 小时写出一个 AI 程序的梦想。

这种搭配也为大语言模型时代构建数据应用提供了一种新的范式,称为 CVP Stack。其中,C 代表以 ChatGPT 为代表的大模型,V 代表向量数据库,P 代表 prompt 工程。C 作为运算单元,提供逻辑分析和自然语言对接的能力;V 作为存储单元,提供稳定准确、高容量的知识;P 在前两者的基础上,提供面向具体业务的适配能力。

例如,Zilliz 的工程师就曾用两天的时间做出了 CVP Stack 的 OSSChat(https://osschat.io),用于解决开源项目文档冗长、不易查找等问题,目前已经支持几十个主流的开源项目,访问量巨大,用户甚至可以去生成开源项目的代码。

为大模型落地而生!向量数据库Zilliz Cloud 为何能成 AIGC 开发者必备神器?

目前,Milvus 不仅具备百亿级向量的扩展能力,还集成了 OpenAI、Langchain、Huggingface、Pytorch 等人工智能生态系统,成为大语言模型落地应用的重要组成部分。

当然,为了提供开箱即用的全托管向量检索服务,Zilliz 还推出了全托管的 Milvus 向量数据库产品——Zilliz Cloud。它具备维护成本低、使用门槛低、丰富的企业级特性以及安全可靠的特点。Zilliz Cloud 已经支持了 AWS 和 GCP,即将支持阿里云、百度智能云、腾讯云、金山云等云平台。

可以说,Zilliz 致力于构建开源+云的非结构化数据处理方案。而随着 AIGC 浪潮的兴起,Zilliz 必将披荆斩棘,带领向量数据库行业成为AIGC时代架构的重要组成部分。未来,在 AIGC 领域的推动下,向量数据库将朝着更大、更快、更稳的方向发展,降低使用成本,更好地服务于开发者和企业。

总的来说,向量数据库作为大模型时代备受关注的细分领域,在 AI 时代具有重要意义。作为赛道的奠基者和领先者,Milvus 和 Zilliz Cloud 通过 CVP Stack 为大模型场景的落地提供了典型的范例。回到AI时代,对于广大开发者和相关企业来说,探索开箱即用的向量数据库产品是必然趋势。

值得欣喜的是,据 Zilliz 官方透露,全托管的 Milvus SaaS/PaaS 将于下周上线,由 Zilliz 原厂打造!将覆盖阿里云、百度智能云、腾讯云、金山云等云平台。目前已经支持试用申请,企业用户可以申请 PoC 或其他商务合作,请联系 business@zilliz.com。