《电子技术应用》
您所在的位置:首页 > 人工智能 > 业界动态 > IDC首发中国大模型技术评估报告

IDC首发中国大模型技术评估报告

百度智能云中国第一
2024-11-26
来源:C114通信网

近日,全球领先的IT市场研究和咨询公司IDC发布《中国生成式AI应用开发平台市场:企业统一AI开发平台的雏形》报告。该报告不仅对市场上主流的大模型平台厂商进行了对比分析,还为企业用户选择大模型平台提供了关键的技术指标。在此次评估中,百度智能云获得七项满分,位于所有大模型平台厂商第一名。亚马逊云AWS阿里云并列第二名。

0.png

IDC报告指出,大模型平台给应用程序开发提供了一个新的路径,企业在选择大模型平台的时候,应该重点关注厂商在模型层和数据层的能力。在模型层能力方面,如何让模型更好的适配企业的应用场景至关重要。而在数据层能力方面,如何做好RAG(检索增强生成),保证生成内容的准确性,消除幻觉最为关键。

而在这两个方面,百度智能云都有深厚的技术积累。百度智能云千帆大模型平台(以下简称千帆平台)是大模型与AI应用开发及服务平台,可以从模型开发、模型服务、应用开发三大维度,为企业提供全流程服务。目前,文心大模型日均调用量超过15亿次,千帆平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用。

模型精调助力大模型与产业深度融合

大模型具有强大的泛化能力,可以处理很多通识类问题,但在某些特定行业及领域的表现不如人意。这是因为不同行业有着独特的专业知识、逻辑和数据特点,通识知识无法完全覆盖这些特殊需求。模型精调是增强大模型在行业应用中表现的关键,通过将行业的专业知识和数据特征融入大模型,可以让其更好地满足行业特定需求,从而提升应用的准确性和可靠性。

行业内主流大模型服务商也正在通过大模型平台提供模型精调服务,帮助企业快速打造AI应用。

AWS SageMaker集成了亚马逊的高性能预训练模型库,这些预训练模型在大规模的通用数据上进行了训练,已经学习到了丰富的特征表示和知识,为模型精调提供了良好的基础,同时,SageMaker 还提供了多种先进的机器学习算法,用户可以根据精调任务的特点和需求,选择合适的算法来进一步优化模型性能。

百度智能云千帆大模型平台提供了完整的工具链,是业界首个上线DPO、KTO等模型训练方法的平台,提供了高质量通用语料数据和开箱即用的模型精调样板间。无论是想要自己准备数据、做精调,还是想快速上手、复制行业最佳实践,千帆平台都可以高效支持。目前,在千帆平台上,每天有超过一半的调用量是来自精调后的模型。

拿医疗行业举例,杭州全诊医学基于千帆平台和文心大模型打造了AI医疗助理应用,能够在导诊、预诊、诊间、入院、手术、随访等全阶段服务医生患者。以辅助医生撰写病历为例,全诊医学通过使用20万份精标病历数据对大模型进行了精调,使AI医疗助理的医学用语更准确、更规范,大幅提升病历内容质量。病历生成的准确度提升了45%,医生的接诊量提高了20%,造福更多病患。

RAG已成为企业解决大模型幻觉问题的有效手段

生成式 AI 已成为企业布局和投资的重点,企业希望借助大模型实现降本增效和产品创新。然而,通用大语言模型(LLM)在实际应用中往往存在幻觉问题或回答不准确的情况,尤其是在面向 B 端场景时,难以有效满足企业的落地需求。为解决这一问题,企业通常采用 RAG(检索增强生成)技术,将生成式 AI与企业内部数据库、知识库相结合,使生成内容更加准确、合理。在此过程中,向量数据库凭借其在语义理解和高效检索方面的独特优势,成为企业实现 RAG 的关键组成部分。

不久前,IDC发布了《RAG与向量数据库市场前景预测》报告,对使用大模型的企业进行了深入调研。报告显示,在生成式 AI 的开发过程中,41% 的高管认为构建 RAG 架构至关重要;此外,81% 的 IT 领导者认为,基于业务数据的生成式 AI 模型能够为企业带来显著的竞争优势。这表明,RAG 技术在提升通用大模型准确性方面效果显著,且企业对其认可度正持续提高。随着更多企业意识到 RAG 的重要性,它有望成为生成式 AI 落地的关键推动力。

在分析了RAG和向量数据库市场的发展趋势后,IDC还评估了市场上的主要厂商。在这一评估中,百度智能云的向量数据库 VectorDB 在核心性能、功能全面性、大模型支持、战略与生态合作、工程化落地五个关键领域保持领先,综合排名并列第一。

0.png

目前,百度智能云 VectorDB 已经在超过 500 家客户中实际落地使用,支持 HNSW、Puck、PQ 等常用算法,主流 LLM、RAG 框架,以及百度智能云千帆和开源 Embedding 模型,支持企业一站式部署落地。面向未来,百度智能云 VectorDB 将继续在产品形态、内核功能、生态支持三个方面重点发力,为企业 AI 应用落地服务,提供最专业的向量数据库服务。


Magazine.Subscription.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。