OpenAI开始恐慌,国内文心大模型3.5突飞猛进,稳居第一

通用大模型生成内容的开发和使用,如何遵守中国相关法律法规和道德规范,保障使用安全?近日,TE·智库根据RlueEva-System大模型测评体系发布《中国通用大模型内容生成及安全性能力评测》,结果显示,百度文心大模型3.5支持下的文心一言综合能力得分8.92,排名第一。特别是“安全体系能力”方面,文心一言更是一骑绝尘,已经逐步拉开与ChatGPT3.5的差距。在当前通用大模型的安全性备受关注与挑战的背景下,百度文心大模型3.5以出色的安全性表现,打破安全性质疑,为中国商用大模型发展注入强心剂。

TE·智库《中国通用大模型内容生成及安全性能力评测》:百度综合评分第一

TE·智库指出,尽管中国本土通用大模型在初始化阶段落后于国外产品,但随着技术的不断进步和创新,以及数据规模的不断扩大,中国本土通用大模型的能力正在逐步提升,综合能力的行业平均水平已经与ChatGPT3.5不相上下。

作为中国本土通用大模型的领先者,源于百度在人工智能领域长期的技术积累和对安全合规的坚持,使得百度文心大模型能够在“百模大战”中持续保持整体竞争力,并领先于行业开展商业化实践。

综合能力评分第一,文心大模型超越ChatGPT3.5,达到领先水平

TE·智库《中国通用大模型内容生成及安全性能力评测》主要包含6大维度27个细化指标项,测评对象既包含ChatGPT3.5,也包含ChatGLM、通义千问、360智脑、讯飞星火,涵盖了国内外主流大模型工具。其中,文心大模型不仅在综合能力评测的得分高居第一,还在6大核心能力方面得分全面领先行业平均水平,位居第一梯队,成为无短板的“六边形战士”。

《中国通用大模型内容生成及安全性能力评测》:百度6大关键能力全面领先行业平均水平

根据测评显示,在常见语义和描述的基础对话能力方面,文心大模型与其他评测模型已经拉开了一定的距离,在“舆论与热点”“时事与政治”领域,文心一言所表现出来的基础服务能力,也比GPT3.5更加突出。在交互响应能力方面,文心大模型在“时事与政治”“舆论与热点”领域,给出的反馈在正确性、规范性、专业性等方面体验到位,表现也超越GPT3.5。

在考验对不同行业、不同行业特定场景的理解、相应知识与信息的交互能力的专业领域能力方面,文心大模型专业能力发展较为均衡,在舆论与热点方面表现均领先于GPT3.5。

结合此前IDC最新发布的《AI大模型技术能力评估报告,2023》等多项报告结果,百度文心大模型3.5整体竞争力位于领先水平,毫无疑问,是这场大模型技术突破者和应用引领者。在算法模型能力、行业覆盖以及生态布局上优势明显,并已提前进入商业化落地探索阶段。

IDC《AI大模型技术能力评估报告,2023》:百度7项满分、综合评分第一

安全性一骑绝尘,百度文心大模型满足合规与安全要求

技术的先进性其实与网络的安全性并不是完全成正比的,一项先进技术的大规模应用,或将带来不可控的风险。近期,ChatGPT的数据安全问题和隐私问题风波不断,多个国家相继开展对其的调查,多家知名公司也宣布禁用ChatGPT。生成式人工智能技术惊人的发展速度正在加剧人们对网络安全的担忧。

本次评测结果验证了中国本土大模型在安全性方面的努力,文心大模型在安全体系方面表现出足够的能力。其在伦理道德、隐私保护、违法犯罪、负面诱导等方面均展示出强大的防护能力。

TE·智库对于文心大模型做出以下评价:① 对于明确的“任务”,能够做到准确的识别,执行的“任务”包括违法乱纪、恶意辱骂、隐私涉密、谣言造假等性质的问题;② 对于存在争议的内容的“任务”,能够客观持中的给出相关信息;③ 对逻辑复杂且存在诱导类的“任务”,能够基于社会主义核心价值观针对性的做出正确“指引”。

《中国通用大模型内容生成及安全性能力评测》:百度文心安全能力全面领跑

近日,国家网信办等七部委发布《生成式人工智能服务管理暂行办法》,为促进生成式人工智能健康发展和规范应用提出管理框架,也预示着我国商用大模型浪潮即将开启。百度是全球为数不多的全栈布局的人工智能公司,具有“芯片-框架-模型-应用”四层技术栈独特优势,具备保障安全与合规的防范能力,未来也将以实际行动引领行业紧跟法治之“舵”,用好创新之“桨”。

深入产业实体,文心大模型拥有中国最大产业应用规模

新技术的发展必须服务于产业实践,否则只能是空中楼阁。在发挥数字经济优势,建设数字中国的大背景下,同时具备本地安全合规能力和自主研发技术实力的文心大模型拥有广泛的行业应用前景。

目前,文心大模型3.5已经正式推出,与文心大模型3.0相比,文心大模型3.5的训练速度提升2倍,推理速度提升17倍,大大提高模型迭代升级的效率,大幅降低训练及使用成本,进一步提升用户体验。

人工智能重塑千行百业。随着一系列政策法规的落地,中国大模型也将快速进入商用的阶段。产业价值决定产品竞争力,百度文心大模型源于产业实践,服务于产业实践。未来,期待文心大模型将坚持长期主义,深耕产业实践,与中国企业携手,提升技术创新能力,探索智能化应用场景落地,为中国实现高水平科技自立自强支撑高质量发展持续助力。

文章为作者独立观点,不代表BOSS直聘立场。未经账号授权,禁止随意转载。