中共中央政治局4月28日会议指出,要夯实科技自立自强根基,培育壮大新动能。要重视通用人工智能发展,营造创新生态,重视防范风险。现阶段,大模型成为人工智能发展的热点方向,尤其是文心一言和ChatGPT等近来备受关注的大语言模型,具备与人对话互动、回答问题、协助创作等能力,有望带来人工智能创新的爆发式增长,成为全球科技竞争焦点。
百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在近日的一次活动上表示,人工智能是模拟、延伸和拓展人的智能,最终目的是服务于人类更美好的生活和社会的发展。文心一言这样的人工智能技术,本质上是提升生产力的工具,也会成为一个通用的赋能平台,加速产业智能化变革 ,创造巨大的商业价值。
大模型成人工智能发展热点,文心一言落地水到渠成
大模型具有效果好、泛化性强、研发流程标准化程度高等特点,成为人工智能技术研发的新范式,推动产业应用蓬勃发展。文心一言(ERNIE Bot)是百度自主研发的知识增强大语言模型,基于ERNIE 及 PLATO 系列模型研发,其关键技术包括有监督精调、人类反馈的强化学习、提示等大语言模型都会采用的技术,以及知识增强、检索增强和对话增强等百度已有技术优势的再创新。
文心一言是百度多年技术积累和产业实践的水到渠成。百度是全球为数不多、拥有“芯片层、框架层、模型层、应用层”四层人工智能技术全栈布局的人工智能公司。从昆仑芯片、飞桨深度学习平台、文心大模型到应用,百度在技术栈的各层都有领先业界的关键自研技术,实现了层与层反馈,端到端优化,大幅提升效率。尤其是飞桨深度学习平台和文心大模型的联合优化,为文心一言提供了坚实的技术支撑。飞桨有效支撑了大模型的灵活开发、高效训练和推理部署。
百度自2019年开始深耕预训练模型研发,经过近4年积累和迭代,文心大模型已经形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等大模型,面向行业需求构建的系列行业大模型,以及支撑大模型应用的工具平台,具备知识增强和产业级两大特色。
文心打通大模型产业化路径,带来三大产业机会
大模型依赖算法、算力和数据的综合支撑,产业化面临挑战:模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据质量参差不齐。对此,王海峰表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
这一产业化路径已在文心大模型的产业实践中得到验证,百度与各行业头部企业或机构共建11个行业大模型,已在能源、金融、航天、制造、传媒、城市、社科以及影视等领域落地,加速推动行业的智能化转型升级。
随着文心一言知识增强大语言模型进一步落地,大模型将带来三大产业机会:第一类是新型云计算,云的主流商业模式变为MaaS模型即服务(Model as a Service);第二类是进行行业模型精调的企业,可以调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行文本生成、图像生成、音频生成、视频生成、数字人、3D等场景相关应用开发的企业,即应用服务提供商。
大模型带来的智能化创新热潮才刚刚开始。关于大模型距离AGI还有多远?王海峰表示,正如人造卫星永远不会和月球这样的自然卫星画等号一样,人工智能永远不会直接跟人类的智能完全画等号,人工智能是模拟、延伸和拓展人的智能,最终目的是服务于人类更美好的生活和社会的发展。人工智能的通用性越来越强,部分能力已经达到或超越人的水平,大语言模型的出现,让我们看到通用人工智能的曙光。但比起这个概念本身,人工智能为人类带来价值才是我们努力的方向。
雷峰网