大考在即 百度版ChatGPT会翻车吗?(大考第六集)
飞桨社区成员放出的ERNIE3.0模型功能
有程序员在百度的飞桨社区中放出过ERNIE3.0在“文本理解与创作”上的效果,截图显示,该模型可实现同义改写、写作文、对对联、写小说、补全文本等功能,其中也支持自由问答,输入问题后,点击立即生成,就会获得AI的答案。
《元宇宙日爆》发现,现在在文心大模型官网上,如果你在“开放API”栏目中点击“ERNIE3.0文本理解与创作”选项时,直接弹出的是文心一言的官宣预告。这或许暗示着,ERNIE3.0身上的本事很可能将在文心一言中展现,双方的关系类似GPT-3模型与ChatGPT。
大模型露玄机 “搜索+云”追微软
ERNIE3.0模型的存在至少证明了百度在对话机器人上已有技术积累。
如果类比的话,百度的ERNIE文心大模型类似于Open AI的GPT模型,于2019年推出,从单一的自然语言理解延申到多模态,包括视觉、文档、文图、语音等,不断迭代到了3.0。
文心一言和去年8月推出的AI生图应用“文心一格”一样,名字部分直取于文心大模型,那么基于ERNIE系列,文心一言就可以在这个模型上进行泛化和性能调整。ERNIE 3.0的文本理解与创作能力也说明了这一点。按百度内部人士的说法,文心一言不是什么新鲜物种,是大模型基础上的迭代。
那么,脱胎于文心大模型的文心一言,到底是网页版的ChatGPT还是搜索引擎式的新Bing?
更大的概率会集成进搜索引擎中。
一方面,百度最为人知的产品是国人天天都要“百度一下”的搜素引擎,同类竞品中,谷歌、微软这两大巨额投入AI的公司也最先将对话机器人的模型和技术嵌入到搜索中。
此外,生成式AI和搜索引擎在技术上本身“很搭”。今年1月,百度Create AI开发者大会前夕,李彦宏表态,将基于百度自研的生成式模型升级为“生成式搜索”,“生成式AI和搜索引擎是互补关系而不是替代。”
将文心一言引入搜索引擎,对百度的大模型也有好处。要知道,ChatGPT预训练大模型的语料数据主要来自互联网的文本数据库,包括从网络文本、维基百科、文章中获取的高达570GB的数据。那么,文心一言如果接入百度搜索引擎,与用户的交互和聊天将为文心大模型提供更具数量级的自然语言模型的训练数据,这些大规模结构化、非结构化的数据将为中文版的ChatGPT提供更充分的预训练语料。
文心大模型诸多产品化
综合分析,文心一言接入百度搜索的可行性很高。而除了搜索,这个Bot可嵌入的另外一块百度基建是“云”。
ChatGPT爆火后,微软几乎将全线产品都加上了OpenAI研发的GPT 3.5模型,除了Bing和Office外,Azure云服务是其中的重头戏,微软试图通过Azure+GPT3.5的方式对外输出AI基础设施、模型和工具链,服务于想要构建应用程序的第三方。
如果说“文心一言+搜索”是面向C端的产品,那么“文心一言+云”会直取B端,这意味着商业化。
在云市场上,百度智能云已经上岗7年,在AI高需求的算法、算力上均有布局,比如位于阳泉、定兴、徐水的三个云计算中心,这些基建的存在十分必要,毕竟,国产版ChatGPT上线后,首先得“不崩”。应对有高并发需求的产品,ERNIE大模型将再次验证百度云高并发、高弹性、高精度的能力。
反观AI,百度也极其擅长将大模型的能力产品和场景化,光文心大模型,就整合出适配医疗、金融等各种具体场景的子模型,去年还搞了AI生图的文心一格。
文心一言首批生态合作伙伴已是企业云集,百度要“交朋友”,各家公司也不吝惜友情。百度内部人士透露,每天都会收到“求内测”的企业客户。ChatGPT这口鲜货,无论是主营线上业务的互联网公司,还是主打线下场景的传统企业,都跃跃欲试。海外跨境调用难,百度国产自然成了香饽饽。
C端有搜索引擎,B端有云服务,文心一言能整合的百度产品不少。发布会在即,测试将近,这个“本地媳妇”是丑是俊、能否和“外来媳妇”一拼,3月16日之后将见分晓。
你期待文心一言吗?
免责声明:本文内容由互联网用户贡献,不作为任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!如有侵权请联系我们删除,本文链接:http://www.panmou.com/yyz/62012.html。