问世不到半年的ChatGPT,在掀起全球资本狂潮的同时已经引发全球领域的AI争夺战,作为OpenAI十年投入百亿美元的研究成果,ChatGPT让国内AI产业看到了新的机遇,集体下场迎接融资热潮。
然而,在国内AI公司争相布局大模型赛道的同时,GPT技术的垂直领域应用却鲜少有投资者关注。针对垂直领域大模型技术落地应用,北极星电力网邀请到了工业AI领域的北京智芯微电子科技有限公司,让我们跟随智芯公司的视角探寻ChatGPT的技术本质及其在电力等垂直领域的落地路线。
(资料图片仅供参考)
01
国内AI行业困局—缺乏前瞻技术布局,难以摆脱“跟随者”角色定位
从纸面实力上来看,中国AI企业实力十足,截止至2021年3月,中国人工智能企业数量位居全球第二,融资规模全球最大,专利申请量世界第一。然而,国内企业似乎并不热衷于开拓新的领域,从2006年深度学习问世以来,似乎在每一个AI技术的关键节点,中国都落后于国际,国内企业更多的是在技术经过市场验证之后进行跟进。
从最早的ImageNet, 到后来的AlphaGO, Transformer, BERT, AlphaFold 以及最近的 ChatGPT和SAM。中国所扮演的更多是“跟随者”的角色,基于AlphaGO研发象棋版AlphaGO、基于BERT发布“Chinese-BERT”、基于AlphaFold研发“uni-fold”、基于GPT技术研发“文心一言”、“通义千问”等,缺乏新领域的“开拓者”精神。
在ChatGPT发布后,国内十余家龙头企业争相推出对标产品,智芯公司认为,这充分证实了我国AI行业不是没有开辟新赛道的能力,对基础技术的长期钻研、对前瞻技术的战略性布局是国内AI产业的首要短板。
智芯公司深耕工业AI领域十余年,先后突破了芯片存算一体架构、动态可重构硬件加速单元、轻量化工具链、工业级高可靠防护体系等基础关键技术,成功研制了“猎鹰”系列边端侧人工智能芯片,部分关键指标达到国际领先水平;前瞻技术方面,与清华、北大、鹏城实验室、之江实验室及各行业应用企业联合构建了“产-学-研-用”一体的人工智能生态体系,服务工业人工智能的研究与落地。其中,与北大共建了“北大-北京智芯视觉智能校企联合实验室”,进行工业数字视网膜技术、视觉安全体系等研究;与阿里共建了“智芯-阿里RISC-V联合实验室”,进行RISC-V开源指令架构、多芯粒互联等研究,着力解决大算力芯片短板问题,为实现AI产业全链条自主可控和可持续发展提供坚实底座。
02
ChatGPT的强工程化本质—强大但不万能,垂直领域应用疲软
ChatGPT不是搜索引擎,也不是数据库,实际上是基于概率统计的“单字接龙”,给模型输入任意长度的上文,模型会根据上文去生成下一个单字。在技术方面,ChatGPT并没有创新,能够取得如此惊人效果主要是因为工程化做到了极致。
与传统语言处理模型相比,ChatGPT的优点很明显,超大规模的模型参数量及海量的训练数据,使得ChatGPT拥有极强的表现力,可以处理更复杂的自然语言任务,生成自然流畅的对话与文本。如果GPT技术能够真正地克服现有缺陷并成型,那么其潜在用户极易对其形成巨大依赖,大量重复性通用工作将彻底被基于GPT技术的人工智能所替代。
智芯公司认为,现阶段的ChatGPT更多的是一个技术上的半成品,是数学公式在大数据量的驱动下得到的工程化结果,并没有脱离开现有的理论基础及方法,更适用于通识类问题或简单请求,在更侧重于客观准确描述及专业性决策的垂直领域中落地时具有局限性。
智芯公司把ChatGPT云端大模型比作为“大脑”,要想实现一项完整的机能,离不开“眼”、“鼻”、“耳”和“四肢”的感知和反馈,而边端侧AI芯片就是人工智能云边端应用体系中的感知触手。智芯公司秉持“自主研发+开放合作”的发展理念,牢牢把握行业应用的“牛鼻子”牵引作用,以边端侧AI芯片为先手棋,打造了覆盖云-边-端不同算力等级需求和多样化应用场景的“猎鹰”芯片体系。“猎鹰”芯片具备低功耗、可重构、高可靠、高安全等特性,作为设备智能化升级的核心芯片已在电力运检、智慧城市、移动/电信运营商等多个领域实现规模应用,经受住了极高/低温、高湿等恶劣环境的严峻考验,相关应用模式已拓展至智慧交通、智慧社区、智能制造等领域。
03
国产ChatGPT如何破局—本地生态先闭环,加快垂直领域大模型落地
当代人工智能的技术发展依赖于芯片提供的强大算力、神经网络算法结构以及数字化转型浪潮下的海量数据,是一套软硬件紧耦合的体系。而受限于研发成本、技术积累等因素,国内AI企业主要集中在软件研发上,底层算力布局缺位、基础研究与应用研究失衡、软硬件结合的生态缺失等问题在短期内难以解决,是我们长期面临的现实情况。
智芯公司指出,各垂直领域率先建立局部生态闭环、以垂直应用拉动全域生态是国内企业可以尝试的一条出路。具体可按“1+1+N+M”模式,分4个步骤实现大模型在垂直领域的轻量化落地和规模化工程应用。
1.选用1个成熟商用大模型为基础版本,进行私有化部署;
2.根据垂直行业特性对商用大模型进行微调,生成1个行业基础大模型;
3.针对行业内不同细分专业领域,分别进行微调,得到N个业务大模型;
4.对业务大模型进行轻量化处理和云边端协同部署,实现M个具体业务应用的智能化升级。
智芯公司已完成了超100000T算力规模的云边端硬件环境搭建,并针对电力应用实现了不同级别大、中、小模型的云侧和边侧的私有化部署,可在服务器、存储、大模型集中算力、协同通信带宽、小型化/离线部署算力等方面为垂直领域人工智能模型私有化部署提供整体参考方案。
04
从“跟随者”到“开拓者”的转变—数据、算法、算力齐发力
事实证明ChatGPT技术并不复杂,实现也绝非难事,中国AI产业更需要像智芯公司这样的企业,起得早、走得稳、静得住,深入理解工业应用需求和环境的特殊性,对产品做极致打磨的同时引领技术创新发展路线。全产业链上下游企业应通力合作,实打实地从底层技术出发,算法、数据、算力三方面齐头并进,尽快实现从"跟随者”到“开拓者”的转变。
算法方面,需进一步加强大模型技术与产业应用的结合,在目前国内算力受限的情况下探寻落地模式,各垂直领域构建算力消耗相对较小的专用模型;数据层面,建立通用和专用人工智能超大规模数据库平台,用于大模型训练和生成;算力方面,通过财政补贴、揭榜挂帅、产业基金等方式,支持集成电路企业进行源技术创新和工程化实践,探索通过chiplet技术实现先进工艺制程替代的可行性和落地路线,尽快缩短算力差距。
“算法”、“数据”、“算力”齐发力,产、学、研、用高效协同,加速垂直领域生态闭环和全域生态合作,我国AI产业必将破局。