更新時(shí)間:2023-07-08 08:11:41點(diǎn)擊:
作者 | 程瀟熠
編輯 | 康曉
出品 | 深網(wǎng)·騰訊小滿工作室
“華為的盤古大模型不作詩,只做事?!比A為常務(wù)董事、華為云CEO張平安在華為開發(fā)者大會2023上稱,AI技術(shù)從多分支發(fā)展進(jìn)入大模型時(shí)代,今年全球已發(fā)布百個(gè)大模型,中國發(fā)布超80個(gè)大模型,這些大模型的共性是基本都會“對話作詩”,而華為大模型要在行業(yè)領(lǐng)域賦予價(jià)值。
7月7日,華為發(fā)布盤古大模型3.0,推出昇騰AI云服務(wù)。據(jù)華為介紹,昇騰AI云服務(wù)千卡訓(xùn)練30天長穩(wěn)率達(dá)到90%,斷點(diǎn)恢復(fù)時(shí)長不超過10分鐘。除了支持華為的AI框架Mindspore外,還支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,均可通過華為的遷移工具從GPU平滑遷移到昇騰。
華為在此輪人工智能浪潮中的思考是,要全力推進(jìn)人工智能“走深向?qū)崱?。昨日,華為輪值董事長胡厚崑在2023世界人工智能大會上稱,2022年底ChatGPT的出現(xiàn),將人工智能推向新風(fēng)口,人工智能將幫助人類改寫身邊的一切。“走深向?qū)崱眲t是華為的重要戰(zhàn)略。
如何“走深向?qū)崱保咳A為認(rèn)為一方面是深耕算力,打造強(qiáng)有力的算力底座以支撐中國人工智能事業(yè)發(fā)展。另一方面,結(jié)合大模型,從通用大模型到行業(yè)大模型的研究創(chuàng)新,讓人工智能能真正服務(wù)好千行百業(yè)、科學(xué)研究。
胡厚崑透露,目前華為云生態(tài)已孵化了20多個(gè)基礎(chǔ)的大模型,同時(shí)還適配了10多個(gè)業(yè)界主流的大模型。另外,華為云盤古大模型已經(jīng)深入金融、制造、政務(wù)、電力、煤礦、醫(yī)療、鐵路等10多個(gè)行業(yè),支撐400多個(gè)業(yè)務(wù)場景的AI應(yīng)用落地。
“我們非常有幸共同見證了科技革命的幾次浪潮,從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),再到云計(jì)算,到人工智能,每一輪的變革都給社會帶來了深遠(yuǎn)的影響。毫無疑問,站在今天,通用人工智能正給我們無窮的想象空間,也正帶領(lǐng)我們走進(jìn)下一個(gè)黃金的10年?!焙駦嫹Q。
盤古大模型三步走
盤古大模型從2020年啟動研發(fā),2021年4月正式發(fā)布,再到2022年進(jìn)行行業(yè)應(yīng)用落地,華為將其進(jìn)化路徑可分為L0-L1-L2三個(gè)階段。
盤古大模型L0至L2路徑示意圖 ?來源:國金證券研究所
L0階段為基礎(chǔ)大模型階段,包括NLP(中文語言)大模型、CV(視覺)大模型、多模態(tài)大模型、科學(xué)計(jì)算大模型以及Graph(圖網(wǎng)絡(luò))大模型等。
其中,基于提示調(diào)優(yōu)、動態(tài)冰化等一系列正則化技術(shù),NLP大模型已實(shí)現(xiàn)小樣本學(xué)習(xí)任務(wù)超越GPT系列。
L1階段為行業(yè)大模型階段,指在L0基礎(chǔ)上導(dǎo)入行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練后衍生出的模型,如盤古金融大模型、盤古礦山大模型、盤古電力大模型、盤古制造質(zhì)檢大模型、盤古藥物分子大模型等行業(yè)大模型。
目前,華為云盤古大模型已經(jīng)進(jìn)入金融、制造、政務(wù)、電力、煤礦、醫(yī)療、鐵路等10多個(gè)行業(yè),支撐400多個(gè)業(yè)務(wù)場景的AI應(yīng)用落地。
在科學(xué)領(lǐng)域,氣象大模型、藥物分子大模型已有成果。今年6月,華為云盤古氣象大模型研究成果在國際學(xué)術(shù)期刊《Nature》正刊發(fā)表,據(jù)稱為近年來首篇以中國科技公司作為唯一署名單位發(fā)表的《Nature》正刊論文(華為云獨(dú)作)。
《Nature》審稿人評價(jià):“華為云盤古氣象大模型讓人們重新審視氣象預(yù)報(bào)模型的未來?!?/p>
據(jù)介紹,華為盤古氣象大模型是首個(gè)精度超過傳統(tǒng)數(shù)值預(yù)報(bào)方法的AI模型,能夠提供秒級全球氣象預(yù)報(bào),預(yù)測速度提高10000倍以上,臺風(fēng)軌跡預(yù)測準(zhǔn)確度世界第一,臺風(fēng)生成時(shí)間與移動軌跡預(yù)測的預(yù)測準(zhǔn)確率超過85%。相比歐洲氣象局提升約20%。
盤古提前10天預(yù)測臺風(fēng)瑪娃的路徑、提早預(yù)測寒潮
另外,官方稱,盤古科學(xué)大模型還打破了醫(yī)藥界的“雙十定律”, 即一款新藥從研發(fā)到上市,平均需要10年時(shí)間和10億美元的投入。而西安交通大學(xué)第一附屬醫(yī)院利用盤古藥物分子大模型設(shè)計(jì)出的全新的廣譜抗菌藥物Drug X,讓先導(dǎo)藥的研發(fā)周期 從數(shù)年縮短至一個(gè)月,研發(fā)成本降低70%。
L2是指在L1基礎(chǔ)上結(jié)合行業(yè)細(xì)分場景得到的推理模型。比如,在盤古礦山大模型、盤古電力大模型、盤古制造質(zhì)檢大模型等L1行業(yè)模型的基礎(chǔ)上,針對其中細(xì)分具體任務(wù),如偏光片質(zhì)檢、電力巡檢、鐵路 TFDS 檢測、傳送帶異物檢測等,通過“預(yù)訓(xùn)練+微調(diào)”得出L2細(xì)分場景模型。