■原題:算法訓練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
■記者:思文
行業(ye)大(da)模(mo)(mo)(mo)型正在爆炸式集中推(tui)出(chu),關注大(da)模(mo)(mo)(mo)型的(de)(de)人(ren)士都知(zhi)道了行業(ye)大(da)模(mo)(mo)(mo)型的(de)(de)簡單公式,通(tong)用大(da)模(mo)(mo)(mo)型+行業(ye)場景+訓練調優=行業(ye)大(da)模(mo)(mo)(mo)型,因此訓練調優是(shi)企(qi)業(ye)自研(yan)大(da)模(mo)(mo)(mo)型不可避開(kai)的(de)(de)重要環節(jie)。
然在其他企業(ye)還在觀望,推出(chu),演示(shi)或(huo)者調優(you)的(de)當(dang)下,宇視作為推出(chu)AIoT行業(ye)大(da)模(mo)型的(de)第一人(ren),6月9號(hao),其小范圍召開(kai)(kai)了大(da)模(mo)型“梧(wu)桐”種子合作伙伴簽約會(hui)并(bing)公開(kai)(kai)了“梧(wu)桐”未(wei)來的(de)規劃(hua)。
目前“梧桐”針對需求計劃細化出三種不同模型:
l CV(計算機視覺)行業大模型
提供AI訓練、AI在(zai)線學習等服務(wu),預計將在(zai)7月底上線,現(xian)階段(duan)已(yi)經在(zai)小范(fan)圍測試(shi)。
l NLP(自然語言處理)行業大模型
提(ti)供資料中心(xin)、大數(shu)據(ju)平臺(tai)、代(dai)碼開發(fa)等(deng)服務,這是一款自(zi)用行業大模(mo)型(xing),目(mu)前階段(duan)只在宇視內(nei)部(bu)使用,主(zhu)要用在內(nei)部(bu)生產,精準(zhun)度要求更高。
l MM(多模態)行業大模型
提供Vlog等(deng)服務,目(mu)前(qian)已(yi)在樂(le)園景(jing)區、鄉村振興等(deng)場景(jing)的視頻宣傳(chuan)上有豐富的落地(di)案(an)例。
那打出“AIGC平權”旗幟的宇視將怎么把技術平權和知識平權真正融進中小型企業業務里?
CPS中安網(wang)作為(wei)特(te)邀(yao)媒體就此疑(yi)問與部分宇(yu)視核心高管面(mian)對面(mian)進行了(le)“圓(yuan)桌對話”。
1、大模型趨勢下
中小型企業怎么用好數據?
中(zhong)(zhong)小(xiao)企(qi)業(ye)作(zuo)為中(zhong)(zhong)國經濟發展的重要主體之(zhi)一(yi),據(ju)工信(xin)部公布的數據(ju),2022年我國日均(jun)新設(she)企(qi)業(ye)達2.38萬戶(hu),中(zhong)(zhong)小(xiao)微企(qi)業(ye)數量已(yi)超過(guo)5200萬戶(hu),在如今(jin)大模型(xing)熱潮下,不少中(zhong)(zhong)小(xiao)企(qi)業(ye)都在關注行業(ye)大模型(xing)將會如何(he)為自身企(qi)業(ye)真正做到降(jiang)本(ben)增(zeng)效。
雖然數字化轉型理念愈來愈普及,不少中小企業都想搭上“高效”這趟車,但“數據怎么用?”“花費多少成本?”這(zhe)兩大疑慮(lv)把大部分中(zhong)小企(qi)業攔在了車(che)門(men)外。
除此之(zhi)外(wai),雖說行業都在認可“ALL in AI”這一現狀,但不少中小型企業對于AI的理(li)解可能(neng)仍局限性停(ting)留(liu)在人臉識別。
宇視云(yun)智能(neng)產(chan)品部(bu)部(bu)長湯利(li)波告訴(su)CPS中(zhong)(zhong)安網(wang),作(zuo)為直(zhi)接接觸到市場(chang)(chang)動(dong)向(xiang)脈搏的(de)中(zhong)(zhong)小型企業,其完全可以利(li)用數(shu)據針對性(xing)訓(xun)練一些細分業務(wu)場(chang)(chang)景(jing)的(de)算(suan)法。“通過場(chang)(chang)景(jing)化算(suan)法指(zhi)標能(neng)力的(de)提(ti)升,有機(ji)會去提(ti)升解(jie)決(jue)方案(an)的(de)增值(zhi)性(xing),包括服務(wu)收益(yi)的(de)增值(zhi)性(xing)。”
舉(ju)個簡單的(de)(de)例子,在游(you)樂園娛(yu)樂等場所,大部(bu)分人(ren)可(ke)能(neng)認為攝像頭(tou)只是(shi)起到(dao)安全防(fang)控的(de)(de)作用(yong),但假設負(fu)責(ze)這(zhe)個場景業(ye)務(wu)的(de)(de)企業(ye),愿意(yi)讓攝像頭(tou)搭載(zai)上(shang)提前訓(xun)練好的(de)(de)大模(mo)型(xing),訓(xun)練好的(de)(de)大模(mo)型(xing)經過(guo)推理后(hou),將其視頻數據進行自動分割、自動識別、剪(jian)輯美化,游(you)樂園就能(neng)從原有的(de)(de)出(chu)售游(you)客圖片的(de)(de)業(ye)務(wu)升級到(dao)游(you)客專屬vlog,這(zhe)便讓原本只是(shi)躺在存儲里的(de)(de)數據得到(dao)了進一步調動應(ying)用(yong)。
可以(yi)明顯看到,在大模型(xing)趨(qu)勢下(xia),對于中小型(xing)企業(ye)而言,其(qi)如何(he)通過大模型(xing)利用數據達到降本(ben)增效的(de)作用,結果還是開源或(huo)者節流,省下(xia)人力、時(shi)間、精力成本(ben)的(de)同時(shi)對現有業(ye)務進行升級賦(fu)能(neng),將服務收益最大化或(huo)許才是正解。
基于此(ci),對于判斷市(shi)場上任(ren)意(yi)一項新技(ji)術或者新產品(pin)是否值得應用(yong),中(zhong)小型(xing)企業往往更加在意(yi)實際投入成本幾(ji)何。關于成本問題,會(hui)上,宇視的大模型(xing)也給出了階段性答案(an)。
2、幾乎0成本訓練
梧桐CV行業大模型將上線
“我們(men)需要更(geng)多的渠道(dao)能夠有(you)(you)這(zhe)種能力,更(geng)好的和(he)宇視合(he)作(zuo),而(er)不(bu)是只有(you)(you)幾家壟斷的市場。”宇視CPO朱兵說。
具體來說(shuo),宇視的(de)賦能之道是,在訓(xun)練(lian)側上,用戶企(qi)業(ye)可(ke)以(yi)遠程通過互聯網訪問(wen)之后(hou)來訓(xun)練(lian)算(suan)法,宇視會承擔云的(de)租用費用,為(wei)用戶企(qi)業(ye)省去(qu)前期訓(xun)練(lian)需要的(de)成本,企(qi)業(ye)可(ke)以(yi)幾(ji)乎0成本獲(huo)得(de)宇視開通的(de)大(da)模(mo)型訓(xun)練(lian)賬號,在訓(xun)練(lian)過程中,會有宇視專門的(de)技(ji)術(shu)團(tuan)隊進行支持。
在推理側(ce)上(shang),宇視(shi)通過將(jiang)場景化的算法進行剝離,也就是將(jiang)相對小模型的算法部(bu)署到宇視(shi)邊緣端的設備上(shang),一(yi)定程度上(shang)避免合作伙伴為此額(e)外部(bu)署一(yi)個幾(ji)千萬起步的超算機房。
此(ci)外,算(suan)(suan)法拓展在(zai)目(mu)前階段仍屬于(yu)(yu)煙囪式,即使(shi)用戶(hu)需求很(hen)相近,但由(you)于(yu)(yu)對象的(de)不(bu)同還(huan)是需要(yao)重新生成算(suan)(suan)法,容易導致(zhi)投入產出比和客戶(hu)需求之(zhi)間的(de)矛(mao)盾(dun),而預計7月底正(zheng)式上線的(de)“梧(wu)桐CV行(xing)業大模型(xing)”可(ke)以較好解(jie)決這個問(wen)題。
舉個(ge)(ge)例子(zi),假設現在(zai)有60多萬(wan)(wan)個(ge)(ge)體(ti)(ti)(ti)育(yu)(yu)館,300多萬(wan)(wan)套器(qi)材,這60多萬(wan)(wan)個(ge)(ge)體(ti)(ti)(ti)育(yu)(yu)館的(de)器(qi)材放置地點都不(bu)同,此時項目(mu)方(fang)需(xu)要(yao)知道所有館的(de)器(qi)材的(de)使用頻率和大(da)(da)眾愿意使用哪類(lei)健身器(qi)材,這時候如果用小模型(xing)就需(xu)要(yao)采集各(ge)個(ge)(ge)體(ti)(ti)(ti)育(yu)(yu)館的(de)數(shu)(shu)據(ju)進行對比(bi)再針對性地多次訓練(lian),而“梧桐CV行業大(da)(da)模型(xing)”卻能在(zai)比(bi)較小的(de)數(shu)(shu)據(ju)量情(qing)況下(xia),做到泛(fan)化識別和推理,即使器(qi)材對象千差(cha)萬(wan)(wan)別,但省去了二次訓練(lian)、學習的(de)環節。
場景(jing)多(duo)N倍,算法獲得率提升(sheng)80%,算法精準(zhun)度從85%提升(sheng)至95%,讓IT工程(cheng)訓練師訓練算法,更容易解決行業Know-How問(wen)題,入門門檻更低,大模型梧桐的優勢(shi)也由此凸(tu)顯,
目前“梧桐CV行業大模型”已經和第一批合作伙伴完成落地計劃的簽約,率先在體育、教育、交通、零售等領域進行首發落地。
相信在(zai)未(wei)來(lai),大模型(xing)(xing)的“訓練”“推理”兩個關鍵詞優勢將會日益凸(tu)顯,據了解,為(wei)保障大模型(xing)(xing)的順利運行,宇視目(mu)前部署在(zai)云邊端芯片款(kuan)型(xing)(xing)超過(guo)(guo)50款(kuan),支持的算法種類超過(guo)(guo)1000個,模型(xing)(xing)數(shu)過(guo)(guo)萬,產品款(kuan)型(xing)(xing)過(guo)(guo)千。
前期成本宇視承擔,合作伙伴幾乎0成本接入,這么大的支持力度,相信業內人士都會十分好奇,宇視到底靠梧桐大模型怎么實現盈利?
3、瞄準生態價值
力爭高效落地
傳統意義上(shang),做了一(yi)個(ge)軟(ruan)件,投入(ru)100萬(wan),就要力爭賣到200萬(wan),最(zui)后賺100萬(wan),光明(ming)正大(da)的(de)追求利潤是企業繞不開(kai)的(de)話題。
但這次,宇視并沒有(you)打(da)算(suan)使用傳統的賣(mai)軟件直(zhi)接獲利策略,而是通(tong)過(guo)讓(rang)(rang)利給合(he)作伙伴,讓(rang)(rang)合(he)作伙伴通(tong)過(guo)使用“梧桐”得(de)到多個專屬的“行(xing)業(ye)軟件工程師”。“讓(rang)(rang)宇視的渠(qu)道盈利,讓(rang)(rang)他(ta)們有(you)進入一些(xie)新的業(ye)務模式的可能。”朱兵說道。
在這個平權時代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平權時代,最大的競爭力(li)在于(yu)(yu)你的效率,在于(yu)(yu)公司看清楚(chu)自己的定位之后能夠第一時間全力(li)撲上去做(zuo)。”
2012年,宇視捕捉到(dao)人工(gong)智能的(de)發展趨勢(shi),同年便(bian)開(kai)始在深度學(xue)習領域進行(xing)投入,2016年,宇視推(tui)出初代基于DL的(de)AIoT產品(pin),如(ru)今來到(dao)大模(mo)型爆炸階段,宇視又成為第一個推(tui)出“AIoT行(xing)業大模(mo)型”的(de)第一人。
2023年,宇視這次對于“梧桐”大模型的定位到底是什么?
沒錯,就是落地化,工程化。正如微軟(ruan)將GPT-4對接Office、金山將其(qi)大(da)模型產品(pin)“WPS AI”接入WPS,大(da)模型最(zui)終的落地還得(de)是在硬件上(shang)。
那宇視怎么快(kuai)速落地實現工程化?總結為以下幾點:
1、原有的深度學習積累和產品工程化落地可繼承
2、站在通用大模型的肩膀上開發自己的行業大模型
3、通過“剪枝”和“蒸餾”等技術,實現行業大模型的邊緣側部署
4、開放能(neng)力給合(he)作伙伴,同時有專門的培訓和技(ji)術服(fu)務體系保障
也許正如此次宇(yu)(yu)視(shi)(shi)簽(qian)約(yue)種子伙(huo)伴之一的萬店掌(zhang)所言,眾多行(xing)業大模(mo)型中為什(shen)么選擇宇(yu)(yu)視(shi)(shi),其(qi)實(shi)占比很(hen)大一部分原因(yin)是其(qi)本身已經和宇(yu)(yu)視(shi)(shi)有過合作,對宇(yu)(yu)視(shi)(shi)這(zhe)個品牌已經存(cun)在一定(ding)的認知力和認可度,剛(gang)好宇(yu)(yu)視(shi)(shi)在這(zhe)個階段推出了(le)大模(mo)型就相(xiang)當于為合作伙(huo)伴提供(gong)了(le)一條龍服(fu)務,省去(qu)了(le)對其(qi)他(ta)新品牌的學習、切換成本,選擇宇(yu)(yu)視(shi)(shi)會適配度更高。
當然,在這(zhe)個數據量爆炸的時代下(xia),不少企(qi)業(ye)還是(shi)會(hui)十分(fen)在意(yi)保密性,而(er)目前由(you)于大(da)部(bu)分(fen)中小企(qi)業(ye)不具備私(si)有云的部(bu)署能(neng)力,因此愿意(yi)上云的企(qi)業(ye)的數據會(hui)相對集中在公有云上,一旦(dan)拿出來訓練是(shi)否(fou)會(hui)產(chan)生(sheng)泄漏的風險?
“我們前期在接觸(chu)合作伙伴(ban)過(guo)程中,也有客戶有安全(quan)(quan)性(xing)的(de)疑慮(lv),主(zhu)要(yao)疑慮(lv)在原(yuan)有數據是否(fou)外(wai)泄和訓(xun)練(lian)成(cheng)果收(shou)否(fou)會被無償占用兩方面(mian)”湯利波說道。而宇視“梧(wu)桐”也將通過(guo)相關技術進(jin)行分(fen)權(quan)(quan)、分(fen)域(yu),建立(li)完善(shan)的(de)權(quan)(quan)限管理和安全(quan)(quan)管控制度,融合等(deng)方式保(bao)證訓(xun)練(lian)成(cheng)果的(de)安全(quan)(quan)性(xing)和獨享(xiang)性(xing)。
4、大模型戰場已開局
是開始還是結束?
風起于青萍之(zhi)末,浪(lang)成于微瀾(lan)之(zhi)間(jian)。
相對之前(qian)企(qi)業(ye)拼數據(ju)樣本,拼私有(you)的(de)(de)訓(xun)練平(ping)臺,拼技術(shu)架(jia)構(gou)的(de)(de)小模型AI時(shi)代,如(ru)今(jin)隨著(zhu)大(da)模型相繼開(kai)源后(hou)(hou),有(you)基(ji)礎的(de)(de)企(qi)業(ye)大(da)都可(ke)以基(ji)于開(kai)源組件進行自(zi)身大(da)模型的(de)(de)自(zi)研,先(xian)用(yong)通(tong)用(yong)大(da)模型把(ba)原始(shi)的(de)(de)大(da)量(liang)行業(ye)場景的(de)(de)知識數據(ju)清洗一遍(bian),再把(ba)顯著(zhu)目標值給提(ti)取(qu)出(chu)來,去重后(hou)(hou)形成行業(ye)數據(ju)庫,最終(zhong)投喂給通(tong)用(yong)大(da)模型訓(xun)練出(chu)一個行業(ye)大(da)模型。
Open AI用了(le)上萬塊英(ying)偉達(da)GPU喂出了(le)一(yi)個ChatGPT,浪潮掀到中(zhong)國(guo)(guo),國(guo)(guo)內千模(mo)(mo)(mo)大(da)戰已拉開(kai),行業大(da)模(mo)(mo)(mo)型或將(jiang)是未來各個領域都會(hui)去(qu)追尋的模(mo)(mo)(mo)式(shi)。
縱觀安(an)防行業(ye)幾十年的發展,從模(mo)(mo)擬階(jie)段(duan)的爭(zheng)奪攝(she)像(xiang)頭代理(li)權,到(dao)(dao)網(wang)絡(luo)數字階(jie)段(duan)的系統業(ye)務成焦點,再到(dao)(dao)智能化階(jie)段(duan)的ALL in AI,如今已到(dao)(dao)大(da)模(mo)(mo)型(xing)卷(juan)入(ru)階(jie)段(duan),或許正如宇視CEO張鵬國曾(ceng)在深圳安(an)博會舉(ju)辦期(qi)間抒發的經(jing)典語錄所言:“意識到(dao)(dao)這(zhe)是場戰(zhan)爭(zheng)的時候,戰(zhan)爭(zheng)已經(jing)結束了,機會不會等(deng)待(dai)后知(zhi)后覺的傲慢。”
[出處] 思(si)文, 算法訓練幾乎0成本!梧(wu)桐大模型讓首批用戶吃(chi)上“螃蟹”.CPS中(zhong)安網, 2024-06-14