科大訊飛星火大模型:今年超越ChatGPT,明年對標GPT-4
2023-08-17
458
首發百(bai)天(tian)后,星火大(da)模型的三場升級戰
作者/ IT時報記者 孫妍
編輯/ 孫妍
8月15日,正值訊(xun)飛星火認(ren)知大模型首(shou)發100天,科大訊(xun)飛發布(bu)訊(xun)飛星火認(ren)知大模型V2.0,突破(po)代碼和多模態兩大技術能力,一口(kou)氣推出(chu)眾多應用,并聯合華為發布(bu)訊(xun)飛星火一體機(ji)。
“今(jin)年(nian)(nian)10月24日,訊(xun)(xun)飛(fei)星火將全面對(dui)(dui)標(biao)ChatGPT,中文超(chao)越(yue)、英文相當,明年(nian)(nian)對(dui)(dui)標(biao)GPT-4。”科大訊(xun)(xun)飛(fei)董事長劉慶峰自信地預告訊(xun)(xun)飛(fei)星火大模型(xing)的未來目標(biao)。
8月15日也是生成式(shi)(shi)人工(gong)智能的重要節點,由國家網信辦等七部委發布的《生成式(shi)(shi)人工(gong)智能服務管理暫行(xing)辦法》正式(shi)(shi)施行(xing)。這標志著(zhu)中國生成式(shi)(shi)人工(gong)智能邁入了發展(zhan)與安全并重、創(chuang)新和依法治理結合的道(dao)路(lu)。
“百模大(da)(da)戰”正在解放(fang)生產力(li)、釋(shi)放(fang)想(xiang)象力(li),大(da)(da)力(li)出奇跡之下,大(da)(da)模型這一算(suan)力(li)“吞(tun)噬者”導致(zhi)高(gao)性能(neng)GPU遭瘋搶,而(er)算(suan)力(li)“壟(long)斷者”的凸顯,讓中國人工智能(neng)企業達(da)成(cheng)共識(shi),實現算(suan)力(li)國產化解決(jue)卡脖(bo)子困(kun)境。
百天(tian)升級戰
今(jin)年(nian)超越(yue)ChatGPT
距(ju)離首發100天,訊(xun)飛星(xing)火(huo)認知大模(mo)(mo)型V2.0如期而至,重點在代碼和多模(mo)(mo)態(tai)上實(shi)現(xian)技術突(tu)破,并(bing)將這(zhe)兩(liang)大能力落地(di)到應用和產(chan)品:會生成代碼或改(gai)Bug的智(zhi)(zhi)能編程(cheng)助手iFlyCode1.0,視頻創作能力升級(ji)的訊(xun)飛智(zhi)(zhi)作2.0,幫(bang)助教(jiao)師一(yi)鍵生成課件的星(xing)火(huo)教(jiao)師助手,學生口語(yu)(yu)練(lian)習“搭子”星(xing)火(huo)語(yu)(yu)伴2.0,新增(zeng)AI編程(cheng)空(kong)間和AI創意(yi)畫板(ban)的訊(xun)飛AI學習機。
在科大訊飛的計劃中,訊飛星火代碼各維度的能力將在今年10月24日超越ChatGPT,明年上半年對標GPT-4。劉慶峰介紹,根據OpenAI構建的代碼能力公開測試集HumanEval,星火V1.5 Python語言的效果只有41分,V2.0已經到了61分,接近ChatGPT。根據認知智能國家重點實驗室構建的代碼的真實的場景使用的測試集,訊飛(fei)星(xing)火(huo)代碼生成和補齊維(wei)度上(shang)已經超過了ChatGPT。
“代碼能力(li)(li)是(shi)(shi)大(da)模型聰(cong)明(ming)程度(du)的(de)重要(yao)標志(zhi)。”在劉慶(qing)峰(feng)看來,代碼是(shi)(shi)大(da)模型硬(ying)碰硬(ying)的(de)實力(li)(li),可以大(da)大(da)降(jiang)低數字經濟的(de)創業門檻和成本,不用人人都是(shi)(shi)編程高手,只(zhi)要(yao)發揮想象力(li)(li)。
用(yong)(yong)Python畫紅色(se)的(de)(de)心形線,畫出馬鞍面方(fang)程三維立體圖并設置(zhi)漸變色(se),用(yong)(yong)代碼(ma)生成(cheng)(cheng)貪吃蛇(she)小(xiao)游(you)戲,用(yong)(yong)小(xiao)視頻生成(cheng)(cheng)gif表情包……在現場演示(shi)中,訊飛星火2.0完(wan)成(cheng)(cheng)了所(suo)有初級考驗,科大訊飛研究(jiu)院院長(chang)劉聰幾分(fen)鐘就完(wan)成(cheng)(cheng)了兩個手指捏(nie)合就能寫(xie)(xie)字(zi)的(de)(de)“凌空(kong)手寫(xie)(xie)”功能開發,全程沒寫(xie)(xie)一行代碼(ma),全部交給(gei)智(zhi)能編程助手iFlyCode1.0,以往有經驗的(de)(de)程序(xu)員(yuan),也(ye)要半天到一天才能完(wan)成(cheng)(cheng)。
為了(le)降低(di)“小白”寫代碼的門檻,訊飛星火2.0在代碼生(sheng)成、代碼補(bu)齊、代碼糾錯(cuo)、代碼解釋、單(dan)元(yuan)測試生(sheng)成這5個維(wei)度進行升級。
現在,“零編程基礎”的老師也能用其代碼能力開發學校管理數字化應用,數字教育基座這一行業應用已在上海、湖北等地的學校試點,教育應用(yong)開發周期從(cong)17天縮短到1天,投(tou)資成本(ben)從(cong)15萬(wan)元降(jiang)低至1.5萬(wan)元。
多模(mo)態長期戰
每個(ge)人的AI助手
拍了(le)美(mei)圖想(xiang)“秒速”發一個圖文并茂的朋友圈?張嘴就想(xiang)畫出(chu)腦海里突發奇想(xiang)的圖畫?只要輸入一段文字,一鍵就想(xiang)生成聲情并茂的短視(shi)頻(pin)?
在發布會現(xian)場,訊飛星火2.0在現(xian)場演示了(le)它(ta)在圖(tu)像描(miao)述、圖(tu)像問答、識圖(tu)創作(zuo)、文(wen)圖(tu)生成、虛擬人合(he)成等(deng)方(fang)面的(de)能力。
“創作一篇立(li)秋抒情散文,并用一個短發(fa)民國風的(de)女生形象生成視(shi)頻”,劉聰話音剛落,一個身穿民國風格(ge)的(de)女主播(bo)站在(zai)不斷切(qie)換的(de)秋天(tian)美景前娓娓道來。
AI視頻生(sheng)(sheng)成(cheng)對品牌宣傳、新聞媒(mei)體等行業來說,是能帶來巨大(da)變(bian)革的(de)生(sheng)(sheng)產力(li)工(gong)具,但目前大(da)模(mo)(mo)型(xing)(xing)生(sheng)(sheng)成(cheng)的(de)視頻,模(mo)(mo)板較為(wei)單一,比(bi)起(qi)其它大(da)模(mo)(mo)型(xing)(xing)廠商,科大(da)訊飛的(de)優勢主要還是文轉(zhuan)音、中(zhong)英互(hu)譯等。
教(jiao)(jiao)育(yu)是(shi)訊飛(fei)星火最先切入的(de)行業,星火教(jiao)(jiao)師(shi)(shi)助(zhu)手(shou)可以幫老師(shi)(shi)一鍵(jian)生成教(jiao)(jiao)學課件,至今已服(fu)務(wu)全國超(chao)過2.5萬(wan)所學校、超(chao)1200萬(wan)名師(shi)(shi)生;星火語伴可以成為學生、商務(wu)老師(shi)(shi)的(de)口(kou)(kou)語陪練(lian)老師(shi)(shi),2.0版本上線(xian)CET、雅思(si)、托福(fu)等口(kou)(kou)語模考,用(yong)AI實現(xian)如真人般的(de)陪練(lian);訊飛(fei)AI學習機(ji)新增AI編(bian)程(cheng)(cheng)空間和AI創(chuang)意畫板,這也是(shi)學習機(ji)行業首款AI一對一智能(neng)編(bian)程(cheng)(cheng)助(zhu)手(shou);AI口(kou)(kou)語功能(neng)已上線(xian)訊飛(fei)翻譯機(ji),支持73個不同場景。
由此可見,科大(da)訊(xun)(xun)飛在(zai)自(zi)有終端和行業(ye)市場多年的深耕,是訊(xun)(xun)飛星(xing)火認(ren)知大(da)模(mo)型能真正落地的基礎,下(xia)一步,它還(huan)將切(qie)入汽車(che)行業(ye),首款搭載訊(xun)(xun)飛星(xing)火的奇瑞汽車(che)也將發(fa)布(bu)。
“多(duo)模(mo)(mo)態是通用人工(gong)智(zhi)(zhi)能(neng)的必(bi)經之路(lu),也是科(ke)大(da)(da)訊飛(fei)既定(ding)的人工(gong)智(zhi)(zhi)能(neng)技(ji)術(shu)長期戰略(lve)。”劉慶(qing)峰表示(shi),2022年初,ChatGPT還(huan)未引爆之時,訊飛(fei)就已(yi)發布(bu)具(ju)備多(duo)模(mo)(mo)感知、深度(du)理解、多(duo)維表達、運動智(zhi)(zhi)能(neng)等能(neng)力的“訊飛(fei)超(chao)腦2030計(ji)劃”,而科(ke)大(da)(da)訊飛(fei)的長期戰略(lve)是打造每個(ge)人的AI助手。
安全可控戰
國(guo)產大模(mo)型算力底座
當天,訊飛星火和昇騰AI聯合推(tui)出星火一體(ti)機,其底層算(suan)力、AI框(kuang)架、訓練(lian)算(suan)法、推(tui)理能力、應(ying)用成效等全棧(zhan)AI能力“開箱即用”,每一家企業或機構都能在這一國產大模(mo)型底座上構建(jian)自家的(de)專屬大模(mo)型。
今年7月6日的世界人工智能大會上,訊飛和華為就已官宣,正在打造中國自主創新的通用智能新底座。昇騰AI是國內唯一一個完成千億參數大模型訓練并商用的系統,已有一半的國產大模型是由它的算力驅動,華為昇(sheng)騰計算業務總裁張迪煊表示,昇(sheng)騰只做好(hao)算力,不做大模型。
星火一體機由(you)華為保障算(suan)力,由(you)訊飛保障內(nei)容,給自主(zhu)可控的專屬大模(mo)型(xing)上了(le)“雙保險”。
污語料和幻覺(jue)問題是大(da)(da)模型(xing)的(de)兩大(da)(da)安全(quan)挑戰,基于訊飛(fei)星火認知(zhi)(zhi)大(da)(da)模型(xing),星火一(yi)體機形成了內容安全(quan)機制,具(ju)備了清洗互(hu)聯網語料的(de)能力,語料經過語句判(pan)(pan)別(bie)器、質量(liang)判(pan)(pan)別(bie)器、隱私判(pan)(pan)別(bie)器、安全(quan)判(pan)(pan)別(bie)器等關卡,就能被清洗成高質量(liang)文本“喂”給大(da)(da)模型(xing);針對(dui)大(da)(da)模型(xing)一(yi)本正經胡說八道(dao)的(de)“幻覺(jue)問題”,科大(da)(da)訊飛(fei)構建專業知(zhi)(zhi)識庫,以類(lei)搜索插件技術(shu)實現知(zhi)(zhi)識獲(huo)取,大(da)(da)模型(xing)理解后(hou)概(gai)括摘要輸出答案。
星火一(yi)體機是(shi)國產軟硬件一(yi)體的專屬大(da)模型(xing)解決方案,企業可以在(zai)這一(yi)底座上(shang)定制問答系統(tong)、對話(hua)生成、知識圖譜構建、智能推(tui)薦(jian)等多個應用,大(da)大(da)降低了企業定制專屬大(da)模型(xing)的門(men)檻和成本。科大(da)訊飛(fei)在(zai)政務、電力、教育、醫療(liao)等行業深耕多年(nian),落地經驗(yan)濃(nong)縮成星火一(yi)體機內的10多個場景包,涵蓋(gai)辦公、代碼、運維、客服、營(ying)銷(xiao)、采購等。
訊飛星火認知大模型的定位是“國家隊”大模型。“我們正在(zai)跟華為打造面向超大規模大模型的(de)訓練國產(chan)算力的(de)集(ji)群,形成集(ji)群化優勢(shi)。”劉(liu)慶峰表示,要(yao)讓每個企業都有專(zhuan)屬大(da)模型(xing),安(an)全(quan)(quan)可控、場景驅動、專(zhuan)屬模型(xing)是(shi)關鍵三要(yao)素,而實現(xian)大(da)模型(xing)的安(an)全(quan)(quan)可控,要(yao)解(jie)決算力安(an)全(quan)(quan)和(he)內容安(an)全(quan)(quan)兩大(da)難題。
排版/ 季嘉穎
圖片(pian)/ 科大訊(xun)飛
來(lai)源(yuan)/《IT時報》公眾號vittimes