在過去的兩年中,以大模型為代表的通用人工智能開啟了一個全新的時代。
從“百模大戰(zhàn)”到“千模競技”,各種文生文、文生圖、圖生視頻、文生視頻甚至多模態(tài)大模型層出不窮。
在經(jīng)歷了最初的繁榮生長后,行業(yè)發(fā)展逐漸進(jìn)入理性期。落地應(yīng)用,成為企業(yè)最基本的目標(biāo)。
10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發(fā)者節(jié)在合肥開幕。
從拼性能到拼賦能。在尋找產(chǎn)業(yè)化發(fā)展的道路上,整個行業(yè)吹響了應(yīng)用的“沖鋒號”。
這也是今年的訊飛1024開發(fā)者節(jié)帶給人們的最突出“觀感”。
在這場盛會上,諸多基于AI大模型的應(yīng)用產(chǎn)品得以發(fā)布展示,顯示出星火大模型在教育、醫(yī)療、能源、汽車、工業(yè)、金融、法律等領(lǐng)域不斷拓展的潛力。
而從普通市民角度來看,一場城市的“AI嘉年華”,又讓人們直觀感受到大模型正切入人們生活的方方面面,迎來規(guī)模化應(yīng)用落地的新時代。
以技術(shù)創(chuàng)新為底座,解放生產(chǎn)力,釋放想象力。
大模型將如何收獲“產(chǎn)業(yè)果實(shí)”,賦能千行百業(yè)?
“超擬人”
在大會開幕式上,科大訊飛董事長劉慶峰首先公布了訊飛星火大模型應(yīng)用成績單,并正式發(fā)布訊飛星火4.0 Turbo。
與此同時,國產(chǎn)超大規(guī)模智算平臺“飛星二號”正式啟動。
大模型技術(shù)底座能力,是產(chǎn)業(yè)化應(yīng)用最堅(jiān)實(shí)的底氣。但另一個層面,大模型狂飆2年,已經(jīng)過了不斷比拼技術(shù)數(shù)據(jù)的階段,更多的是要從需求出發(fā)去做技術(shù)提升。
“萬物智聯(lián)”是未來社會的典型特征。劉慶峰說,在萬物智能時代,不僅是語音,整個人機(jī)交互領(lǐng)域都將上一個全新的臺階。
科大訊飛定義了萬物智能時代的人機(jī)交互(AIUI)標(biāo)準(zhǔn),并且通過了國際組織的認(rèn)定,已經(jīng)在去年5月正式發(fā)布了國際標(biāo)準(zhǔn),包括遠(yuǎn)場高噪、全雙工、多語種多方言等多個方面,此次1024開發(fā)者節(jié),標(biāo)準(zhǔn)再次升級,新增了多模態(tài)、超擬人、個性化。
多模態(tài)是指多種視覺、聽覺等感官信息在一起協(xié)同作用的狀態(tài)。開幕式上,科大訊飛超擬人數(shù)字人首次亮相。多模態(tài)的交互從超擬人的語音變成超擬人的數(shù)字人,實(shí)現(xiàn)語音、視頻、圖文的全部聯(lián)動的多模態(tài)交互。
多模態(tài)視覺能力加持下的人機(jī)交互有多驚喜?
超擬人數(shù)字人不僅可以“角色扮演”,還能夠模仿孫悟空、蠟筆小新、小豬佩奇等多種角色,音色、語氣甚至人設(shè)都模仿得惟妙惟肖。
“原來是給一張照片就可以有嘴型;今天,我們把嘴型、表情、動作全部貫穿起來,所有的表情動作整體化地用我們的大模型技術(shù)自動生成,而且實(shí)現(xiàn)了表情動作的語義貫穿,統(tǒng)一文本、語音和表情,實(shí)現(xiàn)跨模態(tài)的語義的一致性?!眲c峰解釋道。
從語音交互拓展到音視頻流的實(shí)時多模態(tài)互動,情境感知更全面。不光有語音,場景、文字、物體、姿態(tài)、著裝都可以看到,任務(wù)理解就會更精準(zhǔn);因?yàn)橛姓Z音、有手勢、有行為,還有情緒,就可以使游戲、學(xué)習(xí)、購物、美食、知識問答、繪本伴讀更有趣;在具身智能機(jī)器人以及汽車等新終端越來越多的未來,可以實(shí)現(xiàn)全新的人機(jī)交互的升級,做很多原來做不成的事。
值得一提的是,科大訊飛還首次發(fā)布星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個語種。
“武裝”6000萬輛汽車
“今天,大模型已經(jīng)進(jìn)入到關(guān)鍵應(yīng)用落地、更復(fù)雜的深水區(qū)。”在開幕式上,劉慶峰感嘆。
大模型發(fā)展到今天,靠繼續(xù)提升通用大模型性能,能帶來的行業(yè)進(jìn)步十分有限。要想摘到“產(chǎn)業(yè)果實(shí)”,必須扎根產(chǎn)業(yè)場景。
汽車是大模型應(yīng)用探索的絕佳載體。新能源汽車產(chǎn)業(yè)是安徽近年來發(fā)展最受矚目的產(chǎn)業(yè)。AI上車不僅將提升駕駛的便捷性與智能性,更可重新定義人與車的關(guān)系,開啟汽車智能化的新時代。
大會開幕式上,奇瑞控股集團(tuán)有限公司黨委書記董事長、總經(jīng)理尹同躍也來到現(xiàn)場。奇瑞、江淮汽車等車企也都攜多款明星產(chǎn)品亮相展會。這些產(chǎn)品均應(yīng)用了科大訊飛的核心技術(shù)。
“目前,我們智能語音交互的裝配量已經(jīng)超過了6000萬輛車。去年,中國汽車出海500多萬輛,多語種技術(shù)幾乎都由科大訊飛提供?!眲c峰表示。
“用人工智能技術(shù)解決社會剛需”,是科大訊飛一直以來的出發(fā)點(diǎn)之一。此次1024科大訊飛全球開發(fā)者節(jié)上,科大訊飛面向教育、醫(yī)療、司法、政務(wù)服務(wù)、企業(yè)辦公等多個行業(yè)場景發(fā)布了最新的產(chǎn)品應(yīng)用。
在教育行業(yè),首次發(fā)布了基于“問題鏈”的高中數(shù)學(xué)智能教師系統(tǒng)。在醫(yī)療行業(yè),發(fā)布訊飛星火醫(yī)療大模型2.0和基于訊飛星火醫(yī)學(xué)影像大模型打造的智能醫(yī)學(xué)影像助手。在政務(wù)服務(wù)場景,政務(wù)大模型持續(xù)迭代,全面覆蓋4500多種標(biāo)準(zhǔn)化事項(xiàng)和60多種材料。
中國工業(yè)和信息化部賽迪研究院數(shù)據(jù)顯示,2023年,中國生成式人工智能的企業(yè)采用率已達(dá)15%,市場規(guī)模約為14.4萬億元。截至2024年10月,科大訊飛已與各頭部企業(yè)共建20多個行業(yè)大模型,覆蓋300多個應(yīng)用場景,均為第一。今年1月至9月,大模型市場中標(biāo)金額和中標(biāo)數(shù),科大訊飛也均是第一。
“大模型+大算力+大數(shù)據(jù)+大場景”
在安徽,一個以大模型為根基的產(chǎn)業(yè)森林正在生長。
十多年前,安徽依托中國聲谷打造了合肥市智能語音集群,成為目前安徽唯一國家先進(jìn)制造業(yè)集群。
如今,在新一輪科技革命和產(chǎn)業(yè)變革下,安徽正搶抓通用人工智能發(fā)展戰(zhàn)略機(jī)遇,致力打造產(chǎn)業(yè)新高地。
以“聲谷、視谷、傳感谷”等品牌為引領(lǐng),2023年,安徽全省559家納統(tǒng)人工智能規(guī)上企業(yè)實(shí)現(xiàn)營收1327.7億元。今年1月至6月,全省783家納統(tǒng)人工智能規(guī)上企業(yè)營業(yè)收入同比增長9.1%,高于全省新興產(chǎn)業(yè)平均水平0.6個百分點(diǎn);人工智能產(chǎn)業(yè)投資同比增長30.7%,高19.7個百分點(diǎn)。
賽迪顧問報告顯示,2023年全國31個?。ㄗ灾螀^(qū)、直轄市)人工智能產(chǎn)業(yè)發(fā)展評價中,安徽排名第6位,其中產(chǎn)業(yè)未來潛力、企業(yè)成長潛力分別居第1位、第2位。
只有生態(tài)的繁榮,才有人工智能的大未來。
安徽省工信廳相關(guān)負(fù)責(zé)人表示,世界聲博會暨科大訊飛全球1024開發(fā)者節(jié)亦是推動安徽省智能語音及人工智能產(chǎn)業(yè)發(fā)展的重要平臺,對于安徽構(gòu)建“大模型+大算力+大數(shù)據(jù)+大場景”的產(chǎn)業(yè)發(fā)展格局具有重要促進(jìn)作用。
本屆聲博會系列活動中,還包括了2024科大訊飛AI開發(fā)者大賽。共有來自14個國家、348座城市的35268支團(tuán)隊(duì)參賽??拼笥嶏w聯(lián)合30所科研院校、44家企業(yè)與機(jī)構(gòu)共創(chuàng)賽題,最終評選出十佳團(tuán)隊(duì)。
這些團(tuán)隊(duì)都將成為安徽乃至全國人工智能產(chǎn)業(yè)不斷生發(fā)的“種子”。
科大訊飛將牽頭成立AI基金,用5億元創(chuàng)業(yè)基金推動開發(fā)者創(chuàng)業(yè),加速前沿技術(shù)產(chǎn)業(yè)化進(jìn)程,并與地方政府聯(lián)合為AI創(chuàng)業(yè)團(tuán)隊(duì)提供產(chǎn)業(yè)落地支撐。
今年9月,作為安徽省重點(diǎn)打造的集科研、教育、產(chǎn)業(yè)化于一體的AI產(chǎn)業(yè)集聚區(qū)——訊飛小鎮(zhèn),正式投入使用,為安徽人工智能科技創(chuàng)新和產(chǎn)業(yè)發(fā)展提供了重要載體。
發(fā)布會上,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營有限公司三方聯(lián)合打造的國產(chǎn)超大規(guī)模智算平臺“飛星二號”正式啟動。
科大訊飛表示,將開放全場景資源,進(jìn)行線上線下渠道和資源共享,讓更多開發(fā)者在拓展市場上取得更大成功。
一個頂天立地、自主可控、通專結(jié)合、端云聯(lián)動、軟硬一體的人工智能發(fā)展生態(tài)正在安徽不斷匯聚。
記者 豐 靜 通訊員 汪日貴
責(zé)任編輯:王振華