“大模型不應(yīng)該只是拿來(lái)聊天寫(xiě)詩(shī)作畫(huà)的玩具,供應(yīng)鏈產(chǎn)業(yè)鏈上的大模型更有價(jià)值。模型越大,才越有可能產(chǎn)生產(chǎn)業(yè)端的智能涌現(xiàn)?!?/p>

7月13日,在2023京東全球科技探索者大會(huì)暨京東云峰會(huì)上,京東集團(tuán)技術(shù)委員會(huì)主席、云事業(yè)部總裁曹鵬宣布旗下千億級(jí)大模型“言犀”發(fā)布,也意味著京東正式加入大模型的廝殺戰(zhàn)局。

對(duì)于言犀的發(fā)布,京東已經(jīng)“預(yù)熱”多時(shí)。對(duì)此,京東CEO許冉坦言:“京東不會(huì)把一盤(pán)色香味不俱全的菜端上桌。”

從京東提供的言犀相關(guān)資料來(lái)看,其定位是立足于產(chǎn)業(yè)應(yīng)用的通用大模型。京東探索研究院院長(zhǎng)、科技智能服務(wù)與產(chǎn)品部總裁何曉冬介紹,京東的大模型是用70%通用域數(shù)據(jù)和30%京東特有的產(chǎn)業(yè)數(shù)據(jù)相結(jié)合去做的訓(xùn)練,既擁有大模型的“常識(shí)”,并擁有產(chǎn)業(yè)模型的“專(zhuān)業(yè)”。某種意義上,既有了“通識(shí)教育”,又讀了四年專(zhuān)業(yè)性的本科教育。

在發(fā)布同時(shí),京東還推出支撐大模型研發(fā)的基礎(chǔ)設(shè)施——言犀AI開(kāi)發(fā)計(jì)算平臺(tái)、向量數(shù)據(jù)庫(kù)、混合多云操作系統(tǒng)云艦、高性能存儲(chǔ)平臺(tái)云海、軟硬一體虛擬化引擎京剛等核心產(chǎn)品。

此前,網(wǎng)易伏羲生成式人工智能相關(guān)負(fù)責(zé)人趙增曾向澎湃新聞?dòng)浾呓榻B,目前企業(yè)入局大模型主要分為兩種范式:第一種是著力于通用能力的基礎(chǔ)大模型,普遍成本較高且十分昂貴,另一種則是基于基礎(chǔ)大模型的行業(yè)垂直大模型,大量創(chuàng)業(yè)公司以此入局。

盡管京東此次發(fā)布的是垂直大模型,但據(jù)接近京東人士透露,其投入成本也相當(dāng)高昂。何曉冬曾向記者坦言,目前要做好垂直行業(yè)模型的訓(xùn)練成本和難度并不低,因?yàn)樾袠I(yè)模型是建立在通用模型基礎(chǔ)上的。如果只用行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練,會(huì)缺乏常識(shí),因此也需要通用模型的訓(xùn)練。

澎湃新聞?dòng)浾哂^察到,在今年的世界人工智能大會(huì)上,國(guó)內(nèi)外總計(jì)30余款大模型集體亮相,其中既有來(lái)自企業(yè)巨頭百度、阿里等推出的通用大模型,也有來(lái)自清華、復(fù)旦等學(xué)院派大模型,還有包括出門(mén)問(wèn)問(wèn)、第四范式等創(chuàng)業(yè)公司入局,競(jìng)爭(zhēng)極為激烈,但各家公司推出的大模型似乎大同小異,并未有顯著差異。

從大模型的特點(diǎn)來(lái)分析,此前何曉冬曾表示,在大語(yǔ)言模型的研發(fā)上,京東更注重的是對(duì)話(huà)方向,也在積極推進(jìn)多模態(tài)模型的研發(fā)。對(duì)于外界關(guān)注的“百模大戰(zhàn)”“群模亂舞”,他認(rèn)為,目前處于大模型“百花爭(zhēng)艷”的狀態(tài),站在這個(gè)時(shí)間點(diǎn),應(yīng)該思考的不是技術(shù)追趕,而是產(chǎn)業(yè)突破,“相信國(guó)內(nèi)的大模型在中文方向?qū)⒑芸斐絿?guó)外的對(duì)話(huà)產(chǎn)品?!?/p>

何曉冬透露,從數(shù)據(jù)來(lái)看,目前言犀大模型的效果在實(shí)體屬性抽取準(zhǔn)確率達(dá)到了96%、生成式多輪對(duì)話(huà)ROUGE-L達(dá)27%,多輪問(wèn)答知識(shí)檢索率74%。

現(xiàn)場(chǎng),京東還宣布了未來(lái)大模型“三步走”規(guī)劃:第一,在今年7月份,推出京東言犀大模型和言犀AI開(kāi)發(fā)計(jì)算平臺(tái)。第二,在今年下半年,將大模型應(yīng)用于京東內(nèi)部核心業(yè)務(wù)并形成最佳實(shí)踐,針對(duì)一些重點(diǎn)場(chǎng)景的標(biāo)桿客戶(hù)進(jìn)行對(duì)外服務(wù)。第三,在2024年上半年,將全面開(kāi)放大模型能力。

對(duì)于言犀的發(fā)布,京東此前多次作出相關(guān)預(yù)熱。此前何曉冬介紹,京東云入局AI研究已接近五年,2020年京東云成立“言犀”人工智能應(yīng)用平臺(tái),探索語(yǔ)音技術(shù)、智能客服、數(shù)字人等。

標(biāo)題:京東發(fā)布千億級(jí)大模型“言犀”:下半年應(yīng)用于內(nèi)部核心業(yè)務(wù),明年全面開(kāi)放

地址:http://www.17168cn.cn/gzdm/30313.html