0分!數(shù)字人直播挑戰(zhàn)上海高考英語作文“翻
金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào)
考完語文考英語,但這一次,AI數(shù)字人卻“大翻車”。
后腳AI數(shù)字人就又雙叒叕要去開直播挑戰(zhàn)了。
然鵝……專家現(xiàn)場(chǎng)給出的分?jǐn)?shù),簡(jiǎn)直令人大跌眼鏡——0分!!!
直播間的彈幕瞬間“炸”了,畫風(fēng)是這樣的:
好奇的友友們就要問了,之前高考語文作文都能hold住的AI數(shù)字人,為啥英語作文就搞不定呢?
其實(shí),這只是AI數(shù)字人在直播過程中的一個(gè)小插曲。
是TA在看了上海高考英語卷子之后,根據(jù)題目在作文中畫了張插畫。
因?yàn)閷懽鬟^程中若是出現(xiàn)插畫,就會(huì)被認(rèn)為做了標(biāo)記,固然得分為0。
那言歸正傳,AI數(shù)字人寫出來的英語作文內(nèi)容本身,結(jié)果又如何呢?
曾多次擔(dān)任上海地區(qū)高考英語閱卷組組長(zhǎng)梅德明教授給出的結(jié)論的是:
整體來看達(dá)到了寫作表意的目的,是一篇高分作文。
已經(jīng)達(dá)到了普通高中畢業(yè)生英語寫作優(yōu)秀水平。
不僅如此,這個(gè)AI數(shù)字人是在10秒鐘時(shí)間完成了40篇!
還在現(xiàn)場(chǎng)一口氣寫了韓語、法語等多個(gè)語種的作文。
基于此,甚至北京外國(guó)語大學(xué)教授王馥芳都提了更高的期望——希望去挑戰(zhàn)一下專八。
而這個(gè)AI數(shù)字人的“廬山真面目”,正是來自百度的度曉曉。
上個(gè)月因?yàn)樘魬?zhàn)高考語文全國(guó)卷的作文還上過熱搜,引來不少網(wǎng)友的圍觀。
接下來,讓我們一起看看度曉曉在這次挑戰(zhàn)中的具體表現(xiàn)如何。
數(shù)字人寫的上海高考英語作文
先來看下今年上海英語高考作文的題目:
學(xué)校要舉辦一個(gè)走進(jìn)歷史的活動(dòng),有三種活動(dòng)的方式:第一種是制作短視頻;第二種是拜訪老戰(zhàn)士;第三種是歷史舞臺(tái)劇。
選擇你推薦的方式寫信給學(xué)校,信的內(nèi)容包括你的選擇和理由。
梅德明教授對(duì)題目點(diǎn)評(píng)道,一定要緊扣“走進(jìn)歷史”的主題,以及形式上是一封信,在字?jǐn)?shù)方面也要控制在150字左右。
并且還需要做到內(nèi)容詳略得當(dāng)、層次分明,“難度系數(shù)對(duì)比中文寫作更大”。
度曉曉在短暫的思考之后,便拿出了40篇中的一篇做了展示:
不難看出,從作文內(nèi)容結(jié)構(gòu)上是較為完整的,并且像“Most ”、“”等詞匯的應(yīng)用,也讓邏輯變得非常清晰。
正如梅教授點(diǎn)評(píng)的那樣:
作文內(nèi)容完整,重點(diǎn)突出,行文流暢,能夠使用高頻詞匯和復(fù)雜句式。
并且梅教授還強(qiáng)調(diào),如此點(diǎn)評(píng),不是因?yàn)樽魑氖浅鲎詳?shù)字人之手,而是把它看做是正常考生的答卷來看待的。
但著實(shí)可惜的是,度曉曉還是需要更了解考試規(guī)則,不應(yīng)生成那張插圖。
不過有一說一,度曉曉能拿下英語作文高分,也算是在情理之中。
因?yàn)樵谏蟼€(gè)月挑戰(zhàn)題為《本手、妙手、俗手》語文高考作文時(shí),她便已經(jīng)展露出鋒芒。
當(dāng)時(shí)度曉曉平均1秒鐘所生成的作文,讓北京語文專家打出48分(滿分60),并被點(diǎn)評(píng)為:
作文緊扣主題、立意明確,結(jié)構(gòu)完整、語言流暢,而且還善于引經(jīng)據(jù)典、使用修辭手法。
據(jù)了解,這樣的成績(jī)已經(jīng)是超過將近75%的考生了。
更是讓網(wǎng)友發(fā)出這樣的感慨:
那么緊接著需要回答的一個(gè)問題便是:
為什么數(shù)字人能屢屢考高分?
正所謂臺(tái)上一分鐘,臺(tái)下十年功。
度曉曉背后的這一套“功夫”,正是得益于百度文心大模型的能力。
文心大模型一個(gè)非常突出的標(biāo)簽和特點(diǎn),便是“知識(shí)增強(qiáng)”。
簡(jiǎn)單來說,它是一個(gè)能從大規(guī)模知識(shí)和海量數(shù)據(jù)中進(jìn)行融合學(xué)習(xí)的大模型,并且具備效率高、效果好,以及通用性強(qiáng)等特點(diǎn)。
是有一種“讀破萬卷書”后“無師自通”的味道了。
若是把文心大模型扒開來看,可以明顯看到它可以分為三大類,分別是“基礎(chǔ)通用大模型”、“任務(wù)大模型”和“行業(yè)大模型”。
這三類大模型之下,還會(huì)有更多細(xì)致的分支。
而此次度曉曉完勝上海高考英語作文,所依靠的大模型主要包括兩個(gè)。
首先是文心最新推出的 3.0 Zeus這個(gè)千億級(jí)的大模型。
它是一個(gè)任務(wù)知識(shí)增強(qiáng)的大模型,除了可以對(duì)無標(biāo)注數(shù)據(jù)和知識(shí)圖譜的學(xué)習(xí)之外,還可以通過持續(xù)學(xué)習(xí),對(duì)百余種不同形式的任務(wù)數(shù)據(jù)學(xué)習(xí)。
在原理方面, 3.0 Zeus在學(xué)習(xí)過程中主要使用的統(tǒng)一范式的多任務(wù)學(xué)習(xí)。
這種方法便可以輕松對(duì)數(shù)據(jù)中不同粒度的語義信息進(jìn)行建模。
除此之外, 3.0 Zeus層次化提示()學(xué)習(xí)技術(shù),通過層次化的Text 庫(kù)將百余種不同的任務(wù)統(tǒng)一組織成自然語言的形式,和海量無監(jiān)督文本以及百度知識(shí)圖譜聯(lián)合學(xué)習(xí)。
而且還引入了層次化的Soft ,如此一來便可以對(duì)不同任務(wù)之間的共性與特性進(jìn)行建模。
也正是基于這樣的能力,度曉曉便可以先去精準(zhǔn)地理解英語作文的題目,然后根據(jù)體裁要求,構(gòu)思和組織材料,完成英語作文的輸出。
與此同時(shí),還可以做到結(jié)構(gòu)緊湊、清晰地闡述自己的觀點(diǎn)。
而度曉曉背后的第二個(gè)大模型,便是多語言模型-M。
這是一種可以理解超過100多種語言的多語言模型。
據(jù)了解,-M構(gòu)建了大小為25萬的多語言詞表,約1.5萬億字符。
它的學(xué)習(xí)過程可以大致分為兩個(gè)階段:
第一階段:從少量的雙語語料中學(xué)習(xí)跨語言理解能力,使模型學(xué)到初步的語言對(duì)齊關(guān)系;
第二階段:使用回譯的思想,通過大量的單語語料學(xué)習(xí),增強(qiáng)模型的跨語言理解能力。
這也就是度曉曉能夠在完成英語作文的同時(shí),還可以用韓語和法語等多個(gè)語言去寫作的原因了。
……
那么在看完度曉曉挑戰(zhàn)上海高考英語作文和其背后的能力之后,還有一個(gè)問題值得探討:
這樣的數(shù)字人,意味著什么?
首先,在內(nèi)容生產(chǎn)的方式上,像度曉曉這種數(shù)字人的能力加持之下,正在向一種新的趨勢(shì)發(fā)展——AIGC。
這是繼UGC(用戶生產(chǎn)內(nèi)容)、PGC(專業(yè)生產(chǎn)內(nèi)容)和OGC(職業(yè)生產(chǎn)內(nèi)容)等內(nèi)容生產(chǎn)方式之后的“新生代”。
而AIGC,顧名思義,就是通過AI技術(shù)來生產(chǎn)內(nèi)容。
至于這種內(nèi)容生產(chǎn)方式背后所具備有的意義和價(jià)值,從百度研究院在今年年初所發(fā)布的科技趨勢(shì)預(yù)測(cè)中便可窺見一二:
2022年AIGC借助大模型的跨模態(tài)綜合技術(shù)能力,可以激發(fā)創(chuàng)意,提升內(nèi)容多樣性,降低制作成本,將實(shí)現(xiàn)大規(guī)模應(yīng)用。
而早在度曉曉上個(gè)月挑戰(zhàn)完語文作文之際,便有媒體感慨道:“AIGC元年已至”。
但除此之外,隨著數(shù)字人背后的能力逐步披露,其所具備的更深層意義和價(jià)值也在漸漸浮現(xiàn)。
正如沙利文和IDC此前針對(duì)中國(guó)數(shù)字人發(fā)布的報(bào)告中所述:
服務(wù)型數(shù)字人是百度的優(yōu)勢(shì)所在,產(chǎn)品類型豐富,從最早的企業(yè)服務(wù)場(chǎng)景已經(jīng)延伸到營(yíng)銷、辦公等領(lǐng)域。
這句看似“數(shù)字人已落地”的背后,更是在揭示其背后文心大模型的大規(guī)模落地。
而若是把百度近年來在大模型上的各種動(dòng)作鋪開來看,這種信號(hào)便可一目了然。
早在2019年,百度CTO王海峰便提出了一個(gè)觀點(diǎn):
深度學(xué)習(xí)正在推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)階段。
王海峰當(dāng)時(shí)認(rèn)為,正因深度學(xué)習(xí)具備通用性,以及深度學(xué)習(xí)平臺(tái)在不斷發(fā)展,所以它們正在推動(dòng)AI步入一種新的模式。
到了2020年,“企業(yè)版平臺(tái)”被納入到了飛槳的全景圖之中,并且還發(fā)布了預(yù)訓(xùn)練模型的開發(fā)模式。
這也就邁出了通過預(yù)訓(xùn)練大模型來降低AI門檻的重要一步。
而在去年,百度集團(tuán)副總裁吳甜則是提出企業(yè)AI應(yīng)用三階段:AI先行者探路、AI工作坊應(yīng)用、AI工業(yè)大生產(chǎn)。
并且針對(duì)每一個(gè)階段分別闡述了企業(yè)將面臨的困難和挑戰(zhàn),以及相應(yīng)的解決方案。
與此同時(shí),在同年的12月份,文心大模型也隨之正式亮相。
“降低使用門檻”,成為了百度在大模型上的努力方向之一。
這一切的目標(biāo)顯然正是百度希望能夠讓大模型更快、更高效地在產(chǎn)業(yè)中鋪開來用。
值得一提的是,此前百度“前無古人”地提出的行業(yè)大模型,并不是否定其它大模型廠商的分類模式。
這更像是站在傳統(tǒng)大模型的基礎(chǔ)上,為了讓它更好地能被產(chǎn)業(yè)用起來,而提出的一種新范式。
而像度曉曉近來兩次挑戰(zhàn)高考語文和英語作文,可以說只是一種展現(xiàn)大模型已經(jīng)能夠很好地被用起來的一隅。
據(jù)了解,文心大模型目前已經(jīng)在諸如保險(xiǎn)、銀行、農(nóng)業(yè)、生物醫(yī)藥、工業(yè)、搜索,甚至是智能音箱等領(lǐng)域和場(chǎng)景中實(shí)現(xiàn)落地應(yīng)用,在提高垂直業(yè)務(wù)效率的道路上不斷探索前行。
這也正應(yīng)了吳甜的那句話:
今年是大模型產(chǎn)業(yè)落地的關(guān)鍵年。
那么接下來,在大模型逐漸與實(shí)際場(chǎng)景深入交織融合之下,還會(huì)產(chǎn)生怎樣的效果,值得拭目以待了。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。