百度創(chuàng)始人李彥宏:未來(lái)開(kāi)發(fā)應(yīng)用就像拍短視頻一樣簡(jiǎn)單
證券時(shí)報(bào)記者王小偉
“自然語(yǔ)言將成為新的通用編程語(yǔ)言,只要會(huì)說(shuō)話,就可以成為一名開(kāi)發(fā)者。”這是百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏4月16日在深圳開(kāi)幕的“百度AI開(kāi)發(fā)者大會(huì)”上做出的新判斷。李彥宏認(rèn)為,未來(lái)開(kāi)發(fā)應(yīng)用就像拍短視頻一樣簡(jiǎn)單,人人都是開(kāi)發(fā)者。
今天這場(chǎng)演講,是李彥宏2024年首秀。他這種判斷的根源在于從去年開(kāi)始爆火的生成式人工智能(AIGC)。李彥宏認(rèn)為:“大模型和生成式AI,將徹底改變開(kāi)發(fā)者這個(gè)群體。過(guò)去,開(kāi)發(fā)者用代碼改變世界;未來(lái),自然語(yǔ)言將成為新的通用編程語(yǔ)言。你只要會(huì)說(shuō)話,就可以成為一名開(kāi)發(fā)者,用自己的創(chuàng)造力改變世界。”
大會(huì)上,李彥宏連發(fā)多款A(yù)I開(kāi)發(fā)工具,給出“開(kāi)源模型會(huì)越來(lái)越落后”的判斷,同時(shí)他透露,百度大模型產(chǎn)品文心一言用戶數(shù)突破2億,API日均調(diào)用量也突破了2億。
連推多個(gè)開(kāi)發(fā)工具
“因?yàn)橛辛藦?qiáng)大的基礎(chǔ)大模型,有了很多低門(mén)檻,甚至零門(mén)檻的開(kāi)發(fā)工具,開(kāi)發(fā)者的生產(chǎn)力大大提高了。”李彥宏舉例,比如,基于文心大模型的智能代碼助手Comate,不僅支持100多種語(yǔ)言和所有主流IDE平臺(tái),可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優(yōu)化方案,還可以深度解讀代碼庫(kù)、關(guān)聯(lián)私域知識(shí)生成新的代碼。百度每天新增的代碼中,已經(jīng)有27%是由Comate生成的。
在大會(huì)上,李彥宏與百度連推多個(gè)開(kāi)發(fā)工具。
首先是智能體開(kāi)發(fā)工具AgentBuilder。李彥宏認(rèn)為,智能體可能是未來(lái)離每個(gè)人最近、最主流的大模型使用方式,基于強(qiáng)大的基礎(chǔ)模型,智能體可以批量生成,應(yīng)用在各種各樣的場(chǎng)景。百度文心智能體平臺(tái)已經(jīng)有3萬(wàn)多個(gè)智能體被創(chuàng)建、5萬(wàn)多名開(kāi)發(fā)者和上千家企業(yè)入駐。
值得注意的是,有上市公司已經(jīng)與百度此項(xiàng)業(yè)務(wù)有所合作。其中索菲亞有效用戶線索成本降低了30%。
其次是百度AppBuilder,用自然語(yǔ)言三步開(kāi)發(fā)一個(gè)AI原生應(yīng)用。
具體來(lái)看,在AppBuilder上面,百度提前封裝和預(yù)置了開(kāi)發(fā)AI原生應(yīng)用所需的各種組件和框架,大幅降低開(kāi)發(fā)門(mén)檻。最快只需三步,開(kāi)發(fā)者就可以用自然語(yǔ)言開(kāi)發(fā)出一個(gè)AI原生應(yīng)用,并且能夠便捷地發(fā)布、集成到各種各樣的業(yè)務(wù)環(huán)境中。
第三是各種尺寸模型定制工具M(jìn)odelBuilder。
這是更適合專業(yè)開(kāi)發(fā)者使用的工具,具備“高效低價(jià)生產(chǎn)模型的能力”,可以根據(jù)開(kāi)發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場(chǎng)景對(duì)模型進(jìn)一步精調(diào)。
現(xiàn)場(chǎng),李彥宏展示了教育行業(yè)作文批改的案例,經(jīng)過(guò)數(shù)據(jù)處理、模型精調(diào)后的“作文批改助手”,不僅可以擁有更專業(yè)的老師點(diǎn)評(píng)思維、做到格式遵循,而且相比未精調(diào)模型,精調(diào)后的模型打分與真實(shí)的老師點(diǎn)評(píng)分?jǐn)?shù)更為接近。
“百度踩了無(wú)數(shù)坑”
“大模型本身并不直接創(chuàng)造價(jià)值,基于大模型開(kāi)發(fā)出來(lái)的AI應(yīng)用才能滿足真實(shí)的市場(chǎng)需求。這是我們百度根據(jù)過(guò)去一年的實(shí)踐,踩了無(wú)數(shù)的坑,交了高昂的學(xué)費(fèi)換來(lái)的。”李彥宏表示。
李彥宏認(rèn)為,未來(lái)大型的AI原生應(yīng)用基本都是MoE的,指的是大小模型的混用,不依賴一個(gè)模型來(lái)解決所有問(wèn)題。
關(guān)于小模型,李彥宏表示,小模型推理成本低,響應(yīng)速度快,在一些特定場(chǎng)景中,經(jīng)過(guò)精調(diào)后的小模型使用效果可以媲美大模型。這是百度發(fā)布Speed、Lite、Tiny三個(gè)輕量模型的原因。“我們通過(guò)大模型,壓縮蒸餾出來(lái)一個(gè)基礎(chǔ)模型,然后再用數(shù)據(jù)去訓(xùn)練,這比從頭開(kāi)始訓(xùn)小模型,效果要好很多,比基于開(kāi)源模型訓(xùn)出來(lái)的模型效果更好,速度更快,成本更低。”李彥宏說(shuō)。
關(guān)于智能體,李彥宏解釋,智能體機(jī)制包括理解、規(guī)劃、反思和進(jìn)化,它讓機(jī)器像人一樣思考和行動(dòng),可以自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)、實(shí)現(xiàn)自我迭代和進(jìn)化。在一些復(fù)雜系統(tǒng)中,還可以讓不同的智能體互動(dòng),相互協(xié)作,更高質(zhì)量地完成任務(wù)。
李彥宏明確,這些智能體能力,百度已經(jīng)開(kāi)發(fā)出來(lái)了,并且向開(kāi)發(fā)者全面開(kāi)放。
開(kāi)源模型會(huì)越來(lái)越落后
李彥宏在AI開(kāi)發(fā)者大會(huì)上直懟“開(kāi)源”,他認(rèn)為,開(kāi)源模型會(huì)越來(lái)越落后。
“因?yàn)橛辛俗顝?qiáng)大的基礎(chǔ)模型文心4.0,可以根據(jù)需要,兼顧效果、響應(yīng)速度、推理成本等各種考慮,剪裁出適合各種場(chǎng)景的更小尺寸模型,并且支持精調(diào)和postpretrain(一種預(yù)訓(xùn)練的模型訓(xùn)練方法)。這樣通過(guò)降維剪裁出來(lái)的模型,比直接開(kāi)源模型調(diào)出來(lái)的模型,同等尺寸下效果明顯更好,同等效果下,成本明顯更低。所以開(kāi)源模型會(huì)越來(lái)越落后。”李彥宏解釋。
同日,李彥宏還明確了百度AI和大模型的新動(dòng)向。
李彥宏透露,文心一言從去年3月16日發(fā)布,到今天是一年零一個(gè)月的時(shí)間。用戶數(shù)突破了2億,API日均調(diào)用量也突破了2億,服務(wù)客戶數(shù)達(dá)到了8.5萬(wàn),利用千帆平臺(tái)開(kāi)發(fā)的AI原生應(yīng)用數(shù)超過(guò)了19萬(wàn)。
百度正式發(fā)布文心大模型4.0工具版。文心大模型4.0的工具版可以體驗(yàn)代碼解釋器功能,通過(guò)自然語(yǔ)言交互,就能實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)和文件的處理與分析,還可以生成圖表或文件,能夠快速洞察數(shù)據(jù)中的特點(diǎn)、分析變化趨勢(shì)、為后續(xù)的決策提供支撐。
李彥宏表示,相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來(lái)的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來(lái)的1%。也就是說(shuō),客戶原來(lái)一天調(diào)用1萬(wàn)次,同樣成本現(xiàn)在可以調(diào)用100萬(wàn)次。
“未來(lái),必將是一個(gè)由開(kāi)發(fā)者一起創(chuàng)造出來(lái)的未來(lái)。”在發(fā)布會(huì)最后,李彥宏表示,“此時(shí)此刻,我站在這里,其實(shí)也是一個(gè)開(kāi)發(fā)者、一個(gè)創(chuàng)業(yè)者,跟大家一樣興奮。今天的中國(guó),有10億互聯(lián)網(wǎng)用戶,有強(qiáng)大的基礎(chǔ)大模型,有足夠多的AI應(yīng)用場(chǎng)景,有全球最完備的產(chǎn)業(yè)體系,國(guó)家也在大力鼓勵(lì)和支持‘人工智能+’行動(dòng),每一個(gè)人,每一家企業(yè),只需要充分利用這些工具,就可以釋放無(wú)限的創(chuàng)造力和生產(chǎn)力。”