上海市數據科學重點實驗室主任肖仰華:用好大模型的征程剛剛開始我國企業需構建差異化競爭優勢
近日,Meta發布性能直逼GPT-4的開源大模型Llama3,被視為開源模型發展的又一里程碑,也對閉源大模型陣營形成了新的競爭壓力。Llama3的出現將如何助推AI大模型產業發展?面對海外巨頭的開源戰略,我國大模型企業如何應對競爭?圍繞這些問題,上證報記者專訪了上海市數據科學重點實驗室主任肖仰華。
肖仰華認為,Llama3開源對于完善大模型產業生態,加速大模型和千行百業深度融合,以及大模型應用的創新與普及都具有積極意義。
Llama3發布之前,OpenAI的閉源大模型GPT-4在整個大模型生態圈遙遙領先,是大模型應用方構建智能基座的優先選擇。在肖仰華看來,Llama3的性能直逼GPT-4,為廣大大模型應用方帶來了巨大利好。更多選擇和良性競爭,有利于整個行業加速發展。
肖仰華常把智能比作電能。某種意義上Llama3的出現,意味著大模型基本達成了“發電”的里程碑,而且很多“發電廠”(基座大模型提供方)甚至還是免費(開源)。但有了電,不代表就能安全有效地用好電。
用電涉及更龐大的產業,大模型的下游,也將圍繞“用智”形成更龐大的產業生態。如果說電器是用電的關鍵,那么“智器”(也就是基于大模型能力的各種解決方案與產品),將是用好大模型的關鍵。
他認為,隨著Llama3等基座大模型基本就位,大模型產業的發展焦點可能將逐步從基座模型的訓練和能力提升,過渡到打造智能化產品與解決方案上。用好大模型至關重要,絕不比訓練大模型容易。
用好大模型不僅要對大模型能力有全面、客觀的理解,還要將大模型與小模型、知識圖譜協同好,要將大模型能力有效融入現有生產與研發流程中,要基于大模型的能力對數字化、智能化架構進行解耦與重塑等?!盎诖竽P偷哪芰⒅厮芮邪贅I的數字化、智能化形態,這一征程才剛剛開始。”肖仰華說。
對于國內眾多大模型生態中的公司來說,Llama3的出現倒逼企業重新思考其在生態中的定位,以及如何形成差異化競爭路線,打造競爭優勢,避免科技巨頭戰略性開源對自身商業戰略造成較大沖擊。
數據是大模型能力的源頭,肖仰華建議國內大模型企業要充分抓住我國大力發展數據要素市場的契機,在大規模高質量訓練數據、優質指令、價值觀語料等方面加大力度,構筑特色鮮明、堅實牢固的數據護城河。
他還建議,我國大模型產業應在大模型評測方面加大研發力度,形成領先的大模型評鑒能力。隨著開源模型越來越多,智能應用與產品的研發者需要對模型能力具有較強的判斷和評價能力,進而形成面對眾多大模型的選型能力。
“大模型的智能是一種綜合能力,某種意義上對其考察評價的難度不亞于對人類智能的評價。大模型的評鑒能力足以成為大模型企業發展的核心競爭力之一?!毙ぱ鋈A說。