近年來,從應急救援、金融服務,到交通出行、能源電力,行業大模型如雨后春筍般發展。如何架構行業垂直大模型,適應千行百業的場景需求?業界人士表示,行業大模型的火熱將助推數據收集、數據標注、數據治理等規范高效發展。那些能夠服務行業痛點,通過場景應用不斷迭代提效的大模型,將在發展中搶占先機。
行業大模型,指的是面向特定行業領域需求打造、適配行業場景的專用大型模型。與通用大模型相比,行業大模型通過對垂直細分領域的數據進行更有針對性地訓練和優化,能更有效地完成專業性工作。天眼查數據顯示,截至目前,全國已有210余條行業大模型相關專利和110余條垂直大模型相關專利布局。這一數據表明,我國正加速推進人工智能技術從通用化向行業化、場景化深度演進。
“通用人工智能大模型在應急管理行業適用性不強。”大數據與人工智能應用創新應急管理部重點實驗室主任劉永強表示,面對危化品監管、災害處置預案等專業性較強的問題,通用大模型的回答準確率偏低。目前,培育行業大模型需要將積累的高質量數據經標注加工后,通過后訓練方式融入通用大模型的參數庫,而非簡單掛載知識庫進行檢索式問答。
百度智能云政務行業總經理傅鵬表示,通用大模型更多面向C端,提供問答、圖片視頻處理等通用能力。而垂類行業大模型,核心需求是支撐專業應用場景落地,提升管理效能和實戰效果。
對于提高行業大模型的有效性,劉永強認為,要重點開展兩方面工作,其一是構建高質量數據集,其二是基于微調技術對大模型訓練調優。未來,要建強大數據和大模型底座,構建行業高質量數據集,帶動應用場景的拓展。
“這就要求行業模型要達到多模態數據處理能力,整合圖像、文本、視頻、傳感器等各類數據;提升高效響應能力,在短時間內完成數據處理、分析和決策支持;實現自主化流程編排能力,在復雜場景要自動完成多環節協同操作,提升工作效率。”傅鵬說。
此外,攻克大模型“幻覺”是業界關注的重點。“大模型的錯誤回答可能導致執法誤判、救援失誤等嚴重后果。我們正在構建大模型的自我評估能力,讓模型根據場景應用效果自主判斷回答質量,并進行自我迭代更新。”劉永強說,要基于知識圖譜的檢測技術,及時發現大模型的“幻覺”問題,采用插件化生成技術進行糾偏,暫時無法糾偏時則禁止輸出。
業界人士表示,在大模型賦能行業發展的同時,行業也為大模型迭代升級提供了應用場景。前些年大家多是重視算力、芯片,如今對行業大模型的應用場景更為關注,要能解決行業實際問題。
未來,行業大模型要致力于理解和解讀“復雜環境”的專業語言,并深度融入行業的核心業務流程與關鍵場景。以交通領域為例,中新數字科技(四川)有限公司董事長李河表示,應堅持以真實場景需求為牽引、以自主技術創新為驅動、以行業政策標準為依據,系統性提升從感知、決策到執行的全鏈條運營效率。隨著技術與業務場景的深度融合,持續增強模型在多樣化場景下的自適應能力、全周期數據安全治理能力以及產業鏈協同支撐能力,推動行業大模型實現從“單點技術突破”向“全場景業務協同”演進。