隨著人工智能技術(shù)的發(fā)展,大模型在各個領(lǐng)域都展示出強大的應(yīng)用潛力。本文分析了大模型技術(shù)在檢驗檢測認(rèn)證領(lǐng)域的典型應(yīng)用場景,展望了大模型技術(shù)在檢驗檢測認(rèn)證領(lǐng)域的發(fā)展方向,以期為大模型在檢驗檢測認(rèn)證領(lǐng)域的應(yīng)用提供借鑒。
檢驗檢測認(rèn)證是保證產(chǎn)品質(zhì)量和生產(chǎn)安全的重要環(huán)節(jié)。然而,傳統(tǒng)的人工檢測和部分自動化檢測難以滿足質(zhì)量保證的要求,主要面臨檢測周期長、人為誤差難以控制、檢測數(shù)據(jù)利用不足等問題。近年來,隨著人工智能技術(shù)的快速發(fā)展,具有廣泛適用性的通用大模型和針對特定行業(yè)或領(lǐng)域訓(xùn)練的行業(yè)大模型為檢驗檢測認(rèn)證行業(yè)帶來了新的發(fā)展機遇。大模型具有表達能力強、泛化性好、多模態(tài)學(xué)習(xí)和可持續(xù)學(xué)習(xí)等特點,利用大模型技術(shù)這些特點可以幫助檢驗檢測認(rèn)證機構(gòu)提升檢測實驗效率、提高質(zhì)量管理能力、優(yōu)化檢測方案、充分利用檢測數(shù)據(jù)和構(gòu)建數(shù)字化人才引育體系,為檢驗檢認(rèn)證測行業(yè)注入新動能。
一、大模型技術(shù)概述
2022年底,OpenAI發(fā)布具有1750億參數(shù)的大規(guī)模預(yù)訓(xùn)練通用語言模型ChatGPT3.5之后,因其表現(xiàn)出的卓越自然語言理解、自然語言生成與邏輯推理能力,引發(fā)了國際范圍內(nèi)對于大模型的研究及應(yīng)用熱潮。在國內(nèi),百度率先發(fā)布了產(chǎn)業(yè)級的知識增強大模型“文心一言”,商湯科技、科大訊飛緊隨其后發(fā)布了面向行業(yè)垂直領(lǐng)域的大模型。在學(xué)術(shù)研究領(lǐng)域,清華大學(xué)發(fā)布了完全自研的、開源的中英文雙語訓(xùn)練語言模型,經(jīng)由智譜AI發(fā)布了生成式對話語言模型ChatGLM。縱觀國內(nèi)外相關(guān)AI企業(yè)、機構(gòu)、高校對大模型的開發(fā)與應(yīng)用案例,按照應(yīng)用場景大模型可分為通用、行業(yè)、垂直大模型三個層級,詳情見附表。
二、大模型應(yīng)用于檢驗檢測認(rèn)證的典型場景
ChatGPT、文心一言、Copilot等大模型可以自動生成流暢、自然的文本,理解用戶提出的問題并生成相應(yīng)的回答,且能生成長文本密集型答案。從目前文獻和研究成果來看,大模型在數(shù)據(jù)整合、語義理解、邏輯推理、文本輸出中表現(xiàn)較好,能夠有效解決檢驗檢測認(rèn)證行業(yè)存在的檢測周期長、人為誤差難以控制、檢測數(shù)據(jù)利用不足等問題。具體應(yīng)用場景如下。
行業(yè)垂直大模型助力人機交互升級。大模型的多模態(tài)學(xué)習(xí)的圖文理解與生成能力對檢驗檢測認(rèn)證活動中主觀判斷工作有替代作用。大模型能夠基于檢驗檢測認(rèn)證數(shù)據(jù)、產(chǎn)品試驗照片等現(xiàn)場采樣信息,根據(jù)用戶發(fā)出的指令精準(zhǔn)繪圖制表、生成檢驗檢測認(rèn)證結(jié)果報告。除此之外,大模型全天候24小時在線,突破人類生理極限,能夠在采樣后自主處理數(shù)據(jù)、編寫報告正文、生成證書,大幅提高效率和質(zhì)量,降低成本。
大模型與領(lǐng)域知識相結(jié)合構(gòu)建領(lǐng)域知識庫。大模型強大的數(shù)據(jù)分析能力,能夠較好地替代檢驗檢測認(rèn)證活動中的人工數(shù)據(jù)錄入、數(shù)據(jù)分析等工作。檢驗檢測認(rèn)證機構(gòu)已有相當(dāng)規(guī)模的數(shù)據(jù)沉淀,如檢測試驗信息,其中典型代表有標(biāo)準(zhǔn)、規(guī)則、檢驗檢測試驗數(shù)據(jù)、產(chǎn)品認(rèn)證活動數(shù)據(jù)。又如,一個面向機電產(chǎn)品合格評定標(biāo)準(zhǔn)的模型被訓(xùn)練后,在開展機電產(chǎn)品檢驗檢測認(rèn)證活動時,檢測員、檢查員無需再手動查找規(guī)范、標(biāo)準(zhǔn)文件及細(xì)項條文,大模型在交互過程中便能生成具有自然語言釋義的報告正文。
三、大模型在檢驗檢測認(rèn)證行業(yè)的應(yīng)用展望
大模型技術(shù)的應(yīng)用將推動檢驗檢測認(rèn)證實現(xiàn)全流程智能化。與此同時,豐富知識圖譜、構(gòu)建高質(zhì)量數(shù)據(jù)集和加強模型評估體系也很重要。未來,大模型與行業(yè)實踐深度融合,將使檢驗檢測認(rèn)證工作更加智能。主要表現(xiàn)在以下方面。
一是紓解人才困境。在檢驗檢測認(rèn)證領(lǐng)域,檢驗檢測認(rèn)證機構(gòu)所面臨的人才困境可以通過基于大模型建立的領(lǐng)域知識庫得以紓解。
二是盤活數(shù)據(jù)資產(chǎn),建立領(lǐng)域知識庫。檢驗檢測認(rèn)證活動中積累了大量數(shù)據(jù),包括檢測數(shù)據(jù)、認(rèn)證數(shù)據(jù)、客戶數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等。受限于傳統(tǒng)大數(shù)據(jù)和人工智能算法能力,這些蘊含著巨大價值的數(shù)據(jù)往往未能得到充分利用。大模型技術(shù)的出現(xiàn)為盤活這些數(shù)據(jù)價值提供了新的機遇。大模型的深度學(xué)習(xí)可以生成數(shù)據(jù)的高維特征表示,散列數(shù)據(jù)處理能力則可以高效地索引和檢索這些特征表示,逐步建立領(lǐng)域知識庫。
在實際應(yīng)用中,一方面,如ChatGPT等大模型背后的生成式人工智能所具有的大參數(shù)規(guī)模運算能力能夠?qū)Ξa(chǎn)品研發(fā)起到一定的促進作用。一是對現(xiàn)有知識重新排列組合,借助大規(guī)模數(shù)據(jù)高速運算能力,盡可能窮盡知識要素組合,最大限度創(chuàng)造創(chuàng)新選項,通過不同組合“涌現(xiàn)”新產(chǎn)品;二是在已有理論基礎(chǔ)上跨界融合,實現(xiàn)新領(lǐng)域的理論突破。另一方面,借助大模型的多模態(tài)理解與邏輯推理能力,提升現(xiàn)有業(yè)務(wù)中的自動化和數(shù)字化水平,能夠?qū)z測員、檢查員從原有繁瑣、程序化的工作中解放出來,減少人力成本的同時,也為理論知識學(xué)習(xí)、領(lǐng)域知識積累爭取更多時間,從而釋放專家智慧的更多潛能,助力提升現(xiàn)有人員專業(yè)知識。
大模型在各個領(lǐng)域都展示出強大的應(yīng)用潛力,但是大模型同樣存在一些弊端,主要體現(xiàn)在可靠性、可解釋性、穩(wěn)定性等方面。因為模型訓(xùn)練時所用的數(shù)據(jù)的專業(yè)性和真實性不夠,加之大模型采用的深度學(xué)習(xí)的訓(xùn)練策略、訓(xùn)練過程的不可解釋性,造成現(xiàn)階段大模型輸出看似合理但不正確的答案、每次響應(yīng)內(nèi)容不一致等問題。考慮到檢驗檢測認(rèn)證行業(yè)特性,應(yīng)構(gòu)建領(lǐng)域?qū)<抑R庫和大模型相互增強機制,通過大模型沉淀關(guān)鍵知識,業(yè)務(wù)專家對關(guān)鍵知識審核維護的方式,持續(xù)進行行業(yè)、垂直大模型的優(yōu)化和微調(diào)。逐步建立適用、可用的面向檢驗檢測認(rèn)證行業(yè)細(xì)分領(lǐng)域的垂直大模型。
四、結(jié)論
大模型技術(shù)為檢驗檢測認(rèn)證行業(yè)提供了前所未有的機遇,通過智能分析與自動化處理,顯著提升工作效率和結(jié)果的準(zhǔn)確性。雖然大模型技術(shù)展示了一種向智能化和精益化進步的道路,但在檢驗檢測認(rèn)證行業(yè)的具體應(yīng)用,仍存在一系列問題需要探討和驗證。比如,數(shù)據(jù)隱私安全、人工智能決策的透明度和模型的可解釋性、長期的維持和更新等問題。對這些挑戰(zhàn)的研究和解決是人工智能在檢驗檢測認(rèn)證領(lǐng)域全面應(yīng)用的關(guān)鍵。