當(dāng)前,人工智能正以前所未有的速度滲透至食品安全風(fēng)險(xiǎn)治理領(lǐng)域,推動(dòng)食品安全監(jiān)管從“被動(dòng)響應(yīng)”向“主動(dòng)預(yù)見”,從“經(jīng)驗(yàn)驅(qū)動(dòng)”向“數(shù)據(jù)驅(qū)動(dòng)”轉(zhuǎn)變。近日,江南大學(xué)食品安全與國家戰(zhàn)略治理實(shí)驗(yàn)室首席專家吳林海教授發(fā)表《在食品安全領(lǐng)域人工智能垂直應(yīng)用中構(gòu)建高質(zhì)量專業(yè)語料的思考》一文,闡述在食品安全風(fēng)險(xiǎn)治理領(lǐng)域垂直應(yīng)用中,為何必須構(gòu)建高質(zhì)量專業(yè)語料,為全國推進(jìn)“人工智能+食品安全”行動(dòng)提供參考。
吳林海表示,專業(yè)語料是垂直領(lǐng)域人工智能的“認(rèn)知基石”?!拔覀兊难芯孔C實(shí),沒有高質(zhì)量的專業(yè)語料庫,人工智能在垂直領(lǐng)域的應(yīng)用就是無米之炊、無源之水?!眳橇趾Uf,人工智能模型的性能邊界取決于其訓(xùn)練數(shù)據(jù)的質(zhì)量。語料標(biāo)注是將原始文本數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)習(xí)知識(shí)的重要過程,食品安全風(fēng)險(xiǎn)治理的智能化,本質(zhì)上依賴于對(duì)知識(shí)的系統(tǒng)化組織與深度挖掘。
“盡管我國在食品安全領(lǐng)域人工智能應(yīng)用方面取得重要進(jìn)展,但我們的調(diào)研發(fā)現(xiàn),不少地方在建設(shè)‘AI+食品安全監(jiān)管智能化’平臺(tái)中存在問題。比如沒有或很少基于食品安全風(fēng)險(xiǎn)治理語料庫,沒有科學(xué)地對(duì)語料進(jìn)行標(biāo)注?!边@導(dǎo)致部分應(yīng)用場(chǎng)景淪為“場(chǎng)景擺設(shè)”——因缺少高質(zhì)量語料,AI模型無法理解食品安全領(lǐng)域的專業(yè)術(shù)語和上下文,無法在復(fù)雜的風(fēng)險(xiǎn)信息中找到路徑并進(jìn)行預(yù)測(cè),最終難以支撐真實(shí)的業(yè)務(wù)閉環(huán)。
食品安全領(lǐng)域的知識(shí)特殊性主要體現(xiàn)在:專業(yè)術(shù)語體系復(fù)雜,知識(shí)體系動(dòng)態(tài)更新快,風(fēng)險(xiǎn)信號(hào)隱蔽性強(qiáng)且傳導(dǎo)鏈條復(fù)雜。食品安全風(fēng)險(xiǎn)往往隱匿于“從農(nóng)田到餐桌”的復(fù)雜產(chǎn)業(yè)鏈條中,涉及生產(chǎn)、加工、流通、餐飲、消費(fèi)等多個(gè)環(huán)節(jié),跨環(huán)節(jié)、跨區(qū)域、跨主體的風(fēng)險(xiǎn)傳導(dǎo)路徑錯(cuò)綜復(fù)雜。
有研究者發(fā)現(xiàn),通用模型在廚師、營養(yǎng)師專業(yè)考試中的準(zhǔn)確率遠(yuǎn)低于領(lǐng)域?qū)S媚P汀?/p>
吳林海表示,沒有專業(yè)語料的支撐,再強(qiáng)大的通用模型也無法在特定領(lǐng)域達(dá)到可用水平,這構(gòu)成了從通用能力到專業(yè)應(yīng)用之間不可逾越的技術(shù)鴻溝。食品安全領(lǐng)域的人工智能應(yīng)用涉及從感知到認(rèn)知的多層次任務(wù),每一層次都對(duì)語料標(biāo)注提出差異化、遞進(jìn)式的技術(shù)要求。比如在詞法層面,需要對(duì)“微生物污染”“非法添加物”等專業(yè)術(shù)語進(jìn)行正確切分、邊界識(shí)別,避免通用模型對(duì)術(shù)語誤讀、漏讀;在句法與篇章層面,例如“三文魚”的商品通用名與其學(xué)名“大西洋鮭”須建立共指關(guān)系等。
目前,國內(nèi)食品安全專業(yè)領(lǐng)域語料庫建設(shè)還剛剛起步。江南大學(xué)在食品安全領(lǐng)域人工智能應(yīng)用方面開展了系統(tǒng)性探索。江南大學(xué)食品學(xué)院與科大訊飛、華為等共同發(fā)布全球首個(gè)食品學(xué)科專用大模型FoodSeek(食問),該模型初步具備食品學(xué)科的信息抽取、推理、精準(zhǔn)解析、智能問答等專業(yè)能力。江南大學(xué)食品安全與國家戰(zhàn)略治理實(shí)驗(yàn)室與北京市煒衡(無錫)律師事務(wù)所、北京熱熱科技有限公司等合作,基于“企業(yè)標(biāo)注能力+律師專業(yè)素養(yǎng)+高校專業(yè)模型”聯(lián)合模式,正在開發(fā)“食品安全風(fēng)險(xiǎn)治理領(lǐng)域?qū)I(yè)語料標(biāo)注平臺(tái)”。該平臺(tái)依靠食品安全專業(yè)領(lǐng)域的專家標(biāo)注高質(zhì)量語料數(shù)據(jù),并將數(shù)據(jù)注入模型,以實(shí)現(xiàn)“專業(yè)知識(shí)+工程能力+場(chǎng)景落地”的閉環(huán)。
吳林海建議,未來需要構(gòu)建國家通用的食品安全專業(yè)語料體系,建設(shè)國家級(jí)食品安全語料庫;形成多層次的語料體系,包括行政和司法懲罰案例語料體系、食品安全國家技術(shù)標(biāo)準(zhǔn)語料體系等;應(yīng)研制《食品安全風(fēng)險(xiǎn)治理語料標(biāo)注操作指南》《食品安全風(fēng)險(xiǎn)治理語料質(zhì)量分級(jí)與審計(jì)規(guī)程》等標(biāo)準(zhǔn),組建由高校、科研院所、食品企業(yè)、人工智能企業(yè)共同參與的政產(chǎn)學(xué)研用體系,建立語料動(dòng)態(tài)更新機(jī)制等。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號(hào)-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號(hào)主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司