尋找金融領域的ImageNet|奇富科技直播實錄:信貸多模態AI如何定標準?
時間:2026-03-20 17:14:57
奇富科技-S
近日,奇富科技聯合復旦大學、華南理工大學研究人員共同發起了一場以“信貸多模態AI如何定標準”為主題的直播討論。直播深度解析首個面向信貸場景的多模態評測基準FCMBench-V1.0——該基準圍繞多模態感知、推理與決策等關鍵環節設計評估任務,並同步開源數據集與評測工具,試圖為金融AI建立一把可被廣泛認可的“尺子”。整場分享時長1小時,融合學術前沿與產業實踐,為金融機構、科研院校及行業從業者提供了專業參考與發展思路。以下為本次直播核心內容梳理。

產業實踐視角:FCMBench讓金融AI模型能力有了統一衡量標尺
奇富科技多模態負責人楊葉輝率先從產業實踐角度,剖析了金融AI的發展痛點與FCMBench-V1.0的研發初衷和核心設計邏輯。他形象地將AI比作工具“鋤頭”,而金融、醫療這類高門檻行業則是具備發展潛力的“肥沃土地”,金融業務對隱私、安全、合規的天然高要求,決定了模型能力的驗證絕不能靠“自説自話”,必須建立一套客觀、統一的評測體系。
FCMBench-V1.0的誕生,正是為了解決金融機構在模型選型時的核心困惑。楊葉輝指出,當前金融行業存在不同模型各自宣稱高評分、卻無統一對比標準的問題,且模型在實驗室環境與真實生產環境中還易出現性能大幅下滑的情況,FCMBench的核心價值,就是做一把衡量模型能力的“統一尺子”,把不同模型拉到同一條起跑線上,讓其能力在真實業務條件下接受檢驗。
圍繞這把“尺子”的設計,楊葉輝提出了FCMBench堅守的三大原則:公平性、科學性、實戰性。公平性杜絕“自説自話”,建立統一評測底線;科學性體現為數據分佈、任務與難度設置合理,可有效區分算法差異;實戰性則是核心,力求模型在基準上的優異表現能直接適配真實業務場景。
為了讓評測更貼合實際,FCMBench通過模擬十餘種真實拍攝干擾、設置證件信息合理性判斷、多證件比對等推理類任務,還原信貸業務中的各類風險場景。楊葉輝舉例,若用户提供的年收入累計超50萬但納税比例低於10%,這類明顯的風險點便是FCMBench納入的推理類難題,以此考驗模型的風險識別和反欺詐判斷能力,確保評測任務設置的實際價值。
在楊葉輝看來,FCMBench並非“為做而做”,其核心目標是反哺業務及行業本身,定位是金融行業的公共資源,旨在通過統一標準實現AI能力與業務價值的深度綁定。同時,FCMBench也是金融大模型學術研究與產業應用的溝通橋樑,技術層面將持續擴充任務、數據類型、語種與模態,實現信貸AI全場景覆蓋;行業層面則會聯動高校攻關技術難點,邀請銀行及各類金融機構深度參與共建,豐富真實業務數據與場景,推動其升級為行業公認的評測標準乃至團體標準,成為金融機構模型選型與合作的實戰門檻。
學術研究視角:金融AI的“ImageNet時刻”亟待到來
如果説產業界關注的是“尺子”怎麼用,那麼學術界更關心“尺子”為何缺失,以及如何打造一把真正公信力的“標尺”。
復旦大學陳濤教授從AI發展史切入,直指問題本質:“AI大模型發展高度依賴開源生態,而金融領域目前缺乏國內外公認的統一評測數據集與標準。沒有統一‘尺子’,企業與學術界難以協同投入研究,無法形成強有力的發展生態,這從根本上制約了金融大模型的誕生。”
他將目光投向了深度學習的里程碑——ImageNet。“ImageNet數據集推動了深度學習的爆發,成為圖像識別領域的統一評測標杆,類似的評測標準是AI行業突破的關鍵。”陳濤認為,當前金融領域正缺乏這種統一、全面的評測數據集,難以形成協同發展生態,亟需打造屬於自身的“ImageNet”。
對於奇富科技推出的FCMBench-V1.0,陳濤評價其為當前國內外金融信貸領域規模大、權威性高的統一評測基準之一。相較於行業內其他零散的評測數據集,FCMBench-V1.0首次實現了模態統一,覆蓋信貸、風控等多類核心任務,且全程面向真實業務場景設計,由奇富科技及業界首發的特性,讓其兼具全面性與實用性,成為金融領域打造專屬“ImageNet”的重要探索。
產學研融合視角:金融AI落地優勢顯著,FCMBench銜接產業需求與人才培養
華南理工大學許言午教授則從產學研融合的角度,解讀了金融AI的實際應用現狀、落地優勢,並闡述了FCMBench在行業人才培養方面的重要價值。
他首先澄清了一個普遍誤解:“很多人直覺上覺得AI在金融領域‘存在感不強’,其實並不準確。AI早已深度參與保險定價、資產評估和量化交易等核心場景,只是這些價值並不直接呈現在ToC產品中,因此‘看不見’。”
同時,許言午還指出,相較於醫療等其他高門檻行業,金融AI具備顯著的落地效率優勢,落地效率可達數十倍乃至上百倍。這一優勢的背後,是金融信貸領域可通過歷史數據回測、雙模型並行測試的方式,快速驗證模型實際效果,模型調整週期極短;而醫療行業若變更算法,需重新完成臨牀前實驗等全流程驗證,耗時可達三五年,二者的實操成本存在巨大差距。
對於金融數據集的打造,許言午提出了三大核心要素:價值驅動、全面精巧、公正普惠。他認為,優質的金融數據集,首先要選題有價值且具備創新性,能夠真正解決行業實際問題;其次設計要全面精巧,兼顧行業多維度的應用需求;最後測評方式要公平公正,立足行業公共價值打造,而非以私利為導向。
而FCMBench-V1.0的推出,恰好契合了這三大要素,同時還在金融行業人才培養方面發揮着重要作用。許言午表示,FCMBench是銜接人才培養與金融行業需求、完善行業人才梯隊的重要紐帶,它既能為AI輔脩金融等方向的學生提供真實的產業實踐場景,提升其就業競爭力,也能為算法類專業學生提供貼合實際的金融行業應用場景,助力其快速適配金融領域的崗位需求,進而為金融行業持續補充優質人才,完善行業人才梯隊建設。
本次直播中,三位嘉賓分別從產業實踐、學術研究、產學研融合三個不同維度,圍繞信貸多模態AI標準建設展開深度探討,讓行業對金融AI的發展現狀、痛點及未來方向有了更清晰的認知。未來,隨着FCMBench-V1.0的持續運營與共建,以及更多金融機構、科研院校的參與,金融領域有望逐步形成類似ImageNet的開源生態,讓AI技術與金融業務實現更深度的融合,推動金融AI朝着標準化、規範化的方向發展,最終實現技術突破與產業落地的雙向賦能。
免責聲明:本資訊不構成建議或操作邀約,市場有風險,投資需謹慎!


