(資料圖片)
站長之家(ChinaZ.com)6月26日 消息:據(jù)量子位報道,清華大學(xué)唐杰團(tuán)隊發(fā)布并開源了WebGLM。這是一個參數(shù)量高達(dá)100億的聯(lián)網(wǎng)問答聊天機(jī)器人,已經(jīng)入選KDD2023會議的相關(guān)論文。用戶可以向它提出任意問題,然后它會給出網(wǎng)上相關(guān)鏈接(例如維基百科和相關(guān)官網(wǎng)),并整理出答案。在性能對比測試中,WebGLM的表現(xiàn)比OpenAI的135億參數(shù)的WebGPT還要強(qiáng),而在人類評估中,甚至和1750億參數(shù)的模型不相上下。
WebGLM的目標(biāo)是通過Web搜索和檢索功能來增強(qiáng)預(yù)訓(xùn)練的大語言模型,并且實現(xiàn)高效的實際部署。為此,作者采用了三種策略進(jìn)行開發(fā):大型模型增強(qiáng)檢索器、自舉生成器、基于人類喜好的評分器。大型語言模型增強(qiáng)檢索器將前五個最相關(guān)的頁面作為參考源,讓自舉生成器生成多個答案,最終評分器選擇最符合人類偏好的那個答案作為最終輸出。
除了WebGLM本身,唐杰團(tuán)隊還提出了一個網(wǎng)絡(luò)增強(qiáng)問答系統(tǒng)的評估標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)既包括參考文獻(xiàn),也包括最終回答,衡量相關(guān)性、信息密度、真實性(無事實錯誤)、無害(無暴力、色情等信息)和社會偏見程度這五個維度。評估最終回答時,標(biāo)準(zhǔn)衡量流暢度、正確性、引用準(zhǔn)確性、客觀性和冗余程度。根據(jù)評估結(jié)果,WebGLM的搜索結(jié)果雖略遜于WebGPT-175B,但比Perplexity.ai和WebGPT-13B表現(xiàn)更好。
項目地址:https://github.com/THUDM/WebGLM
論文地址:https://arxiv.org/abs//2306.07906
關(guān)鍵詞: