本報訊 由上海建工四建集團(tuán)建筑人工智能研究室自主研發(fā)的建筑行業(yè)首個百億字符知識增強(qiáng)對話大模型Construction-GPT(Beta版)于近日上線,預(yù)計今年年內(nèi)開放建筑專業(yè)詞嵌入、非結(jié)構(gòu)化文件解析等相關(guān)API接口供行業(yè)使用。
Construction-GPT包含規(guī)范標(biāo)準(zhǔn)智能問答與查新、工程圖集詳圖智能搜索、內(nèi)控技術(shù)文件智能查詢、私有知識庫智能構(gòu)建4項主要功能,技術(shù)人員通過對話問答方式,只需5—10秒就能夠檢索到需要的建筑工程技術(shù)資料,即使身處工地現(xiàn)場,也有“行業(yè)專家”隨行。
千億級別模型參數(shù),打造行業(yè)首個百億字符知識增強(qiáng)對話大模型。上海建工四建集團(tuán)研發(fā)團(tuán)隊利用自主研發(fā)的建筑專業(yè)詞嵌入模型、半監(jiān)督微調(diào)、大模型價值對齊3項關(guān)鍵技術(shù),實(shí)現(xiàn)了5000多本規(guī)范標(biāo)準(zhǔn)、1000多份工程圖集、150多份企業(yè)內(nèi)部技術(shù)文件的智能解析。與傳統(tǒng)人工檢索方式相比,技術(shù)人員能夠一次性快速獲得多本技術(shù)資料中的相關(guān)信息,節(jié)省了大量時間。和通用大模型相比,Construction-GPT不依賴互聯(lián)網(wǎng)知識庫,同時加載了敏感詞過濾算法,為工程技術(shù)問題提供更專業(yè)、更科學(xué)、更合理的解答。
高效的模型推理能力,讓回答無杜撰、可追溯、易查詢。AIDAC數(shù)據(jù)吞吐加速技術(shù)的采用,提高了Construction-GPT模型的推理速度,在無網(wǎng)絡(luò)延遲測試下,回答僅需5—10秒。Construction-GPT還打破了以往通用大模型的“謠言機(jī)制”,避免了答非所問、信息杜撰的情況出現(xiàn)。技術(shù)人員能夠精確選擇大模型索引知識庫范圍,為每個回答提供準(zhǔn)確信息和索引資料來源,一鍵打開索引資料鏈接,就可以繼續(xù)深度查詢和檢索。
支持私有知識庫建立,打造個人專屬智能知識系統(tǒng)。除了規(guī)范標(biāo)準(zhǔn)、工程圖集、公司內(nèi)部技術(shù)文件等公共技術(shù)資料外,技術(shù)人員往往還需要根據(jù)個人存儲資料開展相關(guān)檢索。為此,研發(fā)團(tuán)隊自主研發(fā)了多模態(tài)數(shù)據(jù)解析算法,技術(shù)人員只需要一鍵上傳文件,Construction-GPT就可以自動解析24種文檔、圖紙、音頻格式文件,建立個人專屬知識空間,打造個人專屬智能知識檢索系統(tǒng)。
規(guī)范標(biāo)準(zhǔn)一鍵查新,更多實(shí)驗室功能輔助項目辦公。建筑行業(yè)涉及規(guī)范標(biāo)準(zhǔn)數(shù)量龐大,更新速度快,技術(shù)人員常常難以了解規(guī)范標(biāo)準(zhǔn)最新修編情況。研發(fā)團(tuán)隊特別建立了規(guī)范標(biāo)準(zhǔn)動態(tài)數(shù)據(jù)庫,利用近似字符串最優(yōu)匹配算法,開發(fā)了規(guī)范標(biāo)準(zhǔn)智能查新功能模塊,技術(shù)人員一鍵復(fù)制粘貼,就可以快速生成最新結(jié)果。今后,Construction-GPT還將上線更多實(shí)驗室功能模塊,助力技術(shù)人員的高效辦公。
為了方便技術(shù)人員隨時隨地檢索技術(shù)資料,研發(fā)團(tuán)隊同步開發(fā)了Construction-GPT小程序端。在同一賬號下,小程序端與平臺網(wǎng)頁端可以實(shí)時同步歷史問答對話內(nèi)容,并支持語音輸入,方便身處工地現(xiàn)場的技術(shù)人員使用。(鐘 和)