本報訊 11月11日,記者從國家知識產權局信息顯示,湖南省建筑設計院集團股份有限公司申請一項名為“自動獲取用于多模態圖像生成模型的專業類數據集的方法”的專利,公開號CN118918411A,申請日期為2024年7月。
專利摘要顯示,本發明公開了一種自動獲取用于多模態圖像生成模型的專業類數據集的方法,包括獲得該專業的原始圖像數據集;按照分辨率和長寬比例要求對原始圖像數據集中的圖像進行篩選和調整,得到第二圖像數據集;對第二圖像數據集中的圖像進行分類,得到所需類別的第一圖像子數據集;將該專業的結構化描述文檔輸入第一多模態大語言模型,對所需類別的第一圖像子數據集中的圖像進行質量評價,剔除不符合圖像質量評價標準的圖像,得到第二圖像子數據集;將改專業的標注公式范例輸入第二多模態大語言模型,對第二圖像子數據集中的圖像進行特征標注,得到包含圖像及其對應標注公式的圖文對子數據集。本申請可以自動生成用于多模態圖像生成模型的各種專業類數據集。(王智聰)
官方公眾號
官方視頻號
官方微博號
官方百家號
官方抖音號