2023-07-08 19:09:21
每經AI快訊,7月8日,由上海數據交易所、大數據流通與交易技術國家工程實驗室承辦的“大模型時代下的數據要素流通”主題論壇在上海世博中心舉行。上海數交所總經理湯奇峰作題為“大模型時代下的語料庫”的主旨演講,帶來關于國內語料庫建設挑戰的觀察,并從語料庫質量和開放程度兩個維度給出建設建議。湯奇峰認為,大模型時代下的語料庫建設存在語料庫供給不足、語料庫質量不高、語料庫多樣性匱乏、語料庫標準欠缺等問題。“語料庫建設不是單一企業的責任,需要多方共同推進,如果每個企業都單獨建設維護語料庫,會拉低效率,也會增加企業成本,數交所希望通過自己的努力加強數據要素建設提升語料庫建設效率。”湯奇峰表示,“語料庫采購已經在不少大模型企業成本中占據重要比重,上海數交所希望以市場配置的方式組織數據要素推動語料庫建設。”上海數交所官網已經于7月7日正式上線語料庫,累計掛牌近30個語料數據產品,包含文本、音頻、圖像等多模態,覆蓋金融、交通運輸和醫療等領域。(中證網)
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP