每日經濟新聞 2023-05-26 15:27:55
每經記者 李少婷 每經編輯 陳俊杰
海天瑞聲CEO王曉東 每經記者 李少婷 攝
5月26日下午“媒體日”活動中,海天瑞聲(SH688787,股價142.58元,市值61.44億元)CEO王曉東宣布升級企業品牌,中文名稱“海天瑞聲”不變,英文名稱由“Speechocean”升級為“Dataocean AI”。
王曉東介紹海天瑞聲時,以數據時代“高質量水泥提供商”自比:“現在叫數據時代,(需要)新基礎設施建設,我們是提供高質量‘水泥’的。高樓大廈平地起,蓋房子、做新基建,都需要‘水泥’,數據時代一切的基礎都需要數據。”
在今日(26日)上午的“中關村論壇”上,王曉東宣布海天瑞聲將首次開放DOTS-MM-0526多模態數據集,包括音頻、視頻、文本等信息,希望借此為中國人工智能開放生態建設貢獻力量。
當前,大語言模型帶來的熱潮仍在持續,海天瑞聲受益于相關概念,市場關注度較高。海天瑞聲對當前的市場有何判斷?
在回應《每日經濟新聞》記者提問時,王曉東表示,數據服務市場當前主要是品牌數據服務商和客戶自建團隊,包括中小型數據服務商構成,“大模型之后,我們的判斷是,整個數據服務市場將進行一次洗牌,集中度也將進行一次提升”。
王曉東認為,競爭主體將通過技術的研發投入以及資源能力建設競逐市場,將研發能力弱、資源資質差的主體將被淘汰。此外,國家對于數據安全和合規要求更高,不具備數據安全合規能力的企業也將被淘汰。而客戶自建團隊部分,或會是出于客戶自身對數據和業務的敏感性和保密性的需求,可能會長期共存。
大模型相關的數據服務與以往有何不同?海天瑞聲CTO黃宇凱表示,大模型在預訓練階段數據的獲取和數據清洗有更高的要求,在微調/對齊階段,需要更高質量的prompt,“這件事情非常難”。這使得對標注人員的要求更多,也需要管理者更好的培訓標注人員。大模型時代另外非常重要的一點是評測回答的價值觀“有用且無毒”,平衡的難度較高。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP