(資料圖片)
500道題目、對標接受過高等教育的人類水平、強調對產業(yè)和生活的實際價值……8月12日,新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布《人工智能大模型體驗報告2.0》(以下簡稱《報告》),訊飛星火以總分1013分位列本次國產主流大模型測評榜首位。
據悉,《報告》嚴格按基礎能力指數、智商指數、情商指數、工具提效指數四大測評維度進行權重設計,訊飛星火在四大評測維度中的智商指數和工具提效指數兩個維度獲得第一,“在工作提效方面優(yōu)勢明顯”。
《報告》認為,訊飛星火具有7大核心能力(即文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態(tài)能力)的訊飛星火認知大模型擁有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執(zhí)行任務。從海量數據和大規(guī)模知識中持續(xù)進化,實現從提出、規(guī)劃到解決問題的全流程閉環(huán)。
在智商評估方面,《報告》認為,人類在智商方面仍然具有明顯優(yōu)勢。課題組分別從常識知識(20%)、邏輯能力(50%)和專業(yè)知識(30%)方面對大模型進行考量,結果顯示,訊飛星火排名第一。
代碼能力無疑是訊飛星火“高智商”的底層能力,8月15日訊飛星火代碼能力將進行重大升級,同時還將推出相關代碼產品成果。
在工作效率提升方面,《報告》認為, AI對人類提供了有力的支持,AI的處理速度遠遠超過人類。然而,盡管AI具有高速度和高效率的優(yōu)勢,但在某些復雜和具有創(chuàng)新性的任務中,人類的智慧和想象力仍然具有無法替代的作用。課題組重點在工具提效(50%)和生成創(chuàng)新(50%)方面進行考量,結果顯示,訊飛星火以350分排名第一并遙遙領先。
《報告》認為,與2023年6月相比,當前中國大模型產品進步顯著,但與接受過高等教育的人類相比,大模型在智商、情商等方面還存在一定程度差距。雖然在不同領域中,AI和人類表現出不同的優(yōu)劣勢,但在整體上,AI大模型的發(fā)展為人類工作和生活的提質增效帶來了重要的積極影響,大模型正在加速走進生活、走進產業(yè)。
關鍵詞:
相關內容
- 新華社研究院發(fā)布國產大模型報告 訊飛星火智商指數和工具提效指數第一 a>
- 利潤公式怎么算初中(利潤計算公式初中) a>
- 與英偉達有合作的吧?天通股份回應 a>
- win7系統(tǒng)電腦兩邊出現黑邊 win7電腦屏幕兩邊出現黑邊怎么還原 a>
- 中信證券:政策落地正處起點而非終點 A股依然處于做多窗口期 短暫波動帶來入場良機 a>
- 時隔近1300天重新啟航,山東邊檢全力保障全省海港口岸國際客貨班輪恢復通關 a>
- RMC:內馬爾即將加盟利雅得新月,恩里克稱他不再是球隊計劃一部分 a>
- 英諾特:紅杉智盛擬減持不超2%公司股份 a>
- 銀行存款并非想象中那么安全?內行人透露:存定期存款請注意3點 a>
- 宇瞳光學:宇瞳轉債網上中簽率為0.0011856348% a>
- 科大訊飛:上半年BC端營收占比達70% a>
- 康希諾:嬰幼兒用吸附無細胞百(組分)白破聯合疫苗啟動III期臨床試驗并完成首例受試者入組 a>
- 吉林省發(fā)布地質災害氣象風險黃色預警 a>
- 北京門頭溝:截至12日18時 第一輪山區(qū)巡診已基本實現全覆蓋 a>
- 打通黨群交流“最后一公里”!蘇州工業(yè)園區(qū)唯亭街道居民共商社區(qū)事,和諧鄰里情 a>
- 重慶冉家壩有一家熱門商場,三條地鐵線在此交匯,地理位置太好了 a>
- 唐韋星:帶著貴州圍棋走向世界 a>
- 靈活用工平臺有哪些稅收風險類型 靈活用工平臺有哪些 a>
- 未來幾天 我國中東部多悶熱天氣 西北地區(qū)出現明顯降溫 a>
- 數字化推動漳州高質量發(fā)展 a>