12月1日,阿里云通義千問720億參數(shù)模型Qwen-72B宣布開源。隨著Qwen-72B的開源,通義千問還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實現(xiàn)“全尺寸、全模態(tài)”開源。
據(jù)介紹,此前,中國大模型市場還沒出現(xiàn)足以對標(biāo)Llama 2-70B的優(yōu)質(zhì)開源模型。Qwen-72B填補了國內(nèi)空白,以高性能、高可控、高性價比的優(yōu)勢,提供不亞于商業(yè)閉源大模型的選擇?;赒wen-72B,大中型企業(yè)可開發(fā)商業(yè)應(yīng)用,高校、科研院所可開展AI for Science等科研工作。
如果說Qwen-72B“向上摸高”,抬升了開源大模型的尺寸和性能天花板;發(fā)布會上的另一開源模型Qwen-1.8B則“向下探底”,成為尺寸最小的中國開源大模型,推理2K長度文本內(nèi)容僅需3G顯存,可在消費級終端部署。
從18億、70億、140億到720億參數(shù)規(guī)模,通義千問成為業(yè)界首個“全尺寸開源”的大模型。用戶可在魔搭社區(qū)直接體驗Qwen系列模型效果,也可通過阿里云靈積平臺調(diào)用模型API,或基于阿里云百煉平臺定制大模型應(yīng)用。阿里云人工智能平臺PAI針對通義千問全系列模型進行深度適配,推出了輕量級微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗證、在線服務(wù)部署等服務(wù)。
阿里云是國內(nèi)最早開源自研大模型的科技企業(yè),8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單,得到中小企業(yè)和個人開發(fā)者的青睞,累計下載量超過150萬,催生出150多款新模型、新應(yīng)用。發(fā)布會現(xiàn)場,多位開發(fā)者伙伴現(xiàn)身說法,分享了他們用Qwen開發(fā)專屬模型和特定應(yīng)用的實踐。
阿里云CTO周靖人表示,開源生態(tài)對促進中國大模型的技術(shù)進步與應(yīng)用落地至關(guān)重要,通義千問將持續(xù)投入開源,希望成為“AI時代最開放的大模型”,與伙伴們共同促進大模型生態(tài)建設(shè)。
同日,首屆“通義千問AI挑戰(zhàn)賽”開賽,參賽者可免費暢玩通義開源模型家族,包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道,前者聚焦通義千問大模型的微調(diào)訓(xùn)練,希望通過高質(zhì)量的數(shù)據(jù)探索開源模型的代碼能力上限,后者鼓勵開發(fā)者基于通義千問大模型和魔搭社區(qū)的Agent-Builder框架開發(fā)新一代AI應(yīng)用,促進大模型在各行各業(yè)的落地應(yīng)用。即日起開發(fā)者可通過天池平臺報名參賽。
轉(zhuǎn)載請注明來自浙江中液機械設(shè)備有限公司 ,本文標(biāo)題:《阿里云通義千問720億參數(shù)模型宣布開源》
還沒有評論,來說兩句吧...