奇亿娱乐动态

无需申请即可商用昆仑万维正式开源130亿参数大模型

Writer: admin Time:2023-11-05 Browse:88

  10月30日,互联网平台出海企业昆仑万维通知,正式开源旗下自研百亿级大说话模型“天工Skywork-13B系列”,搜罗Skywork-13B-Base、Skywork-13B-Math两大模型。

  并且,每个模型都供给“量化版本”,即或许颠末“模型的退缩”酿成更小规模的版本,最小可在花费级显卡举行打算和推理。

  “与开源角逐注定腐败。”广为传扬的谷歌内部文件《我没有护城河,OpenAI也没有》中这样写说。

  文中进一步评释:“当免费的、不受限度的交换品质量十分时,人们不会为受限度的模型付费。”

  随着百模之战不绝长远和跳级,不少企业都开始面临关源与开源所代表的两种区别商业模式之间的抉择。

  此前,国内已有多家企业官宣开源大模型,但普通修树了授权申请门槛。而据官方讯休,本次昆仑万维官宣开源的两大模型无需任何申请,愿意开拓者直接商用。

  在此之前,阿里云、搜狗创立人王小川所创立的百川智能、清华系公司智谱AI等市场参与者均已宣告了开源大模型。与之比较,昆仑万维官方表明,天工Skywork-13B系列堪称“业内开源最彻底的百亿高质料商用模型”。

  “彻底”体此刻天工Skywork-13B系列,无需开辟者异常申请即可商用。

  相较之下,如今开源社区中的汉文大模型多半并非是完好可商用,寻常开源社区用户凡是须要举办繁复的商用授权申请经过,在某些情况,以至有对公司领域、所内行业、用户数等维度有明确规矩不付与商业授权。

  不只如此,开源百亿参数大模型除外,昆仑万维还同步开源了600GB、1500亿个Tokens(字符)的超大高质料开源汉文数据集。

  启迪者恐怕最大水平地鉴戒才力报告中大模型预教师的经历和经历,深度定制模型参数,有针对性地进行教师与优化。

  从ChatGPT掀起商场高潮之初,老师数据的紧张性就屡被提及。ChatGPT以至诸多大模型产品的中心算法架构Transformer由谷歌在2017年首先提出,其手艺思念早已很是成熟。与之比拟,高质料的锻练数据集,出格是华文数据集仍至极稀缺。

  据华泰证券研报,如ChatGPT教师数据中汉文资料比沉亏损千分之一,仅为0.0991%,而英文质料占比赶过 92.6%;据加利福尼亚大学和Google咨议机构觉察,呆板练习和自然言语惩办模型垄断的数据集50%由12家Top机构供给,个中10家为美国机构,1家为德国机构,仅1家机构来自中原,为香港华文大学。

  昆仑万维官方表明,其本次开源的数据集是方今最大的开源华文教练数据集之一。

  在不少业细君士看来,模型开源和关源之间并没有彰着的周遭,两者结合更有助于企业构修商业化优势。

  如国金证券研报写说的,对于AI算法公司,拣选对外开源有助于行业工夫进取和自己生态构筑,是学界、早期业界以及个人AI始创企业的拣选。日益成熟的生态首创也是推升公司估值的要紧驱动力之一。

  而此刻OpenAI、Google、Meta等领先的头部AI大厂对于进步模型大多选取部离隔源或仅开放安排模式。

  举例而言,2020年OpenAI发表了GPT-3模型,并在论文中较为轮廓地介绍了模型老师景况。用户不妨借助论文不仅或者借助论文复现模型锻练经过,还或许进程API的系统挪用模型资源,属于对外部离隔源;而之后宣布的ChatGPT、GPT-4则并未显现模型锻练细节。

  今年4月份,昆仑万维初度揭晓自研千亿级大言语模型“天工”,并于8月份推出AI榨取产品“天工AI搜刮”。

  昆仑万维方面告诉「市界」,昆仑万维董事长兼CEO方汉是是汉文Linux(一种自由和开放源码的驾驭格局)开源最早的唆使者之一,最早一批加入到开源生态建设的开源“老兵”。本次开源Skywork-13B系列大模型,意愿让更多诱导者们参预到AIGC的才干前进中,下降大模型贸易门槛,慰勉大模型才能的行业落地。

  今年7月中旬,Meta公司颁布了Llama 2大模型的开源商用版本。彼时AI企业猎豹移动的首创人傅盛公然表白:“大模型不再高不成攀,平民化大模型时间仍然到来!像我这样的公司会笑醒在半夜。”

  而结果也实在注释了,在开采者的共修下,Llama 2生态提高极为匆匆,被业界视为抢占OpenAI生态的最矫健力气。

  随着百模大战拼至“中场”,生态的构建一定成为搜罗昆仑万维在内,各家大模型企业的劫夺主旨。

奇亿娱乐动态

CONTACT US

电话:400-123-4567

Email: admin@baidu.com

传真:+86-123-4567

手机:13888888888