发布史上最强“通用”NLP模型,但号称过于强大怕被滥用而没有开源,遭到网友猛怼、炮轰。而做为创始人之一的马斯克,虽然早已离开董事会,碍于舆论,不得不站出来做出澄清:我早已退出。
原因是,OpenAI并没有公布GPT-2模型及代码,只是象征性的公布了一个仅含117M参数的样本模型及代码,给到的理由:因为这个模型能力太强大了!他们目前还有点hold不住它。一旦开源后被坏人拿到,将会贻害无穷。
之后有网友气不过跑到马斯克推特底下,叫骂OpenAI干脆改名CloseAI。
马斯克表示,已经有一年多的时间没和OpenAI密切合作了,并且也没有管理层与董事会的监督。
而后有网友追问:“一直不知道你为何离开OpenAI,可否给予详细的解释说明?”
我必须集中精力解决大量让人头疼的工程和制造问题,尤其是在特斯拉和SpaceX方面。
此外,特斯拉与OpenAI在人才争夺方面也有一些交集,我并不同意其团队想要做的一些事情。综上所述,希望最好是友好分手。
2015年12月,马斯克与Y Combinator总裁Sam Altman共同创立这个非营利组织研究机构,以研究人工智能的道德和安全问题。
虽然马斯克于去年2月离开了该组织,但却一直被认为是OpenAI主要资助者之一。
OpenAI在去年2月20日发布的官方博客中也提到:“马斯克将离开OpenAI董事会,但仍将继续为该组织提供捐赠和建议。随着特斯拉将更加关注人工智能,这将消除马斯克未来潜在的冲突。”
值得注意的是,马斯克一直是人工智能最大的批评者之一。2014年在麻省理工学院演讲时,他将AI描述为“存在的最大威胁”,甚至称之为“召唤恶魔”。
他还认为人工智能还可以导致第三次世界大战。他补充称,大国之间都不会故意发动核战争,但AI将是最大有可能的、先发制人的取胜之道。
马斯克之所以被@出来说明一个问题:Elon离开OpenAI的消息,还有很多人不知道,或者知道他已经离开了董事会却不知为何,导致他又特意出来发推澄清一下,顺便又蹭了一下OpenAI最近的热点。
OpenAI近日宣称他们研究出一个GPT-2的NLP模型,号称“史上最强通用NLP模型”,因为它是:
踩在15亿参数的身体上:爬取了Reddit上点赞超过三票的链接的文本内容,大约用到1000万篇文章,数据体量超过了40G,相当于35000本《白鲸记》。(注:小说约有21万单词,是电影《加勒比海盗》的重要故事参考来源之一。动漫《海贼王》里四皇之一的白胡子海贼团的旗舰就是以故事主角大白鲸的名字Moby Dick命名)。
无需预训练的“zero-shot”:在更通用的数据集基础上,使用自注意力模块迁移学习,不针对任何特定任务的数据来进行训练,只是作为最终测试对数据来进行评估,在Winograd Schema、LAMBADA以及其他语言建模任务上实现了state-of-the-art 的结果。
下表显示了最先进的zero-shot结果。(+)表示该项分数越高越好。(-)表示分数越低越好。
虽然OpenAI没有在论文中提及具体的计算力及训练时间,但通过公布的数据推测,他们的模型使用了256个谷歌云TPU v3。
然而,OpenAI并没有公布GPT-2模型及代码,只是象征性的公布了一个仅含117M参数的样本模型及代码,相当于他们宣称使用的数据量的0.29%。(有兴趣的读者可以去 查看)
OpenAI给出的理由是:因为这个模型能力太强大了!他们目前还有点hold不住它。一旦开源后被坏人拿到,将会贻害无穷。有点中国武侠小说里,绝世武功秘籍的意思。
于是开发者和学者们不干了,纷纷质疑OpenAI这样的做法显得心口不一。甚至盛产吐槽大神的Reddit上,有人建议OpenAI干脆改名CloseAI的言论,获得了数百网友的点赞。
更有甚者,比如下面这位Ben Recht,还发了一条Twitter长文进行嘲讽:
……我们可完全基于一个不能公开的数据集构建一个超大模型,在我们自己的标准ML范式中很难发生过拟合。
但是,测试集上的一个微小改动就会导致分布结果大幅变化,你可以想见把模型和代码全都公布出来以后会发生什么!
PS 这篇论文还在arxiv等候审核发布,要不是我们的最终版PDF过大,那主要是因为arxiv也学着OpenAI的做法,觉得AI/ML研究太过危险而不能公开。
因为人工智能这个蒸蒸日上的领域正面临着实验重现的危机,AI研究者发现他们很难重现许多关键的结果。
针对主要会议上发表的400篇AI论文的调查显示,只有6%的论文包含算法的代码,约30%包含测试数据,54%包含伪代码。
去年,加拿大蒙特利尔大学的计算机科学家们希望展示一种新的语音识别算法,他们盼望将其与一名著名科学家的算法进行比较。
唯一的问题:该benchmark的源代码没有发布。研究人员不得不从已公开发表的描述中重现这一算法。
但是他们重现的版本无法与benchmark声称的性能相符。蒙特利尔大学实验室博士生NanRosemary Ke说:“我们尝试了2个月,但都无法接近基准的性能。”
另外一群人更担心GPT-2会导致假新闻出现井喷。OpenAI也拿DeepFake举了个例子。
DeepFake由于其强大的图像生成能力,成了一个“假脸生成器/换脸器”,制造出大量恶意的虚假视频音频和图像,最终被禁用。
比如这次,不怀好意的人可完全借助GPT-2,发布有关Elon的假新闻,说他虽然公开宣称去年就退出OpenAI,但实际上私下还在OpenAI身居要职,恐怕也会有很多人相信。
技术是把双刃剑,越是强大的技术,一旦被用于坏用途,约会造成更坏的结果。那么在这场意外掀起的激烈争论中,你站在哪一边呢?
文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。
加入文生视频大模型的战局,AI大模型进入视频生成的阶段,这将进一步刺激AI芯片的需求。
最新模型及其ChatGPT工具的改进版Demo。一位CEO在体验后赞不绝口:“它真的令人惊艳,相较于之前的版
了其首个文生视频模型——Sora。这款模型具备令人惊叹的能力:用户只需通过一句线分钟的高清视频。Sora的
此前,两家科技巨头分别推出自家创新技术: Google Gemini 1.5 Pro与
电子发烧友网报道(文/周凯扬)在生成式AI和大模型带来的AI洪流下,不少大厂都不约而同地选择了自研AI芯片。即便这在某种程度上预示着组建新的团队,花费大量的资金,但从长远发展的角度来看,自研芯片
吗? /
的GPT-4 Turbo以前所未有的功能和价格改变人工智能的未来 在AI领域的一次里程碑式活动中,
的GPT-4 Turbo版本ChatGPT plus有什么功能? /
算是全球大模型的引领者,一举一动都牵动着大家的关注,现在ChatGPT迎来重磅更新。
GPT-4 Turbo模型价格大降2/3 /
的股票出售预计将以员工出售所持股份的方式来进行,而不是公司发行新股来筹集额外资金。 微软持有
有消息显示微软正在筹划开发更低成本的人工智能。当然微软开发的是更小众的;
的合作相类似,未来 Anthropic 将利用 AWS 的高性能、低成本机器学习加速器,在 AWS Trainium 和 Inferentia 芯片上训练和部署其未来基础模型,而 AWS 用户都能够普遍的使用这些模型。
,先于Stability AI和Midtravel的其他文本到图像生成AI艺术平台。到2022年DALL-E 2
Mate手机华为Mate 60 Pro推送最新鸿蒙OS 4 华为Mate 60 Pro这部号称
的Mate手机华为官方已推送最新鸿蒙OS 4.0.0.113版本更新,安装
是什么方向 人工智能(AI)已经日益普及,正在改变我们的方法和方式。AI 涵盖了许多领域,这中间还包括机器学习,计算机视觉,自然语言处理(
的商业模式或发生一些变革;毕竟光靠微软的输血也不是长久之计,而靠收会员号
鸿蒙开发接口Ability框架:【@ohos.application.Ability (Ability)】
飞凌嵌入式ElfBoard ELF 1板卡-在ELF 1开发环境中使用QT Creator进行远程调试