胡瀚是核算机视觉范畴通用架构Swim Transformer的中心作者之一。
AI科技谈论独家得悉,前微软亚洲研讨院视觉核算组首席研讨员胡瀚,不久前参加腾讯,顶替已离任的前腾讯混元大模型技能担任人之一的刘威,担任多模态大模型的研制作业。
胡瀚2008年获得清华大学本科学位,2014年获得清华大学博士学位 ,师从周杰教授。博士论文获2016年我国人工智能学会优异博士论文奖。2012年在宾夕法尼亚大学GRASP实验室做拜访研讨,师从史建波教授。随后胡瀚参加百度深度学习研讨所 (IDL) ,该研讨院由余凯挂帅,成为国内最早敞开深度学习研讨的前锋军之一,胡瀚凭仗超卓才能担任tech leader人物。2016年12月,胡瀚参加微软亚洲研讨院视觉核算组。
微软亚洲研讨院视觉核算组有核算机视觉界的“黄埔军校”之称,曾走出孙剑、何恺明、华刚、梅涛、王井东、代季峰、危夷晨、Steve Lin等所谓业界技能领军人物。参加腾讯前,胡瀚在微软亚洲研讨院担任视觉核算组首席研讨员。
这篇论文的四位一同一作分别是来自我国科学技能大学的刘泽、西安交通大学的林宇桐、以及MSRA的曹越和胡瀚。曹越是前光年之外联合创始人,现在创建AI视频公司Sand.AI。林宇桐此前是西安交通大学-微软亚洲研讨院联合培育博士生,现在也在Sand.AI。
刘泽是我国科大与微软亚洲研讨院的联合培育博士生,现在博士结业,在微软亚洲研讨院持续研讨作业。
Swin Transformer的作者还有韦毅轩,清华大学-微软亚洲研讨院联合培育博士生。张拯,现就职于微软亚洲研讨院视觉核算组,担任研讨员。郭百宁,现为微软亚洲研讨院副院长,主要是做网络图形学技能、根据网络使用的虚拟环境技能、几许模型、根据图画的模型和制作、纹路组成、真实感图形图画技能等范畴的研讨。Stephen Lin,是微软亚洲研讨院视觉核算组的研讨员。
2021年末,该团队又进一步提出了 Swin Transformer v2.0 版别,新版别练习了其时停止最大的稠密视觉模型,并在多个干流视觉使命上大大改写了记载。
胡瀚此次参加腾讯,正是顶替刘威此前的作业。十一月下旬,各媒体爆出刘威已脱离腾讯。
刘威,2012年获得哥伦比亚大学核算机科学与电子工程博士学位,在IBM沃森研讨中心担任研讨科学家。期间,刘威曾先后获得 2011 年末 Facebook 博士研讨生奖学金、2013 年度哥伦比亚大学优异博士论文奖、2014 年CVPR青年研讨者奖、2016 年SIGIR最优论文荣誉奖。
刘威于2016年参加腾讯AI Lab,与AI Lab别的两位担任人张潼、俞栋一同,被业界称为“AI Lab三剑客”。在2018年,刘威当选IEEE智能体系10大AI青年科学家;2022年,因对大规模机器学习和智能多媒体的奉献,获得IEEE Fellow。在腾讯时期,刘威的作业主要是面向腾讯产品事务的CV根底大模型、多模态了解大模型、文生图、文生视频大模型等。
腾讯现已在多模态大模型的研制上获得新的发展,12月3日,腾讯宣告,混元大模型上线并开源文生视频才能,参数量 130 亿,支撑中英文双语输入。此前腾讯混元大模型现已连续推出了文生文、文生图、3D生成等才能。此次推出的视频生成才能,被认为是混元系列大模型当时的最终一块重要拼图。