Agent、DeepSeek、多模态热点炸场！60+重磅嘉宾共探AI未来2025全球机器学习技术大会完美收官！_华体育app官网

Agent、DeepSeek、多模态热点炸场！60+重磅嘉宾共探AI未来2025全球机器学习技术大会完美收官！

2025-04-24 华体育app官网

　　在万物向“智”生长的 2025 年，AI 领域的热潮持续升温，正引领着技术革新与产业探索的新浪潮。

　　4 月 18-19 日，由 CSDN 联合高端 IT 咨询与教育平台 Boolan 举办的 2025 全球机器学习技术大会（ML-Summit 2025），在上海虹桥西郊庄园丽笙大酒店隆重拉开序幕。本次大会围绕 AI 最前沿的发展的新趋势与落地实践，聚焦大语言模型技术演进、AI 智能体、具身智能、DeepSeek 技术解析与行业实践等 12 大专题，邀请了超 60 位来自全球顶尖科技公司与学术机构的重磅嘉宾齐聚一堂，全面呈现 AI 领域的技术风向与应用前沿。

　　在生成式 AI 重构技术边界的浪潮下，产业实践与学术探索的融合正加速推进。此次大会汇聚了来自微软、百度、阿里巴巴、腾讯、字节跳动、蚂蚁集团、智源研究院、小红书、网易、商汤科技、小米、360、AMD数十家领军企业和组织的技术专家，他们从科研创新、工程落地到产业趋势，带来了兼具深度与前瞻的思考。

　　大会现场座无虚席，技术氛围热烈。演讲嘉宾阵容横跨产学研界，既有理论深度的学术洞察，也有千亿级产品的实战线天密集的专题研讨、案例拆解与圆桌对话，他们深度探索 AI 驱动下的技术范式革新与产业价值重塑。这场融合思想交锋与实践启发的技术盛宴，不仅呈现了行业最新技术脉动，更为开发者、研究者与产品创新者们搭建了深入交流的平台，共同探索 AI 的技术演进路径与未来落地的无限可能。

　　过去一年，大模型的发展速度让人目不暇接，甚至超出了很多人的想象。从文本生成到图像、视频处理，从搜索引擎的革新到编程助手的普及，各大厂商在全力不断突破 AI 的技术边界。如今整个行业呈现出怎样的图景？在 4 月 18 日上午的主会场，CSDN 高级副总裁、Boolan首席技术专家李建忠，加拿大工程院及加拿大皇家学院院士、香港理工大学 AI 高等研究院院长杨强，IEEE Fellow、清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军，数势科技创始人兼 CEO、原京东集团副总裁、原京东商城技术负责人黎科峰等重量级嘉宾带来关于 AI 的深度分享与前瞻思考。

　　在这场大会上，强化学习、扩散模型、DeepSeek 等关键词频繁被提及，成为技术讨论的焦点。那么，强化学习是否会成为 Scaling Law（规模法则）新的驱动力？扩散模型能否继续作为推动模型能力跃升的核心技术路线？DeepSeek 的出现，又会如何重塑开源生态？算力优化的难题，又是否有了新的破解思路？围绕这些核心问题，欢迎回看大会首日视频，看众多技术大咖如何从理论、算法到实际应用层面进行了深度剖析，以此了解 AI 技术的更多最新进展：

　　DeepSeek 范式重构：从大模型平权到企业级智能决策 Agent 的产业革命

　　值得关注的是，在本次主会上，我们正式对外发布了《》。榜单围绕“模型—数据—系统—评测平台”四个核心维度，对当前大模型技术生态进行了全景式梳理与评估。

　　在主会的圆桌对话环节，CSDN 高级副总裁、Boolan 首席技术专家李建忠，加拿大工程院及加拿大皇家学院院士、香港理工大学 AI 高等研究院院长杨强，AMD 人工智能事业部企业副总裁 Ramine Roane，极狐 GitLab CEO 柳钢在格蠹科技创始人、《软件调试》和《软件简史》作者张银奎的主持下，围绕“大模型技术趋势展望与产业落地”主题，就算法、算力、数据三大 AI 核心要素如何驱动大模型持续演进展开了深入探讨。

　　从基础模型的演进到智能体的落地实践，从具身智能的探索到多模态大模型的产业化进展，大模型驱动的 AI 革命正以前所未有的速度席卷各行各业。当前，开发者和企业最关心的已不仅是“模型有多强”，更是“能落地多深、跑多快、做得多稳”。

　　在这一背景下，本次大会以全球视角聚焦 AI 最前沿的发展的新趋势，围绕大语言模型技术演进、AI Agent 实践、具身智能、多模态生成、DeepSeek 技术解析等 12 大专题展开深入探讨，与海内外一线科技公司与高校机构的专家学者，共同勾勒出大模型技术的创新脉络与落地全景。接下来，让我们从这 12 大专题的现场分享中，逐一拆解这些正在重塑未来的技术亮点与实践思路。

　　当大模型突破千亿参数后，技术演进的方向是继续“堆料”还是探索更智能的思维涌现？这一话题正在引发学界与产业界的深度碰撞。从预训练范式的革新到思维能力的塑造，业界正在经历一轮深层次的技术再思考。本专题汇聚了来自新浪微博、阿里巴巴、上海交通大学、复旦大学的一线企业与高校的技术专家，围绕深度思考模型、推理能力演进、强化反馈等关键议题，展开了深入的技术分享与思想碰撞，展现了当下大语言模型演进路径的多元探索。

　　随着 DeepSeek 等新兴模型掀起大模型效率革命，当技术演进面临算力瓶颈与场景适配的双重挑战，大语言模型如何突破 “规模依赖” 实现智能跃升？在模型架构创新、领域知识融合、工程化落地等关键议题上，产学研界又该如何协同破局？

　　在 CSDN &《新程序员》执行总编唐小引的主持下，本次圆桌对话邀请到了新浪微博首席科学家及 AI 研发部负责人张俊林、阿里巴巴通义实验室大模型资深算法总监李永彬、上海交通大学 AI 学院长聘教轨副教授温颖以及智源人工智能研究院数据研究组负责人兼 OpenSeek/FlagAI 负责人刘广，他们围绕 DeepSeek 的技术实践，一同探讨了大模型技术发展的新趋势与现实挑战。

　　从图像到文本、从语音到视频、再到 3D 空间与数字人生成，AI 正在快速迈入“理解+生成”深层次地融合的多模态时代。Sora 等模型的震撼登场为多模态大模型注入了空前的想象力，但其背后蕴含的跨模态对齐、时空建模、生成控制等技术挑战也愈发突出。为此，本专题邀请了来自阶跃星辰、生数科技、复旦大学、腾讯和百川智能等机构的核心技术专家，他们从基础理论到产业实践，揭示了多模态技术未来的发展趋势与潜力空间。

　　Baichuan-Omni-1.5：百川智能在端到端多模态大模型的实践探索

　　毫无疑问，大模型目前正以前所未有的速度重塑软件开发的每一个环节。从代码自动生成、智能补全，到多轮对话式编程、AI Agent 协同开发，AI 正从“辅助工具”走向“智能合作者”。与此同时，如何在成本控制与性能优化之间取得平衡，构建适配不一样的行业需求的代码大模型，成为技术发展的重要课题。本专题汇集了字节跳动、阿里巴巴、快手、百度等一流团队的实践先锋，他们带来的案例分享为软件开发的智能化变革提供了关键指引。

　　如果代码能自己写代码，研发还能被称为一种“技术”吗？从人机协作模式的重塑到开发流程的范式迁移，从工具链智能化到全生命周期自主决策，这场变革正在叩击每个技术管理者的战略神经。但这同时也带来了新的挑战：怎么样才能解决 AI 辅助开发的精准性与稳定性问题？怎样平衡智能化工具与开发者创意的关系？如何推动智能化技术在复杂业务场景中的深度落地？

　　本次圆桌对话由 Boolan 首席咨询师吴咏炜主持，邀请到了商汤科技小浣熊家族技术负责人张涛，DeepWisdom 算法研究员、OpenManus 项目一作梁新兵，以及 CAMEL AI 核心成员、Eigent AI 工程师范文栋，他们既直面了智能编程工具从“效率提升”到“认知革命”的转型阵痛，也为开发者应对技术代际跃迁提供了破局指南。

　　今年年初，DeepSeek R1 的爆火引发了业内广泛关注。它不仅在性能上超越了国际顶尖的闭源大模型，更以开源的方式让开发者得以深入了解先进模型的架构与实现机制。这一开放姿态，不仅推动了模型复现、优化与再创新，也带动了行业在大模型应用上的进一步实践探索。

　　本专场围绕 DeepSeek 技术的底层逻辑、工程路径以及实际落地经验展开。来自智源研究院、微软亚洲研究院、得物、TeleAI 研究院、360 和清华大学的技术专家们带来了他们在大模型系统搭建、推理能力释放、模型治理、强化学习训练等多重维度的实践成果分享与思考。

　　AI 智能体正逐渐从概念变成现实。它不再只是一个执行命令的工具，而是在很多场景下，开始具备理解任务、独立决策，甚至主动协作的能力。与其说它是一个助手，不如说它正朝着“智能搭子”的方向进化。本专场中，来自数势科技、CAMEL AI、DeepWisdom 和上海开源信息技术协会的嘉宾，带来他们在 AI 智能体构建与落地过程中的一手经验。

　　DeepSeek 如何重塑数据智能产品：数势科技 SwiftAgent 的创新与实践分享

　　“大模型的杀手级应用到底是怎样？”这样的一个问题引发了很多人的好奇。有人觉得它可能会改变编程的方式，有的人觉得它将在教育、数字人等领域带来深远影响。在本专场，我们将邀请小红书、网易有道、声网和商汤的技术专家，分享他们在大模型应用开发中的经验，带你了解这项技术是如何一步步落地并改变行业的。也系统本专场为大家提供一个清晰的视角，让你看到大模型如何在实际应用中推动行业变革，也为未来的 AI 探索提供一些灵感。

　　大模型的快速的提升要求底层算力基建一直在升级，如何在 CPU、GPU、NPU 等多种异构算力之间高效协同？怎么样才能解决推理延迟、内存瓶颈与数据调度等核心问题？性能优化已不再是附加项，而是支撑大模型高效运行与规模扩展的核心要素。本技术专场中，我们邀请到了复旦大学、英飞流、蚂蚁集团等资深技术专家分享他们在算力架构、计算优化、RAG 系统演进及推理架构设计等方面的真实实践与技术突破。

　　当大模型成为 AI 应用的基础设施，开发者如何更高效地构建、微调与部署模型？模型微调的边界在哪里？框架设计应优先支持哪些典型场景？向量数据库如何真正释放大模型的上下文能力？在工具链日趋复杂的今天，大模型开发是否正走向“从组件到编排”的新范式？

　　在“大模型应用框架与工具”专场中，来自美国东北大学、Pinterest、字节跳动的技术专家，以及 LLaMA Factory 核心开发者，将围绕大模型训练框架、向量数据库、应用开发体系与多模态微调等关键方向，带领与会开发者深入剖析支撑大模型落地的核心工具与技术体系。

　　这两天，在北京举行的机器人马拉松比赛上，形态各异的机器人穿梭于真实的物理世界中，奔跑、感知、协作，成为不少人关注的焦点。这场融合真实物理挑战的竞技，不仅展示了机器人技术的飞跃，也将“具身智能”这一 AI 热点推上了前沿舞台。随着人工智能从语言理解、图像识别逐步迈向融合感知、决策与执行的一体化能力，具身智能正成为推动通用智能落地的关键路径——让智能体不仅“能思考”，更“会行动”。

　　本次“具身智能”专场，汇聚了来自同济大学、小米、智源研究院、深圳AI与机器人研究院等学术界与产业界的专家，围绕具身智能在认知、系统架构、硬件基础、数据工程等多重维度的核心议题展开深入分享与探讨。

　　“百模大战”进行一段时间后，技术热潮逐渐回归理性，业界开始将目光转向一个更核心的问题：大模型如何真正走进业务、落地产业？在这一背景下，“大模型+行业落地实践”专场应运而生，邀请来自小红书、京东、金山办公、恒生电子研究院、eBay 等头部企业的技术专家，分享他们在不同业务场景中推动大模型技术落地的探索与成果。

　　在大模型迅猛发展的背景下，如何提升其在真实场景中的工程效率与系统稳定性？面对算力瓶颈与推理成本的挑战，底层架构又该如何演进？而当大模型从“模型”走向“系统”，智能化的设施设备、云原生平台将扮演怎样的角色？

　　在“大模型工程与架构”专场中，来自上海人工智能实验室、摩尔线程、建宇智造与 eBay 的一线技术专家们将围绕强化学习、算力优化、智能制造与推理平台等关键议题，分享他们在大模型工程落地过程中的探索与实战经验。

　　为促进 AMD ROCm 开发者技术交流，探索大模型与开源工具的实践应用，AMD ROCm AI 开发者交流会——大模型推理与开源创新专场活动于 4 月 19 日下午拉开帷幕。

　　这次活动聚焦基于 AMD ROCm 的大模型推理、性能加速、开源社区生态建设与工具链实操四大主题，邀请到了 AMD 人工智能事业部生态负责人、AI 软件商品市场技术负责人、AI 开源社区核心贡献者及行业合作伙伴共同分享，通过技术解析、动手实验与实时 Demo 演示，助力 ROCm 开发者提升工程能力与创新效率。

　　本次盛会之所以精彩纷呈，离不开行业专家的深度分享、AI 开发者的热情参与，以及众多合作伙伴始终如一的支持与信任。我们在此特别感谢 AMD、数势科技、Neuriva 纽睿华、极狐、飞瓴德移民、声网、人民邮电出版社异步社区、电子工业出版社博文视点、清华大学出版社对大会提供的全力支持。正是产学研多方的协同发力，让现场成为前沿思想的交汇点与技术创新的孵化场。

　　至此，为期两天的议程已圆满收官。在这场汇聚全球目光的盛会上，来自产业一线与学术前沿的专家学者围绕 AI 基础研究、大模型演进、算力基础设施建设、智能体技术突破以及行业落地实践等热点话题，展开了深入交流与思想碰撞。从技术的探讨到场景的落地，从模型的前沿到系统的支撑，精彩内容接连不断，干货与启发齐飞。

　　未来已来，技术正当时。让我们共同期待，在下一次相聚时，AI 世界将呈现更多可能。

[上一篇] 医学中的机器学习商场增加剖析陈述-规划、比例及趋势调研

[下一篇] 《人类简史》作者怒怼硅谷：智能≠真理AI正在走偏！