自然语言处理_智能机器人案例_华体育app官网登录|华体会手机版

2024-03-21 智能机器人案例

自然语言处理最新快讯，36氪聚合所有自然语言处理相关的新闻快讯，并为你提供最新的相关资讯。

近日，清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展，其研发的可穿戴人工喉可以感知喉部发声相关信号，并通过人工智能模型将其识别和合成为语音，还原准确率超过90%。这一研究结果为语音识别与交互系统提供了一条新的技术途径，并于近日在线发表在《自然》人工智能子刊《自然·机器智能》上。（中国经济网）

韩联社报道，韩国行政安全部22日表示，本月底开始使用自研人工智能（AI）语音识别软件查办电信诈骗案件。新软件运用最新深度学习技术，拥有包括电信诈骗犯在内的6000多人的100万份不同语种语音样本的数据库，通过与语音样本的匹配更快更准地鉴别讲韩语的犯罪分子。（界面）

36氪获悉，京东云旗下言犀AI应用平台宣布，将推出产业版ChatGPT：ChatJD，并公布ChatJD的落地应用路线”计划包含包含一个平台、两个领域、五个应用。其中一个平台指ChatJD智能人机对话平台，即

中理解和生成任务的对话平台，预计参数量达千亿级；两个领域为零售、金融；五个应用包含内容生成、人机对话、用户意图理解、信息抽取、情感分类。

昨日，谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎（Live Transcribe Speech Engine），它旨在将语音或对话实时转录为文字，还能够为听障人士提供帮助。（开源中国）

技术应用识别技术应用”国际标准的企业。在此之前，中国标准化研究院就已与快商通成立了“声纹识别技术标准化研究基地”“

技术应用标准化研究基地”两个人工智能标准研究基地。依托两大技术标准化基地，中标院与快商通成立“国家

与声纹识别技术应用标准化中心”，未来将为广大中国AI公司可以提供标准制定辅导的服务。

近日，百度研发了具备预测能力和可控延迟的即时机器翻译系统，可实现两种语言之间的高质量、低延迟翻译。在语音识别方面，有别于传统的上下文相关建模技术，百度提出了上下文无关音素组合的中英文混合建模单元，包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

36氪讯，小米新经济研究中心官方微信发文章称，中国科学院信息工程研究所研究员、博士生导师王斌正式加入小米集团，任AI实验室

基础平台的构建及前沿技术的探索与创新。王斌博士仍将担任中科院信工所信息检索团队客座研究员、博士生导师，与学术界一起推动AI技术产学研用的协同创新。

阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN，将全球语音识别准确率纪录提高至96.04%（这一数据测试基于世界最大的免费语音识别数据库LibriSpeech）。达摩院机器智能实验室的语音识别团队主导了这个模型的研发，并宣布向全世界企业与个人开源。（网易）

搜狗IoT产品总监李健涛表示，搜狗独创的基于神经网络的机器翻译技术，实现了语音翻译、对话翻译、文字翻译、图像翻译等丰富的交互翻译方式，可完成61种语言互译。他称，目前“神经网络的机器翻译技术”已经实现大规模商业应用，深入应用到搜狗全产品线中。（证券时报）

36氪讯，今年博鳌亚洲论坛开始采用AI“腾讯同传”，由腾讯翻译君联合微信智聆打造。与传统基于短语的机器翻译不同，腾讯翻译君通过神经网络机器翻译技术，对演讲内容做实时识别、翻译成中英双语字幕进行投屏展示，现场观众可不断利用微信小程序对嘉宾演讲的双语同传内容做回看、收听和记录。

微软（亚洲）互联网工程院宣布率先推出新一代的语音交互技术：全双工语音交互感官，并已完成产品化落地。与既有的单轮或多轮连续语音识别不同，这项新技术可实时预测人类即将说出的内容，实时生成回应并控制对话节奏，从而使长程语音交互成为可能。（IT之家）

功能，能够在一定程度上帮助第三方开发者组织内容，理解客户对企业、产品或地点的感受。谷歌云自然语言API已能进行一些情绪分析，但也只能用“积极”、“消极”和“中性”来划分。而现在，谷歌还能通过这一个API分析用户对具体的产品、地点和企业的感受。这项功能今年5月就与其他更新一同作为测试功能推出，但现在则面向全用户开放。（新浪科技）

近期获悉，搜狗语音交互技术中心代表搜狗参加了WMT2017国际评测比赛，该中心研发的搜狗神经网络机器翻译系统获得中英/英中翻译的双向冠军。机器翻译大会(WMT)是机器翻译领域的国际高端评测比赛之一，代表着全球翻译尖端水准的较量。WMT今年首次增设了中文和英文间的新闻数据翻译任务。此次获得双向冠军的搜狗机器翻译，在比赛中表现出的准确率和速度震动业界，也代表着中国的语音翻译技术，已经迈入世界最前端的顶尖领域。（每日经济新闻）

据界面消息，在9月8日的2017全世界创新者大会上，百度技术委员会主席吴华作了主题为“

技术的发展历史，以及百度在这样的领域一直以来的布局。在今年发布的新一代的人工智能规划中，

也是关键的认知技术。吴华介绍称，目前百度已经在智能交互、智能创作以及智能推荐中应用了

6月8日，哈曼国际发布全新的远程语音识别解决方案 SONIQUETM。该解决方案将面向加快速度进行发展的消费类语音电子科技类产品、企业及机器人语音应用市场，提供有别于传统手动输入的新型语音输入技术。

5月27日，腾讯AI LAB副主任、西雅图人工智能研究室负责人俞栋博士出席在京举办的GMIS，发表了主题为《语音识别领域的前沿研究》的演讲，探讨分享了语音识别领域的四个前沿问题。第一是更有效的序列到序列直接转换的模型。第二是鸡尾酒会问题，即屏蔽掉周围的说话声或噪音，非常好地听懂他/她要关注的那个人的说话声音。第三是持续预测与适应的模型。第四是前后端联合优化的问题。

华为将资助伯克利100万美元，重点聚焦深度学习、强化学习、机器学习基础理论、

、计算机视觉等人工智能热点课题的研究。华为通过与伯克利人工智能研究实验室BAIR的深入合作，能借助其强大的研究团队，力争在人工智能的理论与核心技术方面取得重大突破。

Google今日宣布收购API.ai，后者为一家开发语音识别和自然语言理解工具的勇于探索商业模式的公司。具体的交易内容未披露。除了开发者工具，Api.ai还提供交流助理应用，该应用的用户已超过2000万。考虑到Google已拥有不少自然语言理解和语音识别工具，对Api.ai的技术整合重要性将不言而喻。

谷歌近日正式向公众发布其Beta版的云自然语言API（Cloud Natural Language API），这项新的API能够让开发者获得情感分析、实体识别、语义分析等功能服务。云自然语言API加入谷歌已有的机器学习API阵营，例如已经发布公测版的云语音API（Cloud Speech API）、云视觉（Vision API）以及云翻译API（Translate API），从而为用户更好的提供多平台、多语言服务。

6 月 23 日下午消息，百度语音技术媒体开放日上，百度方面宣布免费开放语音唤醒和自定义语义 2 项技术。百度表示将为开发者提供百度大脑的声学模型和语音模型，基础服务免费，可永久使用。百度语音唤醒技术目前主要使用在于百度小度机器人和百度车联网 CarLife/Codriver，唤醒率达 95%，支持自定义唤醒词和连续表达。自定义语义技术则主要使用在于方言、口音识别。据了解，语音技术是百度目前主要专注的AI研究方向之一，2015 年 11 月，百度首席科学家吴恩达领导的百度硅谷实验室开发的新一代语音识别技术 Deep Speech2，被美国权威杂志《麻省理工评论》列为 2016 年十大突破性技术之一。

据VB消息，微软近日宣布开源一项名为DMTK的分布式机器学习工具包，DMTK由一组服务于分布式机器学习的框架、一个主题建模算法和一个适用于

的字嵌入算法构成，这一切都出自基于MIT许可的GitHub，但微软并未公布开源DMTK的具体时间。微软研究员George Thomas Jr.称，使用这一些工具可使研发人员用更小规模的服务器来处理机器学习。此前谷歌和Facebook均开源了类似的工具，且目前这三家公司均在努力构建机器学习人才库，开源代码意味着办公室之外的人之间可以互相协作，且这一些企业也可以从这些团体中雇佣人员为其服务。

阿里云提供计算与安全服务违法和不良信息、未成年人保护举报电话举报邮箱：网上有害信息举报

[上一篇] 拓尔思董秘回复：NLP（自然语言处理）是一项涵盖自然语言学、计算机科学和人工智能的交叉学科科学

[下一篇] 广东土客大械斗：伤亡数十万、经济受损客家人流落异乡