< 基于自然语言技术的智能传播应用与风控分析_华体育app官网登录_华体育app官网登录|华体会手机版

  自然语言处理(Natural Language Processing,NLP)主要研究怎么样用计算机来理解人类语言的各种理论和方法,是语言学、AI和计算机科学的重要分支。NLP主要在海量输入数据基础上,通过计算框架来构建表现语言能力(Linguistic Competence)和语言应用(Linguistic Performance)的模型,并不断提出优化方法,设计出各种实用的系统和系统评测技术。NLP技术涉及语义分析、知识图谱、机器翻译、信息检索和过滤、语音识别和情感分析等不同方面。

  当前NLP技术已在智能传播领域中得到普遍应用。一方面,NLP的行业应用表现出多技术融合、集成化创新发展特征,全方位推动传媒业的数字化、智能化转型;另一方面,正如《2021年斯坦福人工智能指数报告》中指出的,当前NLP技术的发展速度已经远超过了对其进行理解和评估的标准制定速度。然而,该技术在实践中也暴露出技术滥用、算法伦理、数据安全、个人隐私泄露等方面的风险问题,引发行业、监管部门和普通用户的担忧。

  由此,笔者一方面尝试对NLP近年来取得的关键性技术进步及其在智能传播领域的应用现在的状况进行梳理,尤其是最近一年来在智能信息采集与输出、视觉内容生成与修复、智能语音内容合成与还原、AI虚拟主播等场景中的应用拓展;另一方面尝试对NLP存在的问题风险和现行风控措施做多元化的分析,以期为人们正确看待技术创新与行业发展的关系提供参考。

  2021年来,NLP技术在实时信息采集、转化和语言处理等领域取得突破性进展。在国外,Meta AI(原Facebook AI)发布的多语言模型XLS-R可以在英语和其他21种语言之间完成翻译,使机器翻译的结果更接近人工翻译。英伟达的GauGAN2模型可根据用户输入的简短关键词迅速生成相应图像,并根据文本内容的调整来来优化,实现从自然语言向图像的智能转换。谷歌也发布了适用于开放对话情境的LaMDA语言模型,可以更好地理解对话语境,并在未经训练的情况下进入新的对话,突破了以往AI应用只能执行预设的狭义路径、没办法理解情感语义且内容重复率高的局限。

  在国内,NLP技术与业务场景进一步融合,从信息采集、编辑输出到审核等所有的环节推动新闻媒体从机器写作向智能化内容生产的实践升级。首先,智能辅助工具向多功能一体化发展。科大讯飞公司的“讯飞智能办公本X2”在2021年两会期间为新华社记者正常采访提供了有力支撑。该设备不仅能录音,还可以自动将记者提问和代表作答进行分区,并提取关键内容,提升记者输出稿件的速度。其次,智能一体化平台推动“人机协同”的内容采编模式成熟。人民日报智慧媒体研究院推出的“智能创作机器人”在两会期间支持记者独立完成采访、拍摄、新闻素材分析和富媒体内容创作等工作,并可根据实时热点分析突出新闻的亮点。在短视频、直播领域,快手基于实时流式ASR技术,在大规模直播和短视频场景中无缝嵌入了低延迟智能语音输入法、语音助手、相机实时字幕等功能,既简化了平台主播的操作,又提升了受众的参与感和“临场感”。

  智能内容生成技术在提升信息采集、输出效率的同时,也给网络原创内容的著作权保护带来了新的风险与挑战,尤其在自媒体的内容生产中催生出一条利用NLP技术方法“洗稿”的灰色产业链。部分互联网公司利用AI洗稿软件大量抓取网络优质原创内容,在经过同义替换、文本改写后迅速形成新的文章发布出来。随着NLP技术的慢慢的提升,这种侵犯权利的行为已从文本范畴升级到了短视频领域。此类技术滥用行为不仅侵害了原创作者的合法权益,还扰乱了正常的网络内容创作生态,更增加了对AI编创行为进行认定的难度。对此,业界已尝试引入智能侵权检测算法作为预防和解决著作权纠纷的辅助机制,如YouTube的自动化著作侵权检测和处理系统、中国版权协会版权监测中心采用的版权内容指纹特征比对技术等。NLP技术在信息采集与输出上相对来说还是比较成熟,应用也较多,如何在规制层面出台有明确的目的性的智能内容生成工具使用的法律和法规和管理制度还有待进一步加强。

  在影视行业,以Deepfake为代表的人脸视频深度伪造技术、AI渲染上色等智能视觉技术的突破也不断催生出新的业态。在国外,Deepfake技术与AI配音技术的融合在影视制作领域获得了新的应用赛道,成为新型冠状病毒肺炎疫情大流行背景下行业“破局”的重要抓手。2021年,英国公司Flawless针对多语言译制片中角色唇形不同步的问题推出了可视化工具TrueSync。该应用通过AI学习演员头部3D模型来调整其面部微表情画面,解决了传统影视换脸特效镜头资金消耗量大、人力时间成本投入高的问题。加拿大创业公司Jali Research通过Deepfake技术和AI配音工具为科幻角色扮演游戏《赛博朋克2077》提供多达10种语言的本地化支持。该应用将不同语言的音素准确映射到角色的嘴型上,令游戏角色在语言模式切换后仍能呈现出自然的表情和对话效果,极大地推动了《赛博朋克2077》的海外销售。

  在国内,AI渲染上色技术、智能超分算法等计算机视觉技术开始应用在老视频和图片修复中。中央广播电视总台央视频5G新媒体平台与中国电影资料馆综合采用人机交互式AI上色技术和传统影片修复手法对经典电影《永不消逝的电波》进行了黑白转彩色4K修复。在对原片超过16万帧的黑白影像进行逐帧修复后,该片于2021年国庆期间成功登陆院线,令广大观众得以重温经典。西瓜视频也联合火山引擎,运用智能处理AI算法对《哪吒传奇》、《黑猫警长》等百余部经典影片进行了4K修复。

  智能视觉生成技术在降低行业成本投入、提升用户视觉体验的同时,也引发了技术伦理和法律层面的争议。对Deepfake等技术的滥用和恶意使用会产生网络低俗、色情内容;为满足大规模数据集训练而进行的人脸识别、表情识别等方法可能在无形中对公民的肖像权、名誉权等造成侵害;经过恶意伪造的内容甚至有可能对企业信誉和媒体公信力等造成不好影响,严重时可能会引起社会信任、媒体公信力、社会公共安全受到威胁。法律层面,智能伪造视频/图像向司法领域的渗透严重挑战了案件事实认定的准确性和裁判结果的公正性。在国外,许多基于AI换脸技术的软件应用都成了抹黑公众人物、激化社会矛盾甚至操纵舆论的技术推手。在我国,也发生了网站UP主擅用明星肖像进行AI换脸和视频二次创作的侵权事件。这些现象引发了各界对人工智能技术滥用个人生物识别信息、威胁社会秩序和安全的担忧。

  对此,各国政府相继出台了相关的监管制度,如美国众议院提出的《深度伪造责任法案》、欧盟的《通用数据保护条例》等。在我国,2021年3月,国家互联网信息办公室和公安部牵头,就部分语音社交软件的涉“深度伪造”技术应用未履行安全评估程序的问题,对11家公司进行依法约谈,以督促其认真开展安全评估和完善风险防控机制和措施。同时,针对“深度伪造”合成内容做识别、监测和反向还原的AI工具、平台等陆续问世,如美国国防部高级研究计划局设立的“媒体鉴证”项目、谷歌公司发布的深度伪造视频识别数据集、香港科技公司Sense Time联合南洋理工大学设计的人脸伪造测试基准、北京大学与微软亚洲研究院联合推出的深度伪造识别工具Face X-Ray等。上述政策法规和应用均为遏制和防范“深度伪造”技术的大规模滥用提供了有力支撑。能预见,未来与自然语言处理等人工智能技术相关的数据安全和个人隐私信息安全问题还将继续受到重视,有关规定法律法规也将进一步出台和完善。

  2021年,基于NLP的高保真AI合成音效技术取得突破性进展,赋予了智能语音应用更加类人的“联想能力”和“推理能力”。在国外,硅谷公司Deepdub尝试在AI翻译中使用影视演员的原声。该公司基于深度学习、信号处理、特征建模、神经风格迁移等技术,让系统对音轨资料中的演员声音特征进行记录和学习,以便在新台词的多语言翻译中获得自然的配音效果。目前,该技术已经应用在影片《Every Time I Die》的拉丁美洲西班牙语和葡萄牙语翻译中,翻译后的作品将由Netflix面向美洲观众播出。

  在国内,小冰公司也发布了全新的超自然语音技术,使人工智能语音效果可媲美真人声音。该技术还突破了人工智能交互主体的单一场景应用限制,在2021年9月发布的社交平台APP“小冰岛”当中,支持不同角色的人物在对话、唱歌等不同场景中进行高度拟人交互。QQ浏览器在深度挖掘真人语音中的节奏、语调、韵律感等特征后,用StyleTTS合成框架生成了更贴近真人音效的语音内容,并应用在自带的“听书”功能中。喜马拉雅也对评书表演艺术大师单田芳的声音进行了还原和应用。

  智能语音合成技术赋予了影视创作和社交机器人等应用更生动、逼真的效果,但从法律角度来看,也对社会安全、法律和法规的健全完善和执行等带来了新的挑战。例如,“语音伪造”向司法领域的渗透正成为一种新的安全威胁。英国媒体2020年就报道了一起妻子企图利用软件篡改音频内容,捏造丈夫“暴力”形象以争取儿童监护权的案件。同时,“声纹”作为个人重要的生物识别信息之一,其在数字技术条件下的可复制性、可获得性和可冒用/盗用性也加剧了各界对公民“身份盗窃”风险的担忧。

  在对智能语音合成内容的潜在风险应对和规制上,美国主要依据的是针对深度伪造技术制定的系列法案(如前文提及的《深度伪造责任法案》、《恶意伪造禁令法案》、《深度伪造报告法案》等);而欧盟则主要借助《通用数据保护条例》等现有法律规范,来针对个人生物识别信息的滥用问题进行回应和规制。在我国,2021年国家网信部门起草的《网络数据安全管理条例(征求意见稿)》也针对数据处理者收集、处理、利用声纹等个人生物特征的情况提出了新的要求和规定。网信、公安、反诈中心等监管和执法部门也联合国内头部人工智能技术企业、高校和科研机构,商讨推出对智能语音合成技术滥用有关问题风险的应对之策,如发展伪造语音检测技术、举办语音伪造竞赛、开展科普活动等。未来,如何从技术、法律和行政管理等各个方面“齐头并进”,在促进智能语音技术创新和应用的同时,加快推进公民声纹信息等隐私信息保护的立法和实施,加强对涉智能语音类应用和服务的监管和规制仍会是学界、业界和监管部门持续关注的重要议题。

  AI虚拟主播是在人类形象基础上,利用虚拟图像、语音识别、深度学习等人工技术捕捉海量数据形成的合成形象,可以根据给定的数据进行拟人化的视频内容演绎。AI虚拟主播是最近两年媒体迈向人工智能的一个热点应用。

  AI虚拟主播多以“数字人”的身份出现在动画、影视、游戏和文娱虚拟偶像等场景中。2021年,AI虚拟歌手FN Meka在TikTok发布的新单曲《Speed Demon》热度超过线万的粉丝观看。FN Meka被赋予了个性、独立、平权等嘻哈文化特征。他还活跃在各大社交平台上,积极向用户分享自己的“业余生活”。

  在我国,AI虚拟主播在社会场景中的应用也不断深化。首先,各大主流媒体和科技公司进一步加大研发投入。新华社媒体融合生产技术与系统国家重点实验室联合腾讯互娱NExT Studios打造的数字人“小诤”就在神州十二号载人飞船发射期间同时扮演了记者和航天员的角色。在刚刚结束的2022年北京冬奥会中,央视新闻与百度智能云推出的AI手语主播已全面投入使用,在语音识别、机器翻译等NLP技术的支持下为听障用户提供手语赛事资讯。其次,AI虚拟主播也被投入到“电商直播带货”的商业场景中,如创壹视频推出的虚拟美妆达人IP“柳夜熙”、燃麦科技推出的“超写实数字人”AYAYI等。截至2021年11月,我国已有10家虚拟偶像技术供应商和运营公司先后获得资本投资。

  一方面,AI虚拟主播的技术还是以单向信息传播为主,虽然可以顺利执行新闻播报等任务,但在网络中的双向信息传播还有很大缺陷,即不能进行多轮对话和基于语境对话;另一方面,AI虚拟主播在直播带货、演艺代言等领域的应用也催生了行为主体身份难以界定、监管措施无从开展和法律归责难以认定等一系列新的问题。而在行业积极利用新技术逐利的背景下,现行的法律和法规和市场监管机制却仍停留在探索真人主播权责问题的阶段,学界对这一现象的研究也存在较大的空白,或偏向技术哲学视角。这种“实践应用先行,政策相对滞后,理论有待深化”的现状亟待引起重视。

  首先,自然语言处理技术在传媒领域的应用还处于初级阶段。作为AI研究领域的关键技术,NLP正从信息采集与输出、数据整合、语言识别、生产要素创新等不同方面带动着传媒业的数字化转型。但当前NLP技术在智能传播领域的应用还处于“初级产业化阶段”,即只调动了部分运算智能来解决具体问题。据《2020人工智能中国专利技术分析报告》显示,“我国自然语言处理技术领域专利技术布局正处于活跃时期,是创新主体关注的重点”。也就是说,传媒业为NLP技术提供了大量的使用场景,NLP技术与传媒的结合将在未来一段时间里是我国新技术的创新突破点。

  其次,对NLP技术在传媒领域中的应用,有拥抱技术与担忧技术两种矛盾心态,我们该怎么样看待这两种形态?

  其一,NLP是AI在传媒领域应用最为深入的技术之一,慢慢的变成了传媒业转型的一项重要构成内容,并加速度推进着传媒生态的变革,这个趋势是不可逆的。社交机器人、智能语音助手、虚拟主播等已经在传媒业中大范围的应用,与图形图像结合的应用也大量出现,对于传媒业来说,不拥抱NLP等新技术就从另一方面代表着要承担被挤出信息场的风险。5G时代,在计算机算力大幅度的提高和云计算、物联网等关键性技术保障持续发展进步的背景下,基于NLP的智能传播也将继续开拓更多的想象空间,如将视觉问答、视觉扎根对话、图像字幕等创新技术融入智能出行、智能家居、数字健康、艺术创作等更广泛的应用场景当中,推动社会生活的数字化、智能化转型。

  其二,NLP技术的快速的提升在带动行业创新的同时,也引发了一系列的问题与风险,如何防范NLP技术应用带来的问题也很重要,如虚假信息、侵害著作权、泄露隐私、妨碍司法等问题。对此,社会各界的态度不一。但仅仅因为技术存在两面性和潜在风险便对其报以质疑、恐慌甚至全盘否定的态度并不可取。对传媒行业来说,应当在充分接触和了解的基础上进行应用,从规范性、道德伦理和社会责任等方面着眼,提升自身对新技术的驾驭能力和数字治理能力。技术是一把双刃剑,在享受技术便利的同时,怎么样看待技术对原有生活方式的改变?怎么样看待技术带来的负面效应?这样一些问题是社会持续健康发展永恒的问题,对NLP技术也一样,这是硬币的两面,不能因噎废食。

  最后,面对NLP技术全方位向传媒领域渗透,新闻传播行业从业者怎么样应对?一是要积极拥抱新技术,不能“谈新色变”或产生畏难心理。二是定位清楚新闻传播从业者是使用技术的,不是开发技术的,就好比人们只需要及时学会不一样的汽车的驾驶技术做运输,不需要为如何造车担忧一样。三是在具体工作中需要及时把握技术动向,促进技术逻辑与业务逻辑的融合,全方面推进行业的数字化、智能化转型,善于尝试新技术新手段才能有创新和跟上智能传播的步伐。(作者单位 何苑 河北大学新闻传播学院,张洪忠 北京师范大学新闻传播学院,张尔坤 英国格拉斯哥大学)

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

CONTACT US
欢迎随时与我们联系