3月30日,聚集NLP(自然言语处理)范畴的2022言语与智能技能比赛真实开端发动报名。本次比赛联手“千言”数据集开源项目,掩盖跨模态、常识驱动、可信学习等人工智能的前沿课题,发布全新四大使命,并发布中文范畴首个查找常识对话数据集、首个面向实践使用场景的中文大规模阶段检索数据集等多个重磅数据集。
本次比赛由我国中文信息学会(CIPS)和我国计算机学会(CCF)联合主办,百度公司、我国中文信息学会评测作业委员会和我国计算机学会自然言语处理专委会承办,已接连举行四届。
在2021年的上一届评测中,参赛部队报名超越3500支,企业部队占比约20%,掩盖了互联网、通讯、金融、动力、航空航天等多个范畴,高校部队占比约50%,掩盖了清华大学、北京大学、复旦大学、我国人民大学、慕尼黑工业大学、早稻田大学、爱丁堡大学等300多所国内外高校。评测累计收到有用提交成果1万屡次。
据了解,2022年比赛对赛题设置进一步晋级,推出四大全新使命:阶段检索——让机器从大规模语料库中找出相关阶段,评价机器的语义检索及排序的才能;常识对话——让体系具有使用查找引擎常识进行敞开域对话交互的才能;情感剖析可解说性——让情感剖析模型更可解说,从合理性、忠实性等维度评测模型的可解说性,从而推进构建愈加可解说的模型;视频语义了解——让机器对视频进行内容剖析与了解。
在自然言语处理范畴,英文的开源数据集百家争鸣;反观中文数据集,存在开源数量少且涣散的状况。为了推进中文NLP数据和技能的开展,“千言”开源数据集项目应运而生。本次言语与智能技能比赛联手“千言”项目,初次揭露多个最新中文数据集。
封面新闻丨见证“文明+科技”工业新赛道——第二十届深圳文博会亮点频现精彩纷呈