专家谈网络语言管理:优化开云体育官方网站技术提升网络语言的智能化治理能力
发布时间:2023-06-09
 数字内容生态实验室6月8日发布了《网络不规范用字用词现象研究报告》,报告通过对数字报、客户端、微博、开云体育官方网站网站、微信、短视频平台七大类别信源的136万不规范字词梳理分析,总结形成网络不规范字词现象的原因并提出建议对策。  针对网络不规范字词现象以及网络语言管理,中国传媒大学国家语言资源监测与研究有声媒体中心主任邹煜撰文《关注网络语言生活:监测与治理刍议》指出,不规范尤其是低俗化的网络

  数字内容生态实验室6月8日发布了《网络不规范用字用词现象研究报告》,报告通过对数字报、客户端、微博、开云体育官方网站网站、微信、短视频平台七大类别信源的136万不规范字词梳理分析,总结形成网络不规范字词现象的原因并提出建议对策。

  针对网络不规范字词现象以及网络语言管理,中国传媒大学国家语言资源监测与研究有声媒体中心主任邹煜撰文《关注网络语言生活:监测与治理刍议》指出,不规范尤其是低俗化的网络语言甚至会从网络空间渗透到现实生活中,对语言安全、文化安全、意识形态安全产生不良影响。

  语言的发展与社会的发展共变,随着互联网时代特别是移动互联网时代的到来,网络语言已经深入到我们语言生活的各个方面,引起了大家的普遍关注。

  网络语言一方面大大丰富了我们的语言生活,例如,“汉语盘点2021”发布的十大网络用语“觉醒年代”“破防”等,其中“破防”让人记住了生活中的那些拼搏的瞬间,并感动和激励着每一个人,更致敬每一位奋斗者。但另一方面网络语言也经常受到质疑和批评,开云体育官方网站成为网络空间治理的对象之一,如错别字、词语误用、语法错误、标点符号误用等问题,这不仅对推广普及国家通用语言文字造成一定的冲击,也会降低公众尤其是青少年的语言规范意识及能力。一些不规范尤其是低俗化的网络语言甚至会从网络空间渗透到现实生活中,对语言安全、文化安全、意识形态安全产生不良影响。

  自2005年开始,国家语言资源监测与研究中心开始组编《中国语言生活状况报告》系列(以下简称“绿皮书”),定期发布媒体语言使用实态。当年的绿皮书就发布了基于中文BBS语料库对网络语言使用情况的调查报告。第二年,监测语料来源拓展为网络新闻、博客、开云体育官方网站BBS三类,对网络语言应用情况进行更大范围的监测。在搜集到丰富数据的同时,各部门也相应展开了对于不同领域网络语言使用情况的分析工作。自2012年开始,“汉语盘点”活动增加了年度十大网络用语的发布内容。年度十大网络用语是基于国家语言资源监测语料库(包含视频弹幕、网络论坛、新闻等不同媒体形式的语言资源),采用“以智能信息处理技术为主,兼顾领域专家意见和相关站点收录情况”的方式获得的,反映了鲜活生动的网络语言生活。2017年,国家语言资源监测与研究有声媒体中心针对网络用语低俗化现象进行了系统监测,并在2018年出版的绿皮书中发布了《网评低俗词语使用调查》,为网络语言规范治理提供参考与对策指导。

  同时,国家语言资源监测与研究有声媒体中心编纂的新词语编年本词典也记录下了每年新产生的网络用语,比如2021年的“躺平”“yyds”“绝绝子”,2022年的“雪糕刺客”“一墩难求”“赢麻了”等,这是对网络语言档案式的记录。

  2021年11月30日,国务院办公厅发布的《关于全面加强新时代语言文字工作的意见》指出,要加强语言文明教育,强化对互联网等各类新媒体语言文字使用的规范和管理,坚决遏阻庸俗暴戾网络语言传播,建设健康文明的网络语言环境。网络语言的治理得到了各方的共同关注,如何治理成为讨论的热点。

  首先,关注并持续监测网络语言生活,及时修订相关法律法规,完善平台监管机制。为推动国家通用语言文字的规范化、标准化及其健康发展,自上世纪90年代以来相关部委便陆续颁布了相关的法律法规及政策,包括《中华人民共和国国家通用语言文字法》《广播电视管理条例》,以及关于规范广播电视节目用语的相关通知等。2020年,教育部公布了《信息技术产品语言文字使用管理规定》征求意见稿。现有的相关法律法规只是针对于传统媒体中的用语规范,而对于新媒体而言,还没有相应的政策法规对其用语规范进行约束和治理。

  其次,大力开展技术协作,不断优化技术手段,提升网络语言的智能化治理能力。截至2022年12月,我国网民规模达10.67亿,人均每周上网时长为26.7个小时,其中短视频用户规模为10.12亿,占网民整体的94.8%。由此可见,人们的网络活动越频繁,使用网络语言就越多,加上媒体融合传播技术的发展更使得网络语言多模态化,对于海量的多模态化网络语言的监测难度日益加大。再者,网络上大量使用的数字、字母、谐音等被用于隐晦地表达低俗内容,因其拼写简易,极易被大量复制和传播,成为网民发泄极端情绪的出口。这类表达让人难以识别,也大多能规避平台审查,且其表达形式层出不穷,更易造成谣言扩散和追风模仿,产生恶劣的社会影响。因此,利用技术手段治理网络语言成为必然选择。大数据时代为语言治理提供了新的契机与挑战,随着人工智能技术与深度学习的不断发展,自然语言处理的难题不断得到解决,这为网络语言的智能化治理提供了技术支撑。

  最后,强化媒体社会责任,坚持做好舆论引导、传播主流价值,尤其是要加强语言知识和语言规范意识的引导。在新的媒介生态中,媒体履行社会责任虽然存在着许多不足和困境,但做好舆论引导、传播主流价值观依然是其首要任务。2020年7月,“祖安文化”曾引起大家的高度关注,新华社、人民日报等先后以《“祖安文化”,真的该管管了!》《把“祖安”这种文化垃圾彻底清理干净》为题发表文章,这不仅让更多的人了解并认识了“祖安文化”及其危害性,还通过媒体的发声对其进行批评。媒体通过探讨如何加强治理,寻求治理之道的同时,也很好地引导了舆论,传播了主流价值观。