由垂直领域头部企业主办的各类论坛已成为每届世界人工智能大会(WAIC)的重要组成部分, 7月 7日,在WAIC开幕的第二天,由语言智能科技企业蜜度主办的“语言智能与内容生成高峰论坛”,在上海浦东世博展览馆拉开帷幕。论坛由国家语委中国语言智能研究中心、中国人工智能学会多语种智能信息处理专委会、哈尔滨工业大学计算学部协办,上海市人工智能行业协会支持。多位业内知名专家学者、行业企业技术专家齐聚现场,交流分享语言智能与内容生成领域的技术创新与应用实践。论坛现场,蜜度发布了自研的国内首个专为智能校对领域打造的垂直大语言模型——蜜度文修。
蜜度文修重磅发布 特定任务表现优于通用大模型ChatGPT
在语言智能与内容生成高峰论坛上,蜜度文修正式发布。唐宋八大家之一的欧阳修曾任馆阁校勘,校对亦有修文之意,“蜜度文修”便取名于此。蜜度文修专为校对这一垂直专业领域打造,在中文拼写勘误、语法纠正任务上的表现显著优于通用大模型ChatGPT。
蜜度文修以大语言模型(LLM)为技术底座,通过运用高质量数据学习多种特色子任务,大幅度提升中文校对和润色能力的智能化程度。截至目前,在公开测试语料评测结果中,蜜度文修实现各类校对项目F1值(模型精确率与召回率的调和平均数,用以阐述模型完成指定任务的质量)的全面SOTA(state-of-the-art,指模型在指定任务中的表现为当前业界最优)。蜜度文修以卓越的实力,不仅辅助专业用户提高校对质量、提升校对速度、降低差错率,也为新闻出版、媒体稿件、政务公文等专业领域带来革命性的工作模式迭代与效率提升,为新时代语言文字工作高质量发展注智赋能。
其实,早在2020年,蜜度就推出了智能文本检测服务,并以深度学习模型为方向,尝试智能化地解决基础校对问题。蜜度还成立了多语言校对检测实验室,围绕“文字标点差错”、“知识性差错”、“内容导向风险识别”三个主要能力开展建设。在2022年的WAIC上,蜜度发布了支持本地化部署的蜜度校对通AI-Box,而这也是首个通过华为昇腾AI生态认证的自然语言处理智能文本校对应用解决方案。2023年初,蜜度智能校对系统成功地入选国家新闻出版署2022年出版业科技与示范创新项目“科技创新成果”。
今年4月,蜜度智能校对多语言版正式上线,除了汉字、英文之外,还覆盖了蒙古文、藏文、维吾尔文、朝鲜文、壮文、哈萨克文、傣文、乌孜别克文、柯尔克孜文、俄罗斯文、彝文、傈僳文共计12种少数民族语言文字。6月,蜜度正式推出中文润色服务,重点解决用词不当、句式杂糅等措辞与表述问题。
一个月后,在2023年的WAIC现场,蜜度推出全新的蜜度文修,让大模型时代的全新工作范式走入校对场景,除了刷新多类校对任务的最佳效果之外,完善了过去较为薄弱的易混词细微语义辨析难题,同时在尊重原意表达的基础上,更好地修正句式杂糅、逻辑错乱等问题,使句子表达更流畅,实现对句子的润色功能。蜜度文修的发布,可以视为蜜度在大模型时代,采用与时俱进的前沿科技积极赋能垂直办公场景的一次实践。
论坛现场还举行了科大讯飞与蜜度的合作签约仪式,科大讯飞开放平台总经理张斌与蜜度首席执行官翟光景签署合作协议。未来,双方将深化各自技术优势,携手推进智能校对产业的进阶,共同赋能行业生态,为更多企业及机构提供高质量的智能化校对服务。
语言智能与内容生成高峰论坛:未来更可期
除了蜜度文修大模型的重磅发布之外,论坛现场汇集了行业洞见思考及先驱科研讨论。论坛由哈尔滨工业大学计算学部长聘教授、人工智能研究院副院长车万翔主持,微博COO、新浪移动CEO、新浪AI媒体研究院院长王巍致辞。