第744章新的功能要求
落基山脉的冬日,将世界简化成了黑白二色,皑皑白雪覆盖了每一寸山岩与树林。
查尔斯那间隐于山间的木屋,烟囱里持续飘出缕缕轻烟。
木屋内与屋外的酷寒截然不同,壁炉里的火焰欢快地跳跃著,燃烧的松木发出啪的轻响,将跃动的橘红色光芒铺满整个房间,也在查尔斯专注的脸上投下明明暗暗的影子。
他坐在壁炉前一张宽大的铺著厚实狼皮的扶手椅里,膝上摊开著那本公司用的通讯笔记本。
此刻,纸张上浮现出的不再是墨水字迹,而是像素画一般的佩内洛的面容投影。
可视通话这个项目测试了很久,但问题不断,画面卡得厉害,声音也时断时续。
「――――基本情况就是这样,查尔斯。」
「乌摸――――里奇教授,在获得了部里的[杂音]授权后,对梅林系统提出了新的功能需求。」
「她希望系统能够增加一个――――作业抄袭判定的功能。」
查尔斯无奈地用回文字对话模式,让她重新汇报。
很快,佩内洛重新汇报,乌姆里奇需要梅林系统安装一个功能。
「可以。」查尔斯回复道,「增加查重功能,在技术上是可行的。
「你回复她,我们会进行开发。」
「原则是,想速度快,得加钱。」
查尔斯发送消息之后,静静地靠在椅子上,炉火的光芒在他深邃的眼眸中跳动,拿起一旁碟子里几颗红宝石留下的坚果,边吃边思考。
乌姆里奇的目的,埃莉诺早一步告诉他。
对于乌姆里奇会利用系统来巩固权力,他并不意外。
抄袭检测,这本身倒不是一个坏主意,至少从技术角度来看,有其价值。
查尔斯对乌姆里奇的动作不再理会,开始进入具体的技术规划层面。
几个小时后,他心中有了底,下达技术指示。
关于这个查重系统,核心技术原理可以围绕两点构建:
其一,基于字符串比较的连续重复字符数」检测,这是基础,将提交的文本与资料库中的内容进行逐字比对。
并设定一个关键阈值,比如默认连续六个及以上单词完全一致或高度相似,即触发标记,并计入整体重复率。
还需要设置一个专业词组库,像专业术语这类固定搭配,应视作一个独立词汇单位进行计算,避免误判。
其二,基于语义识别的「智能比对」,这是更进阶的层面。
系统需尝试理解句子的核心语义,而不仅仅是表面的字符匹配。
即便使用者替换了同义词、调整了语序,若句子的主旨逻辑与原文高度雷同,系统也应有能力识别为「语义重复」。
这项技术更具深度,也需要持续的演进,目标是让简单的、机械性的「同义词替换」伎俩逐渐失效。
「具体的研发工作,交给路易。」查尔斯最后写道,「他在魔法人工智慧领域的积累,最适合负责这个模块的搭建。」