当前位置: 首页>行业 >

14款AI检测软件均不靠谱?手动微调ChatGPT内容之后竟能蒙混过关

来源: DeepTech | 时间: 2023-07-10 23:07:33 |

在 ChatGPT 刚推出的几周内,人们担心学生们会使用该聊天机器人在几秒钟内编写出应付作业和考试的论文。为了应对这些担忧,许多初创公司开始制造工具,承诺可以识别文本是由人写的还是由机器写的。


【资料图】

一个尚未经过同行评审的新研究指出,应对这一挑战的核心问题是,欺骗这些工具并通过检测并不困难。

(来源:Pixabay)

德国柏林技术与经济应用科学大学的媒体和计算教授黛博拉·韦伯·伍尔夫(Debora Weber Wulff)与来自多所大学的一组研究人员合作,评估了包括 Turnitin、GPT Zero 和 Compilatio 在内的 14 种检测工具,它们都声称具备检测 OpenAI ChatGPT 编写的文本的能力。

这些工具中的大多数都是通过寻找人工智能生成文本的特征来工作的,然后计算该文本由人工智能生成的概率。但该团队发现,所有接受测试的工具都很难找到 ChatGPT 生成的文本,因为这些文本都被人类重新排列并被转述工具加工过。这表明,学生只需要稍微调整人工智能生成的文章,就可以通过检测工具。

“这些工具不起作用,”韦伯·伍尔夫说,“它们无法实现它们被创造出来的目的,也不是人工智能的探测器。”

研究人员通过撰写土木工程、计算机科学、经济学、历史学、语言学和文学等多个学科的本科生论文来评估这些工具。他们自己撰写论文是为了确保网上找不到这些文本,不然可能已经被拿来训练 ChatGPT 了。

然后,每位研究人员用波斯尼亚语、捷克语、德语、拉脱维亚语、斯洛伐克语、西班牙语或瑞典语又写了一篇。这些文本会通过人工智能翻译工具 DeepL 或谷歌翻译翻译成英语。

然后,该团队使用 ChatGPT 生成了两份文本,每份都经过了轻微的调整,以隐藏它是人工智能生成的。其中一组是由研究人员手动编辑的,他们重新排列句子并替换单词,而另一组是使用名为 Quillbot 的人工智能转述工具重写的。最终,他们获得了 54 份文件来测试检测工具。

他们发现,虽然这些工具善于识别人类书写的文本(平均准确率为 96%),但在识别人工智能生成的文本时,尤其是编辑过的文本时,它们的表现更差。

尽管这些工具识别 ChatGPT 文本的准确率为 74%,但当 ChatGPT 生成的文本经过稍微调整后,准确率降至 42%。

南澳大利亚大学构建机器学习和人工智能模型的高级讲师维托米尔·科瓦诺维奇(Vitomir Kovanović)表示,这类研究也突显了大学目前评估学生学业的方法是多么过时。他没有参与该项目。

谷歌专门研究自然语言生成的高级研究科学家达芙妮·伊波利托(Daphne Ippolito)也没有参与该项目,她提出了另一个担忧。

她说:“如果要在教育环境中使用自动检测系统,了解其误报率至关重要,因为错误地指责学生作弊可能会对他们的学术生涯产生可怕的后果。假阴性率也很重要,因为如果太多人工智能生成的文本被识别为人类撰写的,检测系统就没有用处了。”

Compilatio 是研究人员测试的工具之一。该工具的开发者称,重要的是要记住该系统只会指出可疑段落,也就是将其归类为潜在的剽窃或可能由人工智能生成的内容。

Compilatio 的一位发言人表示:“文本的作者(学生)是否真正学到了知识,取决于学校和评分的老师,他们可以采取额外的验证手段,比如口头提问、在受控的课堂环境中提出额外的问题等等。”

发言人补充道:“通过这种方式,Compilatio 工具可以成为教学方法的一部分,鼓励学生学习好的研究、写作和引用实践。Compilatio 软件是一种纠正辅助工具,而不是纠正者。”Turnitin 和 GPT Zero 没有立即回应置评请求。

我们早就知道,用于检测人工智能生成文本的工具并不总能按照预期的方式工作。2023 年早些时候,OpenAI 推出了一款旨在检测 ChatGPT 生成的文本的工具,但承认它只能将 26% 的人工智能文本标记为“可能是人工智能书写的”。它警告说,旨在检测人工智能生成内容的工具“远非万无一失”。

然而,马里兰大学助理教授汤姆·戈尔茨坦(Tom Goldstein)表示,这些失败并没有阻止公司推出号称能胜任这项工作的产品。他没有参与这项研究。

他补充道:“其中许多工具都不是特别准确的,但也不意味着完全的灾难。”他指出,Turnitin 以相当低的假阳性率成功地实现了一定程度的检测准确性。人工智能初创公司 Hugging Face 的研究员萨沙·卢西奥尼(Sasha Luccioni)表示,尽管揭示所谓人工智能文本检测系统缺点的研究非常重要,但将这项研究的范围扩大到 ChatGPT 之外的人工智能工具将更有帮助。

对于科瓦诺维奇来说,试图分辨人工智能生成内容的这个想法本身是有缺陷的。他说:“不要试图检测人工智能,要做出一些改变,从而让人工智能的使用变得不再是问题。”

支持:Ren

关键词:

 

热文推荐

14款AI检测软件均不靠谱?手动微调ChatGPT内容之后竟能蒙混过关

在ChatGPT刚推出的几周内,人们担心学生们会使用该聊天机器人在几秒钟

2023-07-10

海军第43批护航编队抵达加蓬利伯维尔进行友好访问

7月8日,结束对尼日利亚的访问后,海军第43批护航编队抵达加蓬利伯维尔

2023-07-10

节能宣传周来啦!看徐汇公共机构怎么做→

开展全国节能宣传周活动是实施全面节约战略、开展节能降碳宣传教育、推

2023-07-10

【何以中国】赓续中华文脉,书写民族复兴新篇章

雄伟壮观的长城,气势磅礴的秦始皇陵及兵马俑坑,历史悠久的丝绸之路…

2023-07-10

2023年全国医疗器械安全宣传周今日启动

2023年全国医疗器械安全宣传周今日启动

2023-07-10

A股机构动向参考 | 无人驾驶再迎催化 互联网卫星产业空间巨大

北向资金今日净流入12亿元,主要买入隆基绿能(601012 SH)、通威股份(60

2023-07-10

已故主持人李咏女儿签约经纪公司,精通五国语言以演员身份出道

李咏女儿将出道

2023-07-10

到赣榆区开展党建交流

为积极拓展基层党组织建设,推动党建和业务工作双融合共提升,睢宁县税

2023-07-10

“工会小站 贴心大爱”工会服务站点双15工程发布会暨启动仪式在京举行

中工网北京7月10日电(记者王鑫)今天,全国总工会在京举行“工会小站

2023-07-10

网络游戏板块涨0.89% 姚记科技涨6.24%居首

网络游戏板块涨0 89%姚记科技涨6 24%居首

2023-07-10

诺辉健康:上半年毛利预期同比增长294.6%至307.3%

诺辉健康在港交所发布公告称,上半年收入总额预期介乎约8亿元至亿元,

2023-07-10

发挥法院职能作用 促进企业刑事合规

随着我国经济的快速发展和社会治理水平的不断提升,企业合规激励机制逐

2023-07-10

香港特区《2023年区议会(修订)条例》刊宪并生效

香港《2023年区议会(修订)条例》(以下简称《条例》)10日刊宪生效,

2023-07-10

卫星互联网技术试验卫星升空 6G布局奔向星辰大海

7月9日晚间,长征二号丙运载火箭在酒泉卫星发射中心点火升空,成功将卫

2023-07-10

土豆打卤面的家常做法(打卤面的家常做法)

诸多的对于土豆打卤面的家常做法,打卤面的家常做法这个问题都颇为感兴

2023-07-10

ChatGPT看得越多赔得越多?受版权保护的作家们纷纷起诉OpenAI

财联社7月10日讯(编辑马兰)OpenAI因ChatGPT陷入了版权大战之中。先前

2023-07-10

优化营商环境|原阳警方破获一起盗窃企业电缆案件

大河网讯近日,原阳警方破获一起盗窃企业电缆线案件,抓获嫌疑人1名,

2023-07-10

每经操盘必知(午间版)丨新能源赛道股集体反弹 创业板指涨1.58%;AI热潮下美股“七巨头”总市值飙至11万亿美元;粤电力A:业绩大增主因是燃料成本下降

北京时间7月10日11:30,上证指数早盘上涨点,涨幅为%,报收点,成交额

2023-07-10

大众集团在美国奥斯汀启动自动驾驶汽车测试项目

大众集团美国公司(VWGoA)宣布将在本月晚些时候在奥斯汀启动首个自动

2023-07-10

美国就业数据“打架”提振金价周线收阳 本周关注CPI数据指引

来源:中国金融信息网转自:新华财经新华财经北京7月10日电上周(7月3

2023-07-10

资讯

北京推出14条秋游文化线路

金秋时节,北京市文化和旅游局以赏银杏品文化为主题,推出14条“叶落的季节——漫步北京赏银杏品文化主题线路”,邀市民和游客以步行、骑行

2021-10-27     
基因编辑发力 培育高质量人源化供体猪

此次人体试验,仅仅验证了基因编辑猪克服异种器官移植的超急性排斥反应,还需解决延迟性排斥反应、消耗性血栓等问题。但通过这次试验,能更

2021-10-27     
中国经济高质量发展步伐稳健 长期向好基本面未变

在全球疫情走势和经济走势趋于复杂的背景下,中国经济巨轮将驶向何方,举世关注。2020年10月26日至29日,党的十九届五中全会在京举行,明确

2021-10-27     
南美解放者杯决赛允许近4.5万观众入场

南美洲足联主席多明格斯25日与今年解放者杯决赛对阵的两支俱乐部负责人会晤,宣布决赛现场观众人数增加到球场容量的75%,即近4 5万人。今年

2021-10-27     
22年从警生涯 面对荣誉他说不要给我报功

9月24日,时任安徽省安庆市公安局迎江分局刑警大队大要案中队中队长周磊因在工作中激烈搏斗引发心源性猝死,倒在了工作岗位上,经医院抢救

2021-10-27     
走近冬奥|五棵松体育中心场馆“黑科技”全面上岗 助力冬

“相约北京”冰球国内测试活动将于2021年11月7日至10日在五棵松体育中心场馆举行,在疫情防控方面,场馆引入了诸多“黑科技”,为防疫安全

2021-10-27