当前位置:首页 > 消费与科技

识别ChatGPT生成内容,首批对标打击工具诞生!

网络3年前 (2023-03-05)消费与科技1438

 识别ChatGPT生成内容,首批对标打击工具诞生!  消费与科技

 

智东西3月2日报道,据英国《金融时报》科学评论员安佳娜·阿胡佳分析,ChatGPT所引用的公开数据中可能包含大量虚假信息,导致生成的文本不准确、不真实。目前已有一些科研机构宣布禁止作者使用ChatGPT,但仍有人会利用其查询资料,该行为将会对科研产生不利影响。

近日,首批打击ChatGPT生成内容的工具也随之诞生。斯坦福学生团队为打击学生用LLM完成书面作业的情况,研发了一款名为DetectGPT的新工具与ChatGPT相抗衡,帮助识别论文是人工完成还是机器生成的。

一、不完美的自动生成,充斥错误数据与虚假信息

尽管ChatGPT回答中仍存在错误,但其快速、拟人的特性使它在某些情况下可用来代替人力,尤其是在学生论文写作和新闻编辑方面。国际文凭组织在3月1日宣布,只要学生在论文尾部注明引用来源,用ChatGPT来撰写论文是可被允许的。

阿胡佳认为,以ChatGPT为代表的大型语言模型(LLM)经过训练可以通过在互联网上搜集相关信息来回答用户的问题,从而生成具备信服力的学生论文、权威法律文件和可信的新闻报道。

但机器学习的数据中往往包含一部分错误数据和虚假信息,导致机器自动生成的文本中充满错误,这种情况也催生了智能识别文本来源工具的研发。在阿胡佳看来,科学也需要努力才能适应这个新时代,区分人工智能与人类智能的重要性与日俱增。

OpenAI首席执行官萨姆·奥特曼(Sam·Altman)于去年12月已警告过,ChatGPT“在某些方面足够出色,反倒给人一种严重误导印象”。他认为公司在ChatGPT的稳定性和真实性方面还有很多工作要做。该公司正在开发加密水印,这是一种机器可读的秘密标点符号、拼音和单词序列,并且还在研发一个“分类器”来区分机器合成文本和人工生成文本,用两种文本分别举例来训练ChatGPT。

二、打击ChatGPT生成内容,首批工具诞生

斯坦福大学的研究生艾瑞克·米歇尔(Eric Mitchell)及其团队提出了一种名为DetectGPT的全新算法,旨在成为打击大学论文中LLM自动文本生成的首批工具之一。该算法用于判断文本是否是机器生成,而且不需要事先或收集数据集。

DetectGPT在工作过程中需要先询问聊天机器人对示例文本的“喜爱程度”(即对文本的人工含量进行分析),“喜爱程度”高则代表自动生成文本与人工文本相似度高,算法再进一步打乱文本、改变措辞,使更改后的文本更具有可读性。研究人员称,在早期测试中,该方法在95%的情况下都能正确区分人类和机器作者。

但需要注意的是,DetectGPT的结果并未经过同行评审,因此无法保证其对机器生成文本判断的可靠性。该工具的其他局限还包括有:当现有的填充模型不能表现有意义的改写空间时,某些域的性能则会降低,从而降低曲率估计的质量;以及相较于其他的检测方法,DetectGPT需要的计算量更大。

三、知名期刊禁用AI创作,避免伪科学泛滥

德国马克斯·普朗克图宾根生物研究所的教授迈克尔·布莱克(Michael Black)曾在推特上说,他对Galactica在自己研究领域的回答感到困惑,它甚至还将一篇虚假论文划分给真正的研究人员。他说:“Galactic大部分内容乍一听是正确且权威的,但实际上是错误的。这种情况非常危险。”阿胡佳认为,他所说的这种危险来自于虚假的引用内容充斥文献并且歪曲了经典。

《Science》杂志现在已经完全禁止AI自动生成文本;《Nature》允许作者在提前声明的情况下使用,但禁止将AI作为共同作者。

在阿胡佳看来,大部分普通人都不会通过正规期刊来验证他们的科学想法,在ChatGPT这类爆发式出现的情况下,大量伪科学的生成可能会进一步污染公共话语体系。

结语:保持工具理性,谨慎对待自动生成内容

ChatGPT本质上是大型语言模型(LLM),其核心意义在于学习并模仿人类语言体系,但对于语言背后的价值体系和事实依据却难以做出恰当的自动衡量。核查事实能力的缺失,使它成为虚假信息滋生疯长的温床。当用户对其采取不加区分的依赖态度时,可能导致潜在的算法操控甚至工具反噬,最终沦为“工具囚徒”。

无论技术发展到何种地步,我们必须清楚“是我们在控制AI,而不是AI控制我们”。

智东西

编译 | 吴菲凝

编辑 | 李水青

想买高性价比的数码产品?使用百度APP 搜索 无忧岛数码家电 关注本站官方百家号

分享给朋友:

相关文章

离802.11ax全面终结802.11n只剩2年?

离802.11ax全面终结802.11n只剩2年?

在Wi-Fi技术演进的20年时间里,无线技术的发展速度已经超出了所有人的预料。而得益于智能手机等移动终端的全面普及,人们对Wi-Fi的需求也越来越高,即便是影响广泛的802.11n,似乎也正从主流电子…

2G网络要关了?GSM退网之后,会对用户产生什么影响?

2G网络要关了?GSM退网之后,会对用户产生什么影响?

如今的智能手机之所以能够实现流畅的上网、看视频、远程语音等功能,除了手机基带芯片技术的不断革新之外,还有运营商网络制式的巨大进步在做后盾。2G网络打电话、3G网络能上网、4G网络能看视频,随着网络制式…

VESA终于出新标准了,新时代的伪真彩终于可以真彩啦

VESA终于出新标准了,新时代的伪真彩终于可以真彩啦

VESA 頒布 DisplayHDR 標準,現有 6bit+FRC 抖色全部出局 R.F.負責制定電腦顯示標準的 VESA 釋出電腦用 DisplayHDR 標準規範,將標準分為 3 個級距,最高亮度…

一次性解決都市綠地、淹水和停車場不足等問題,《Third Nature 》發表遇豪雨可漂浮的停車場!

一次性解決都市綠地、淹水和停車場不足等問題,《Third Nature 》發表遇豪雨可漂浮的停車場!

都市人口和汽車數量都在逐年飆升,當都市遭遇豪雨侵害與颱風侵襲時,電視新聞上時不時就有車子泡水報廢的消息,為此,來自丹麥的築設團隊《Third Nature》想出一套結合綠地與停車場、滯洪池的建築設計,…

日本「最強黑絲」總選舉第一回! 測試30款黑絲舒適度 6款獲評級A (下编)

日本「最強黑絲」總選舉第一回! 測試30款黑絲舒適度 6款獲評級A (下编)

20. GUNZE・Sabrina Heat Top 2枚組易著,但著的時候好勁靜電!質感:B質地的伸縮力:B靜電:D© 由 NM+ 新Monday 提供 日本黑絲 GUNZE・Sabrina Hea…

贬值太快,二手车没人接,电动汽车车主的尴尬如何解?

贬值太快,二手车没人接,电动汽车车主的尴尬如何解?

近几年,随着国家政策向新能源车的倾斜,各地对燃油车的限号、限行,而电动单独摇号、专用号牌、免购置税……坐享众多政策红利,可谓风光无限,销量也成倍增长。目前,中国是全世界电动汽车保有量最大的市场,201…

100萬日元的貓架 其實有錢也未必會買

100萬日元的貓架 其實有錢也未必會買

如果你是個有錢人,又養了疼愛的貓兒們,想為牠們添置一個別出心裁的休息之處,又同時要襯得起出眾的家居裝潢的話,那麼這個售價100萬日元的貓架便最適合不過。看設計就如家居高級擺設一般,而其實卻是個貓兒的休…

Intel 64 處理器硬體全部中招,軟體修復漏洞最高導致 30% 效能下滑

Intel 64 處理器硬體全部中招,軟體修復漏洞最高導致 30% 效能下滑

Intel 自從 Prescott 微架構 E0 版開始能夠執行 x86-64 指令,至今已有 10 餘年以上的時間,但是近日卻爆出重大硬體設計瑕疵,使得在使用者模式之下的程式碼可以繞過部分安全機制,…

世界最大!LG 將發佈 88 吋 8K 電視,但現在的你根本用不上

世界最大!LG 將發佈 88 吋 8K 電視,但現在的你根本用不上

4K的話題大約是在2014年剛起步,當時最多人問的問題就是4K內容的來源在哪裡。過了三年,現在有不少相機廠商在入門機身中加入 4K 影片錄製的功能。之前推出的奧林巴斯 OM-D E-M10 Mark…

Amazon Japan 排行榜 | 2017年 TOP 10 日本熱賣妝品

Amazon Japan 排行榜 | 2017年 TOP 10 日本熱賣妝品

臨近年尾,網購平 Amazon Japan 整理出由2016年11月14日,至2017年11月12日的人氣熱銷產品。而以下就是 2017年的 top 10 日本熱賣妝品 ,當中有不少超受港人歡迎的產品…

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。