ChatGPT在面世的短短几个月内让公众看到了人工智能的奇妙和恐怖。谨慎使用并善意使用,它是一个可以激发创造力、消除空白页综合症并提高工作效率的强大工具。不幸的是,ChatGPT 使教育的捷径变得太容易了,因为人工智能可以用来写论文和参加考试。这就是 GPTZero 的用武之地。
GPTZero 是普林斯顿大学学生 Edward Tian 创建的 ChatGPT 检测工具,您现在可以使用它来确定您正在阅读的内容是否由 AI 生成。就是这样。
什么是 GPTZero?
GPTZero是一种网络应用程序和服务,旨在检测一段文本是由人类还是人工智能编写的。田是普林斯顿大学计算机科学专业的 22 岁本科生,曾在微软实习,是 GPTZero 的开发者。
GPTZero 于 2023 年 1 月 2 日首次通过 Tian 的推文宣布,作为帮助检测 AI 剽窃的工具。田指出,该分析是基于普林斯顿博士的研究。候选人 Sreejan Kumar 和普林斯顿自然语言处理小组的工作。
该分析基于与@sreejan_kumar和@princeton_nlp正在进行的一些研究。希望我们能尽快发布一些经验性的东西。但与此同时,这是一个有趣的应用程序:)
—— Edward Tian (@edward_the6) 2023 年 1 月 3 日
GPTZero 是免费的吗?
GPTZero 专为教育工作者设计,但任何人都可以免费使用。情况不太可能总是如此。服务条款提到某些服务可能会收费。还提到为注册的新用户提供 30 天的免费试用。
GPTZero 不是一个开源项目,如果没有 Streamlit 的帮助,Tian 将面临高昂的托管费用,Streamlit 是一个 Python 应用程序框架,为 Streamlit 应用程序提供免费的云服务。虽然 GPTZero 的流量只是 ChatGPT 所享有的流量的一小部分,但即使是OpenAI 也决定开始收费以抵消其成本。
尽管 Streamlit 托管是免费的,但这通常会限制此共享平台上的带宽和资源。这会限制像 GPTZero 这样的流行应用程序的使用。
Streamlit 目前正在通过增加 GPTZero 的应用程序内存和托管津贴来帮助田。如果它继续快速增长,这种情况可能会改变。
感谢@DataChaz和@streamlit团队的其他成员慷慨地提升了 gptzero 的托管和内存:))
—— Edward Tian (@edward_the6) 2023 年 1 月 4 日
GPTZero 准确吗?
有人声称 GPTZero 可以被愚弄。在 Reddit 用户Smellz_Of_Elderberry的建议下,我让 ChatGPT像高中生一样写了一篇关于《老人与海》这本书的简短故事。GPTZero 没有被愚弄。
我又试了一次,修改了一些标点错位、动词时态不正确和其他小错误的文本,但 GPTZero 仍然说,“你的文本很可能完全是由 AI 编写的。”
这里的关键词是“可能”,开发人员从未承诺 GPTZero 是完美的。GPTZero 的准确性仍在评估中,但有趣的是,它似乎对大多数人都有效。
如果您使用 GPTZero,请务必记住可能会出现错误。在使用 GPTZero 检测 AI 或 ChatGPT 帮助编写文档时,您仍然需要检查工作是否有错误。
GPTZero 是如何工作的?
GPTZero 分析文本的随机性,称为困惑度,以及文本中这种随机性的均匀性,这在统计学上称为突发性。人工智能在困惑和突发性方面非常一致,而人类作家会在没有任何意识的情况下改变这些特征。
这项工作尚未完成,Tian 指出将添加更多测试以提高 AI 文本检测的准确性。特别是,隐性偏见是一个正在探索的领域,作为检测文本是否由 AI 生成的另一种方法。
我们现在仍在研究 LM 生成的文本中的隐含偏见,因此希望能添加更多测试和因素来改进模型
—— Edward Tian (@edward_the6) 2023 年 1 月 3 日
我如何使用 GPTZero?
GPTZero 可在其网站上或通过应用程序编程接口 (API) 获得。要使用该网站,只需复制您要检查的文本并将其粘贴到标有“试试看”的大框中。
也可以上传 PDF、Word 文档或文本文件,然后单击“获取结果”按钮。您还需要选中表示您同意服务条款的框。
我们真的需要剽窃检查吗?
OpenAI 远远超出了许多文本生成 AI 所依赖的研究实验室,OpenAI于 2022 年 11 月下旬向公众发布了 ChatGPT。到 2023 年 1 月,ChatGPT 拥有超过 1 亿用户,成为迄今为止增长最快的公共应用程序。
这意味着随着这种 AI 帮助在生活的各个角落变得可用,对剽窃的任何担忧只会增加。微软正在将 OpenAI 的技术整合到必应搜索中,谷歌正在测试自己的版本,称为 Bard。
与此相关的是,像 Dall-E和Stable Diffusion这样的 AI 图像生成器正在接受可能侵犯版权的审查。所有这些人工智能服务都接受了在线发现的数十亿人创作的文字、照片和艺术品的训练。
在某种程度上,人工智能是在借鉴人类智慧,而不是自己创造。如果我向另一个人借钱,我必须给予信任并可能支付许可费。使用生成式 AI,引用来源变得更加困难,因为每个文本或图像都被分解成分散的元素,然后使用数千或数百万个来源重新组合以创建新作品。