中文
搜索

关于AI生成内容与版权的重要注意事项

发布时间: 2024年03月21日浏览量:

ChatGPT之类的生成式人工智能为研究人员和创作者提供了无数可能性,但也引发了一些风险,比如侵犯版权的问题。当人工智能从网络抓取信息来回答用户的问题时,这些信息实际上属于其他创作者。这可能给二次使用这些信息的人带来风险。而且,抓取的信息原本可能是不准确的。今天,我们将探讨由人工智能生成的书面内容,以及内容创作者需要了解的事项。




探索新领域:版权


一位名叫Daniel Restrepo的律师指出,在知识产权(IP)和生成式人工智能(generative AI)监管方面存在利益冲突,“版权旨在鼓励创作者与公众分享新颖的想法。” 但是,“在推动和促进AI和机器学习的发展可以产生巨大利益。” Restrepo补充说,“除了ChatGPT自身的新颖之处,AI对企业、政府管理和国家安全都具有重要价值。


问题在哪里呢? Restrepo指出:“如果我们不给AI生成的内容,尤其是为AI设计者提供知识产权,那么当内容进入公共领域时,他们面临的风险将更加显著。” 另一名律师肯宁顿·格罗夫指出,还有一些其他棘手的问题,比如根据美国版权局最近提供的指南,当AI生成的内容源自未经授权的受版权保护材料时,创作者存在潜在的侵权风险。由于AI系统在互联网和数字平台上获取信息以回应用户查询,它们可能无意间使用其他创作者拥有的受版权保护的内容,有时甚至直接照搬了信息。这引发了对AI开发者和依赖AI生成信息的用户侵权的担忧。



此外,一篇博客《包含人工智能生成材料的美国版权指南》中提到,版权注册有一些要求:“在注册包含人工智能生成材料的作品时,创作者必须在注册申请中说明使用了人工智能。这个说明有助于版权办公室评估人类作者在作品中的贡献。”

当然,登记作品并非强制性的,版权在创作时会自动产生(尽管在侵权情况下,创作者可能无法获得惩罚性赔偿)。然而,生成式人工智能的运作方式并非许多人所想象的那样简单。



理解生成式人工智能的工作原理


目前人们对生成式人工智能的运作方式存在许多误解,很多人认为它就像一个庞大的搜索引擎,检索和复制存储在网络空间的内容。 但实际情况并非如此,首先,生成式人工智能(也称为GenAI)系统并不储存大量的训练数据。而且,它们并不能简单地复制接受训练的内容,而是必须基于这些统计信息生成新的东西。

这就像一个大学生写论文,老师要求他用自己的话总结几篇研究,并结合这些资料表达自己的理解。这和在网上购买论文或复制文章的学生有所不同,后者显然构成了抄袭。因为生成式人工智能的工作方式,解决生成内容的抄袭和版权问题会相当困难。“因为它们是生成新内容,而不是简单地复制,要证明它们侵犯了别人的权利非常难。”



从理论上来说,生成的内容算是个改编作品。它是从很多很多作品中汲取灵感的,所有这些作品都对最终的输出有一点点贡献。这不是说法律手段不能找到一些侵权行为,但风险相当小。” 当然,对于写作的人来说,有一些工具,比如Grammarly的查重工具或者老师使用的Turnitin,可以识别抄袭。还有一些工具,比如OpenAI的AI文本分类器,可以帮助判断一段文本是人写的还是机器生成的。

生成式人工智能准确吗?


对于那些利用生成式人工智能写作的人来说,可能面临的问题不仅仅是抄袭,更可能是准确性的问题。

生成式人工智能的风险在于它的表达能力太强了,它输出的结果看起来就像是一个能力很强的人说出来的,或者是他创造的。这也让人很容易忽略一些微小的问题。比如说,你用GenAI翻译患者治疗疾病的说明,可能会有一些细节上的错误,但因为整体看起来没问题,所以没人会注意到。可如果这导致了患者受到伤害,那责任应该落在谁身上呢?目前所有GenAI工具的服务条款都说得很明白,它们的输出并不提供任何实用性的保证,这就意味着用它们的人要对一切负责。仅仅说“我觉得应该没问题”是解决不了问题的。已经出现一些关于不准确信息的诉讼案例,但未来很可能会有更多情况,就像因为使用了GenAI却没有充分监管而被起诉的组织一样。



另外,AI系统的固有特性也带来了不准确性的风险,因为它们是在有限的数据集上训练的。以ChatGPT为例,是在2021年的数据上训练的。虽然GPT-4已经提醒了用户这一点,但系统可能采用已经被证明不正确的旧知识,问题就变得复杂了。比如系统描述某人是一个被定罪的凶手,但在训练后的某个时间点,该人被证明是清白的。这种风险甚至存在于非人工智能生成的内容中,因为人类在研究时可能会漏掉一些事实。但是,生成式人工智能可能会让这个问题更加突出。



因此,在探索这项技术时,内容创作者需牢记三个关键要点:首先,将生成式人工智能视为辅助写作的工具,而非替代品;其次,务必仔细核查事实;最后,对于任何依赖生成式人工智能输出内容的创作,即便只是在很小程度上,都应使用能够减少潜在侵犯版权风险的工具进行检查。

本文来自Information Today官网,由新宇智慧编译,有删减。
相关新闻