随着ChatGPT在全球范围内的迅猛增长,其开发商OpenAI正面临越来越多的质疑和批评。近日,OpenAI陷入了一连串法律纠纷之中。16位匿名个人向OpenAI及微软提起诉讼,他们指控ChatGPT产品未经告知或获得同意的情况下,收集并泄露了他们的个人信息。这场诉讼事件发生在6月28日。
据称,尽管存在购买和使用个人信息协议,但OpenAI和微软却系统性地从互联网上窃取了3000亿个单词,其中包括数百万未经同意获取的个人数据。这一行为不仅违反了相关法律政策,而且没有支付相应费用。这些数据来源于互联网、书籍、文章、网站以及帖子,这些都被用于训练ChatGPT模型。
涉及到的隐私信息包括账户详情、姓名、联系方式、电子邮件地址、支付记录、浏览器活动历史以及社交媒体内容等。此外,还有聊天记录和Cookie数据被无授权地收录进去,这些信息能够揭示出个人的兴趣爱好、观点偏好乃至家庭生活细节。
根据起诉书估计,至少有30万本书籍进入了OpenAI的训练数据中,其中许多源自侵权网站,如Library Genesis和Sci-Hub等。在披露其训练数据时,OpenAI承认其中包含两个互联网图书库语料,大约占比15%。然而,该公司尚未对此进行明确澄清。
此前,在2022年11月份,Copilot代码助手与GitHub合作推出时,也曾引发程序员们对版权问题与隐私泄露提起诉讼,并索赔达90亿美元。不过该案件目前仍在审理过程中,没有最终判决结果。
这些案例警示着企业必须更加负责任地处理用户隐私问题,不仅是针对OpenAI,也是全球所有公司需要遵守的一项规则。在人工智能技术迅速发展的今天,对于如何确保合法透明地使用用户数据尤为重要。随着更多个人资料被用来训练这些模型,我们必须保障其安全可靠同时也要维护公民权利,以实现人工智能技术发展与保护个体尊严之间平衡关系。