据DoNews OpenAI 旗下 GPT 模型的训练需要大量的网络数据,这可能涉及到数据隐私和版权等问题。为了解决这些问题,OpenAI 最近推出了一个新功能,让网站可以阻止其网络爬虫(web crawler)从其网站上抓取数据训练 GPT 模型。网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问,或者通过屏蔽其 IP 地址,来阻止 GPTBot 从其网站上抓取数据。
扫描二维码
手机浏览
OpenAI现允许网站阻止其爬虫抓取数据
分享文章链接
相似推荐

抖音上线“阻止相同侵权内容传播”功能
新榜讯 5 月 22 日传来消息,抖音平台对其侵权举报服务予以升级,于肖像权、隐私权遭侵权的情形中,支持用户授权开启“阻止相同侵权内容传播”这一功能,极大程度降低了重复侵权投诉的成本,积极探索“一次投诉、长期管控”的治理目标。

OpenAI发布GPT-4.1:百万token上下文、编程能力提升
新榜讯 OpenAI 重磅推出三款 GPT-4.1 系列模型,分别为 GPT-4.1、GPT-4.1 mini 以及 GPT-4.1 nano,此系列模型仅能通过 API 加以使用。

谷歌将允许企业在其自有数据中心运行双子座人工智能模型
新榜讯 周三,谷歌云业务部门宣称,客户能够于自身的数据中心运行谷歌的双子座人工智能模型。