位置：首页 > 资讯 > 正文

再让AI大厂这么“偷”下去，咱可能就看不到免费的网站了

来源：差评君发表于： 2023-07-12 10:57:39

几天前，谷歌突然更新了隐私政策，明确表示要用网上所有的公开数据，来训练自家的 AI 模型。

(资料图)

也就是说，根据新政策，你在网上公开发布的任何信息都有可能被谷歌抓取，包括但不限于你发的帖子、搜索的关键词以及看过的视频。

这不妥妥互联网裸奔吗！

OpenAI 前脚刚被起诉数据侵权还没多久，谷歌就马上着急来撞枪口。

在这个节骨眼上整这么一出，大概率跟数据收费脱不了关系，谷歌再不薅这波免费的羊毛，之后很有可能就薅不到咯。

这事儿啊，自打 ChatGPT 爆火后再也没消停过。

世超先给大家伙儿捋捋时间线。

今年 3 月的时候呢，马斯克带头打响了数据收费第一枪，宣称推特的 API 接口不再免费了。

紧接着，美版贴吧Reddit 也按耐不住了。

上个月 Reddit 闹得沸沸扬扬的“停电”运动，就是为了抗议官方的 API 收费政策。

之前世超写这事儿的时候还在猜测， Reddit 官方最后会不会作出让步。

从现在的后续看来，大多第三方软件已经确认关停， Reddit 是铁了心要数据收费。

再到这段时间，推特又整了限流的幺蛾子，没有花钱认证的账号每天就只能阅读 600条贴文，目的也是防止机器人抓取用户数据。

难道数据就这么值钱吗？

我觉着啊，还是AI的锅。

AI 大模型要想变得更聪明，就需要源源不断的数据去“喂养”。

现在能做大模型的，要不就是自己家有数据，像百度、阿里和腾讯；要不就是爬人家的数据，这里点名 OpenAI 。

因为很多网站都开放有免费的 API 接口，才给了微软、 OpenAI 这些巨头可乘之机。

但今时不同往日， AI 在重新赋予数据价值以后，有筹码在手上的平台当然不乐意被白嫖了。

甚至于 Reddit 的 CEO 霍夫曼都把话搬上明面儿了：就是不想免费提供数据给巨头们。

所以， OpenAI 被起诉估计也是平台们联合起来想要“杀鸡儆猴”，治一治 AI 的这股歪风邪气。

不过，法律这次会不会站在 OpenAI 这边，还真不好说。

因为数据版权涉及到 3 个关键的问题：

1. 数据爬虫的行为本身是否是合法的？

2. 数据是否受到版权的保护？

3. 用数据生成的作品是否受到版权保护？

首先第一个问题，要获取数据，无非就是付费购买，或者收集网上公开的数据。

但需要注意的是，公开的数据并不能等同于授权使用，而且还要看网站是不是有相关的条款对数据爬虫行为做出了限制。

要是直接越过版权方的同意，或者绕过了网站限制强行获取数据，那就是妥妥的非法获取计算机信息系统数据罪。

即使 OpenAI 声称爬的是公开网站的数据，数据爬虫行为本身是否合法，还要看版权方是不是给了授权。

其次，关于数据本身是否受到版权保护。

根据美国的版权法，如果 AI 模型训练所用的数据符合“合理使用”的范围，那就不会构成侵权。

但问题就出在这“合理使用”上。

“合理使用”的构成要件包括是否涉及商用、作品本身是否受版权法保护、所使用部分的数量以及使用之后对作品本身造成的影响这四个标准。

像什么新闻报道、学术研究，适当引用是完全 ok 的。

可 AI 模型上亿万级别的数据使用量、已经商业化的 AI 软件，还能算作“合理使用”吗？

最后，就是AI生成作品的版权问题。

因为训练数据版权理不清， AI 生成的内容自然也会存在版权争议。前几天， Steam 还下架了一款使用了 AIGC 生成的游戏，理由就是版权有问题。

咱就拿 AI 绘画举例子，图像生成相当于一个拆分又重组的过程，虽然最后的结果是完全“新”的，但仍然会保留训练图像的某些特征。

但这种情况到底算不算侵权，各国的说法现在也是众说纷纭。

因为训练数据是人家的，美国版权局认定 AI 生成的作品不受版权法保护，甚至还可能侵犯著作权。

而日本政府的态度则截然不同，表示日本法律不保护 AI 训练所用数据的版权。

至少在现行的法律框架下，上面这些问题很难得到一个统一的答案。

既然监管不给力，那版权方就只有提刀自己干了，该收费的收费，该追偿的也赶紧追偿。

OpenAI被起诉的文件

可以预见，在推特和 Reddit 之后，可能还会有更多的内容版权方竖起高墙。

这事儿呢，对于平台来说，当然是个挣钱的新路子，科技巨头再不济也就是多砸点儿钱。

但对于整个互联网来说，可算不上一件好事儿。

当年，互联网就是带着开放共享的基因出生的，像什么维基百科、推特，之前常年免费提供 API 接口，开发者调用数据很方便。

但现在如果让数据收费这么一搞，结果会怎么样还真不好说。

毕竟，小开发者没有支付巨额数据费的能力，如果创新只在巨头里发生，这不就是纯纯搞垄断了？

最主要的是，可能很多现在免费能看到的网站之后就要花钱才能看了，这才是对咱们这种普通用户的真实暴击。

其实吧，数据收费这事儿也不能全怪平台，实在是让 AI 巨头给“抢”怕了，算是一种自保的无奈之举。

虽然这次谷歌有“隐私政策”护体，但结果如何还真不好说。

所以，关键还要是看监管的大锤什么时候能落下。

厘清数据版权，是 AI 要发展始终绕不过去的一道坎儿，而现在，似乎也同样关乎着互联网的未来走向。

不知道 AI 这艘船，会将我们推向一个更开放，还是更封闭的时代？

关键词：

上一条：中国驻俄大使：中俄贸易额及俄罗斯对华能源供应不断增长

下一条：最后一页

“您看书我买单”文化惠民活动将于19日在保定市新华书店启动

首页

资讯

财经

行情

创新

科技

数据

再让AI大厂这么“偷”下去，咱可能就看不到免费的网站了

推荐内容

浙大二院“会战”上虞：一声谢谢让我们充满力量

“神州北极”漠河：极寒-43.5℃ 冰雾罩城

国内首套冷链运输电子束消杀装备“破冰者”签约投产

2022年起江浙沪籍海船转籍登记实现“不停航办证”

“美人鱼”国家级表演赛三亚落幕

维护农民工权益 川渝同步开展根治欠薪冬季专项行动

广西东兴新增4例新冠肺炎本土确诊病例

最高判刑14年 6人因生产销售有毒有害食品被判刑

“贵州世居少数民族艺术大数据可视化网络传播平台”上线

山东泰安文旅融合释放惠民福利 盘活消费复苏

天天要闻：天安新材: 天安新材与光大证券股份有限公司关于广东天安新材料股份有限公司非公开发行股票申请文件的反馈意见的回复（二次修订稿）

快资讯丨精准信息董秘回复：公司一直高度重视股东回报工作，自市以来，基本每年都有现金分红，截至目前

起底制售假证黑色产业链：出生到死亡，各类证都能造

山西孝义透水事故：“矿主”承包企业非法向黑煤窑供电

今日至周日北京将出现弱降雪大风强降温天气

火灾事故调查员李兴刚17年进出火场 找寻火灾“真凶”

公安部：严防监控设备沦为“罚款工具”

河南周口沈丘县公布四例新冠病毒感染者活动轨迹

江苏省地震局启动地震应急三级响应 目前尚未接到人员伤亡报告

西安市第二轮全员核酸检测筛查发现阳性人员127例

“您看书 我买单”文化惠民活动将于19日在保定市新华书店启动

记者获悉，您看书 我买单文化惠民活动将于19日在保定市新华书店启动。据悉，此项活动由保定市文化广电和旅游局主办，市新华书店和市图书馆

杭州火灾系二房东与房客纠纷引起 人为放火致1死4伤

中新网杭州12月23日电(郭其钰)浙江省杭州市公安局上城区分局22日晚发布通报称，警方对上城区闸弄口街道机神新村放火案立案侦查，查明该案系

南京一民警执勤时被撞殉职 肇事者已被控制

中新网南京12月23日电 (徐珊珊)南京市公安局交通管理局22日通报，当天，南京机场高速一民警执勤时被撞，经抢救无效去世。目前，肇事驾

孙海洋夫妇顺利接到孙卓：孩子回到身边心里才踏实

“海洋四英还是一口气把车开到了学校。晚上11点42分，他们接到了孙卓，然后从侧门离开了。谢谢无数关切孙卓回家的人们。” 12月23日

寒潮将影响我国中东部地区 黄淮江淮等地有雾和霾天气

中新网12月23日电 据中央气象台网站消息，受寒潮影响，预计，12月23日至26日，我国中东部地区自北向南将先后出现4～5级风，阵风6～8级

那年今日 | 历史上的12月23日发生过什么大事？

历史上的12月24日有什么特别之处?2003年12月24日，鸟巢和水立方双双开工建设，这俩地方你去参观过吗?1818年12月24日，英国物理学家焦耳出生

维护农民工权益川渝同步开展根治欠薪冬季专项行动

山东泰安文旅融合释放惠民福利盘活消费复苏

火灾事故调查员李兴刚17年进出火场找寻火灾“真凶”

江苏省地震局启动地震应急三级响应目前尚未接到人员伤亡报告

“您看书我买单”文化惠民活动将于19日在保定市新华书店启动

记者获悉，您看书我买单文化惠民活动将于19日在保定市新华书店启动。据悉，此项活动由保定市文化广电和旅游局主办，市新华书店和市图书馆

杭州火灾系二房东与房客纠纷引起人为放火致1死4伤

南京一民警执勤时被撞殉职肇事者已被控制

　　“海洋四英还是一口气把车开到了学校。晚上11点42分，他们接到了孙卓，然后从侧门离开了。谢谢无数关切孙卓回家的人们。”　　12月23日

寒潮将影响我国中东部地区黄淮江淮等地有雾和霾天气

　　中新网12月23日电据中央气象台网站消息，受寒潮影响，预计，12月23日至26日，我国中东部地区自北向南将先后出现4～5级风，阵风6～8级