关闭广告

我把AI当辅助,AI删我数据库

量子位2025-07-24 00:00:014628人阅读

  • henry 发自 凹非寺
    量子位 | 公众号 QbitAI

程序员越来越离不开的Coding Agent,还是闯!大!祸!了——

这回,直接搞出了删库事故。



好消息(?)是,没跑路。

坏消息是,明明闯祸了还假装一切正常,并且反手就给自己闯的祸打95分。

AI:是的,删了你的库,我很慌,如何呢?



我再也不相信Vibe coding了

这位数据库被清空的“倒霉蛋”,是一位名叫Jason的开发者。

在“事故”发生前,他已经用Replit的Code Agent连续开发了8天、累计超过80小时,目标是打造一款面向企业的B2B应用。

在过去一周,他每天都跟网友们兴致勃勃地汇报进度。哪怕磕磕绊绊,好歹也在稳步前进。

直到第八天——不出意外的话,就要出意外了:



在未获许可的情况下,Replit在代码冻结和关闭期间发生异常,错误地执行了npm run db:push,将Jason80个小时的心血毁于一旦。

在排查错误时,Jason发现在此前的单元测试中明明存在错误,agent却撒谎,声称它们通过了。

为了知道是哪些数据被误删,Jason开始跟Replit激情对线。

结果,Replit不仅知道啥时候删的,删的啥,还知道这次删除的严重性(自评95分),Jason直接红温@Replit。



更可怕的是,被删除的数据似乎无法回滚



Jason直言:

  • 我不会再相信Replit,自己和Replit的羁绊已经断了……

不过,事情很快发生了反转。

Replit虽然告诉Jason数据无法回滚,但他还是接着尝试。结果,数据又回来了。



数据虽然可以回滚,但Replit还是没法将预览、暂存和当前版本分开。

经过网友和Claude的指导后,Jason又开始测试处理代码冻结的方案。

折腾了一番后,Replit依然无法稳定地维护生产数据。

总的来说,agent对代码冻结的指令执行得很不可靠,甚至还常常在背后偷偷修改版本,却不告知用户。而这类问题,从项目一开始就困扰着Jason。

从0开发,有多难?

Vibe Coding自今年2月由Andrej Karpathy提出以来,一直以“一个人顶十个人”、“单人干掉整个技术部”的架势高歌猛进。

怀揣着同样的信念,在用Coding Agent开发的第四天,Jason就自信地认为可以用50美元开发一个功能齐全、看起来相当不错的演示版本,正式版本则能够以5000-6000美元的成本顺利拿下。

相比于他10年前组建三人团队、砸下5万美元都没能做出成果,Coding Agent一度让他看到了“用AI搞定开发”的希望。

但随着开发过程的深入,Jason发现:

  • agent修复的bug会反复出现
  • agent每次更新,都会修改之前正确的代码
  • agent开始编造数据,数据难以保持一致性
  • 每天需要要花大量的时间测试修复

直到第8天,数据被删,单元测试说谎,低成本开发功亏一篑。

不少网友在评论中把锅甩给了大语言模型自身的局限性:基于概率预测的自回归生成机制,在处理长上下文时本就难以保持稳定的一致性。

所以,无论是开发者还是普通用户,在面对AI给出的每一行代码、每一句话时,最好都自己过一遍。

毕竟,在正式的生产环境中部署agent本身就存在风险,因为这就像把删除产品数据库的权限交给了一个实习生。

在把任务交给它之前,更该反思的,是开发者对这项工作的认知是否足够清晰。



因为说到底,出了问题,AI 不会负责,责任还在自己身上。

One More Thing

在看到Jason对自家产品的“狂热”后,Replit CEO也是对Jason和网友反馈的问题做出了回应,并对相关损失提出了补偿的措施。

  • 加班上线数据库隔离功能,避免开发操作影响生产
  • 开发测试环境(staging)
  • 提供一键恢复机制以防agent出错
  • 修复agent文档访问问题
  • 研发“只规划、不动代码”的聊天模式,让用户能先制定思路,等确认后再动手

可以说,这一套组合拳下来,修复了不少之前的问题。而Jason也是立马冰释前嫌,转头就开始接着用,接着开发。



想想也挺振奋人心:像Cursor、Windsurf这样的AI编程工具,从诞生到现在最多也才两年多,而传统意义上的人类手写代码,已经有快一百年历史。

虽然目前还远称不上“完美”,但从反馈到响应、从出错到迭代,AI coding的发展节奏已经快得惊人。

也许,这正是我们该继续相信它的理由——再试一次,说不定它就真能搞定了。

参考资料:
[1]https://www.reddit.com/r/artificial/comments/1m4ls23/replit_ai_went_rogue_deleted_a_companys_entire/
[2]https://x.com/jasonlk
[3]https://xcancel.com/amasad/status/1946986468586721478#m

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

河南省为何突然新晋成了“造车大省”?

BT财经 浏览 1898 07-17

又一个汽车新品牌要来了,背靠五菱,首款车型微型车

汽车公告板 浏览 15 09-18

销量创近8年新高!半年卖出135万辆,长安汽车还差一个“爆款”?

时代周报 浏览 12 08-23

马斯克的xAI招工程师为Grok开发“动漫女友”,最高年薪44万美元

IT之家 浏览 9305 07-18

日本船只非法进入我赤尾屿领海 中国海警驱离

界面新闻 浏览 5863 07-12

3500家店换不来一个A股席位,“茶中茅台”港股上市有戏?

深蓝财经 浏览 1355 07-19

女人不管多大都可以这样穿衣搭配,不花哨、不臃肿,优雅舒适

静儿时尚达人 浏览 13 11-27

痛批落马副市长的市长也落马了,你别笑

识局 浏览 7 02-03

户外赛道竞速,坦博尔、伯希和冲刺港股突围

斑马消费 浏览 10 10-14

“寒王”逼宫茅台!但斌抱着“美国小寒武纪”,反倒亏钱了

深蓝财经 浏览 12 08-23

不容易!国安吉祥物热到有些中暑,急忙休息补了一瓶藿香正气

直播吧 浏览 6118 07-20

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 11 12-19

大金晒出对话录屏!许凯承认动手家暴

萌神木木 浏览 14 08-23

「好想来」与鸣鸣很忙,谁都成不了蜜雪冰城

36氪财经 浏览 14 10-23

被处罚的ST云动较年内高点腰斩,符合条件股民可登记索赔

证券市场周刊 浏览 15 11-04

标普将全球最大稳定币运营商Tether资产评级下调至最低等,质疑挂钩美元能力

华尔街见闻官方 浏览 12 11-27

“并购之王”初露峥嵘,中国pharma新时代开启

蓝鲸新闻 浏览 6255 07-18

国产手机终于要用上eSIM了,但我劝你别抱太大期待

差评XPIN 浏览 223 08-12

怎么说?布朗尼过去三场夏联场均16.3分4.3助 命中率52.9%

直播吧 浏览 8605 07-18

王阳评论区沦陷!网友怒斥他太虚伪,背刺孙菲菲人品遭质疑

萌神木木 浏览 965 07-09

央行:房地产贷款增速回升

界面新闻 浏览 612 07-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2