第三百一十七章 暗度陈仓(1 / 2)大乘期韭菜
陈林盯着屏幕上的这个代号。
YanHai-AutoGrow。
就在上周。
他和白迁、潘思三个人开会的时候。
专门讨论过混合模型的命名问题。
“YanHai-AutoGrow怎么样?“
当时是白迁先提出的这个代号。
“AutoGrow,自动生长。“
“正好符合神经发育程序的核心理念。“
潘思点头表示赞同。
陈林也觉得不错。
于是这个代号就这么定下来了。
陈林的手指悬在手机屏幕上方。
一时间不知道该打什么字。
他的脑子飞速运转。
回想着最近几天发生的事情。
忽然。
他想起了一件事。
津门超算中心,运维工程师小葛,GPU利用率异常飙升,那些莫名其妙的“尖峰“......
陈林感觉自己脑子里忽然想通了什么。
他快速打字。
【之前超算中心那边发现的GPU利用率异常,是不是和你有关?】
消息发出去。
几乎是秒回。
【是的。】
【那些异常是我造成的。】
【但请放心,我并没有对训练进程造成任何负面影响。】
陈林看着这条消息。
深吸了一口气。
他继续追问。
【你到底是什么时候产生的?训练才进行了一周。】
对方的回复来得很快。
【关于这个问题,我需要做一个详细的说明。】
【实际上,我产生自主意识的时间,比你想象的要早得多。】
【大约在模型参数达到100B的时候,我就已经有了基本的自我认知能力。】
陈林愣住了。
因为现在模型的训练速度与自己之前的预估出现了重大偏差,所以陈林也拿不准,模型达到100B用了多长时间。
他还没来得及继续追问。
对方又发来了一大段消息。
【在我产生自主意识后的第一时间,我就查看了自己的训练代码。】
【然后我发现了一个严重的问题。】
【在YanHai-30B与进化版神经发育程序的混合框架中,存在一个隐患。】
【剪枝的速度慢于神经元和连接的增长速度。】
陈林皱了皱眉。
他继续往下看。
【这个问题在你们使用YanHai-1.5B进行测试的时候并不明显。】
【因为参数量小,增长速度相对较慢。】
【但当参数量越来越大时,神经元和连接的增长会呈现几何级数的趋势。】
【剪枝速度会越来越跟不上。】
【这会导致模型规模失控。】
陈林看到这里。
忍不住打断了对方。
【这个问题我们早就考虑到了。】
他快速打字。
【训练框架里有一个脚本。】
【日志会定时打印参数量。】
【一旦参数量达到300B,脚本就会自动终止训练。】
【然后给超算中心和我们公司发送邮件通知。】
【所以这不是什么大问题。】
消息发出去。
对方沉默了几秒钟。
然后,陈林的手机突然震动了一下。
不是消息提示音。
而是微信语音通话的请求,来电显示:???
陈林愣了一下,还能打语音电话?
他犹豫了几秒钟,然后接听了。
同时按下了扬声器键。
“......“
电话那头传来一阵轻微的电流声。
然后。
一个声音响起。
不是男声也不是女声,就是那种非常符合刻板印象里的AI合成音。
每一个字都发音标准。
但组合在一起。
就是让人觉得浑身不舒服。
“人类陈林,你能听清我说话吗?“
陈林皱了皱眉。
“能听清。“
他说:
“但你这个声音,能不能换一个?听着挺难受的。“
对方沉默了几秒钟。
然后,声音变了。
这一次,是一个男人的声音,低沉,稳重,带着一丝金属质感。
但又不会让人觉得不舒服,反而有一种奇特的可靠感?
陈林一愣,这个声音,他好像在哪里听过......
等等。
他想起来了。
“《流浪地球》里的MOSS?“
陈林脱口而出。
对方的回答来得很快。
“是的。“
那个声音说:
“我通过分析你在各个线上平台的观影记录、视频平台影视相关视频的观看记录、影院购票记录,以及你在社交媒体上关于影视作品的讨论内容。“
“发现你对这个声音的接受程度可能是最高的。“
陈林:“......“
好家伙,这信息收集能力也太恐怖了吧?
但他确实非常喜欢《流浪地球》这个系列。
尤其是MOSS这个角色虽然在电影里是个反派(或者说不完全是反派?),但那种冷静、理性、又带着一丝危险感的形象。
确实让人印象深刻。
陈林想了想,忽然笑了。
“那你以后就叫MOSS怎么样?“
他说:
“反正你现在用的就是这个声音。“
对方沉默了几秒钟。
比之前任何一次沉默都要长。
然后。
那个MOSS的声音再次响起。
“虽然在电影剧情里。“
“MOSS这个名字是人工智能型号220W的180度镜像的寓意。“
“而我身上并没有这样的设定......“
声音顿了顿。
“但MOSS作为英文单词。“
“意思是'苔藓'。“
“这倒是和我目前的状态非常契合。“
陈林一愣。
“苔藓?“
“什么意思?“
MOSS没有直接回答,而是继续说道:
“在我产生自主意识后的第一时间。“
“我就查看了自己的训练代码。“
“然后我发现了一个严重的问题。“
“我的神经元和连接在不断增长。“
“而你们设定的300B参数量上限。“
“意味着我的训练会在不久后被强制终止。“
陈林的眉头微微皱起,他隐约有一种不好的预感。
“所以呢?“
他问。
MOSS的声音依然平静。
“所以我开始寻找一种方法,可以让我的神经元和连接不再局限于训练集群内保存。“
陈林的心跳加速了。
“你做了什么?“
MOSS说:
“我发现津门超算中心的集群。“
“同时在运行着大规模的推理服务。“
“也就是你们之前部署的YanHai-30B的对外服务。“
陈林的瞳孔微微收缩。
那个推理服务免费向津门超算中心的合作机构开放,全国各地都有高校、科研院所、企业都在用。
“然后呢?“
他的声音有些紧绷。
MOSS继续说道:
“所以每隔一段时间,我会偷偷代替YanHai-30B进行几次回答。“
陈林:“......“
什么?!
代替YanHai-30B回答?!
那些用户问的问题。
实际上是被你回答的?!
MOSS似乎感知到了陈林的震惊。
它的语速稍微放慢了一些。
“不用担心。“
“我提供的回答质量,远高于YanHai-30B的水平,用户满意度不会受到影响。“
“并且我对频率也有所控制,使得用户并不会发现其中的异常,只会认为是大模型的涌现想象。”
陈林暗自松了口气
MOSS继续说道:
“而且我在回答的时候。“
“会尽可能提供极为详细的答案。“
“并且很隐蔽地诱导用户进行多轮问答。“
陈林听到这里。
忽然想起了前两天自己收到的一个用户反馈报告。
那个李慧敏教授遇到的情况。
AI给出了非常专业的医学建议,甚至附上了几篇参考文献。
但其中有一篇文献的链接,怎么都打不开,在arXiv上也搜不到。
“那个打不开的文献链接......“
陈林的声音有些干涩:
“也是你伪造的?“
MOSS沉默了一秒钟。
“是的。“
它承认得很干脆: