第三百一十一章 高强度开发(1 / 2)大乘期韭菜
陈林和赵明通完电话后,心情不错。
YanHai-30B在实际应用场景中获得的正面反馈,让他对演海接下来的技术路线更有信心了。
他靠在椅背上,想了想。
赵明那边的反馈其实很有代表性。
“天眷“深空探测计划是国家级的重点项目。
能在这种项目里派上用场,说明YanHai-30B的实际能力已经得到了验证。
不是那种实验室里的玩具。
而是真正能解决问题的工具。
陈林的嘴角微微上扬。
接下来要做的事情就更有意义了。
神经发育程序和YanHai的融合。
......
......
下午两点。
陈林召集了一个简短的全员会议。
会议室里,白迁、潘思、沈妍、孙宇都到齐了。
陈林站在白板前。
“情况大家都清楚了。“
他拿起马克笔,在白板上写下几个关键词。
【进化版NDP】
【梯度版NDP】
【YanHai-1.5B】
“两条技术路径,进化版NDP和梯度版NDP,我们要分别和YanHai-1.5B进行融合,然后对比测试。“
他转向白迁和潘思。
“你们三个人负责进化版NDP,进展怎么样了?“
白迁清了清嗓子。
“架构设计已经完成了。今天开始正式写代码。“
潘思在旁边补充道:
“CMA-ES的核心模块我昨晚已经写好了初版。今天开始和YanHai-1.5B的接口对接。“
陈林满意地点了点头。
效率不错。
他的目光移向沈妍。
“你这边呢?上周讨论的那些问题,都想清楚了吗?“
沈妍轻轻点了点头。
“我没问题。“
她的声音不大,但是很清晰悦耳。
好像冰块撞击的声音。
“上周我把要向你请教的东西都问完了。“
她的表情很认真,目光沉稳。
陈林看着她。
心里忍不住有些感慨。
沈妍的学习能力真的很强。
从完全不懂人工智能,到现在能够独立承担一部分开发工作。
也就几个月的时间。
虽然她的编程水平还比不上白迁和潘思这种资深程序员。
但在人工智能算法的理解上,已经不需要太多指导了。
“那行。“
陈林说:
“我们从今天开始把整个框架设计一下,然后也尽快开始写代码吧。“
他转向全场。
“那就这样定了。白博士、潘博士带着孙宇继续推进进化版NDP。我和沈妍这边也开始梯度版NDP的架构设计。“
众人都点了点头。
没有人提出异议。
会议很快就结束了。
大家各自回到工位,开始工作。
......
......
接下来的几天。
演海办公室进入了高强度的开发状态。
键盘声此起彼伏。
咖啡杯换了一个又一个。
每个人都在自己的岗位上忙碌着。
白迁、潘思、孙宇三人组的效率非常高。
他们采用了vibe g的工作模式,用YanHai-30B辅助编程。
白迁和潘思都是资深程序员。
十几年的开发经验。
用起AI编程工具简直如虎添翼。
“这个模块让YanHai-30B写个初版。“
白迁对着电脑屏幕说话。
他用的是语音输入。
这比打字快多了。
几秒钟后,屏幕上出现了一大段代码。
白迁快速浏览了一遍。
眼睛飞快地扫过每一行。
“这里有点问题......“
他的手指在键盘上敲击。
修改了几处细节。
然后运行测试。
控制台上刷过一行行日志。
最后显示:
【All tests passed.】
“过了。“
白迁满意地点了点头。
靠在椅背上。
伸了个懒腰。
这种以前需要半天才能完成的工作,现在半小时就搞定了。
效率提升了接近10倍。
vibe g,yyds!
潘思那边也是类似的情况。
他负责的CMA-ES核心模块是整个进化版NDP的关键。
CMA-ES,全称是Covariarix Adaptation Evolution Strategy。
协方差矩阵自适应进化策略。
这个名字听起来很唬人。
但本质上就是一种黑盒优化算法。
不需要知道目标函数的梯度。
只需要能计算目标函数的值就行。
适合处理那些不可微的优化问题。
这个模块的实现难度不低。
涉及到协方差矩阵的更新、种群的迭代优化等复杂逻辑。
换在以前,潘思估计要写一周。
但在YanHai-30B的辅助下。
他的进度比预期快了很多。
“YanHai,帮我写一个协方差矩阵更新的函数。“
潘思对着麦克风说。
“输入是当前种群和适应度分数,输出是更新后的协方差矩阵和均值向量。“
几秒钟后。
屏幕上出现了一段代码。
潘思仔细看了看。
眼睛越睁越大。
“牛逼啊......“
他喃喃道。
“这写得也太好了吧?“
代码结构清晰,逻辑严谨。
甚至还加了详细的注释。
潘思只需要改几个变量名,就能直接用了。
太省事了。
孙宇虽然技术水平一般。
但他很勤快。
白迁和潘思把一些相对简单的模块分配给他。
比如日志记录、数据可视化之类的。
孙宇一个一个地啃。
不懂的地方就问。
问不明白就用YanHai-30B帮忙。
虽然他用AI编程的效率不如白迁和潘思。
但好歹也能干活。
没有拖后腿。
“孙宇,你这个日志格式有点问题。“
白迁在代码审查的时候指出。
“时间戳应该放在最前面,方便后续排查问题。“
孙宇赶紧改。
“好的好的,我马上改。“
他挠了挠头。
嘿嘿一笑。
......
......
另一边。
陈林和沈妍则是先花了两天时间把架构设计好了。
这两天主要是理论层面的工作。
画图、推导、讨论。
两人经常凑在一起看草稿纸。
讨论各种技术细节。
“这里用PPO的话,状态空间应该怎么定义?“
沈妍指着草稿纸上的某一行公式。
陈林想了想。
“把当前网络的拓扑结构和所有节点的嵌入向量拼接起来,作为状态。“
沈妍皱了皱眉。
“那状态空间的维度会很高吧?“
“确实。“
陈林点了点头:
“所以需要一个状态编码器,把高维状态压缩成低维向量。“
他拿起笔,在草稿纸上画了一个示意图。
“可以用一个小型的GNN来做这个状态编码。“
沈妍盯着那个示意图看了好一会儿。
然后轻轻点了点头。
“我明白了。“
两天的讨论下来。
梯度版NDP的整体架构基本上定下来了。
3月25日,周三。
两人正式开始编程。
陈林负责核心的梯度计算模块。
沈妍负责数据处理和辅助功能。
分工明确,各司其职。
下午三点左右。
沈妍遇到了一个问题。
她对于某个步骤的代码实现不太确定。
于是站起身,走到陈林的工位旁边。
“陈林,有个地方想问你一下。“
陈林抬起头。
“什么问题?“
沈妍把她的笔记本电脑搬了过来。
放在陈林旁边。
屏幕上显示着一段代码。
“这里的梯度裁剪。“
她指着屏幕上的某一行:
“我不太确定阈值应该设多少。“
陈林看了看那段代码。
想了想。
然后拿起笔,在旁边的草稿纸上画了一个示意图。
“你可以这么理解......“
他开始讲解。
声音不大,但很清晰。
沈妍听得很认真。