2025年总结
回顾一下我经历的2025:
我今年早些,ds横空出世,首次在llm训练中引入RL,并且推出R1模型,这是我觉得一大亮点。当时也想做一些模型的研究,无论是应用还是训练,但是…由于基地不扎实,我只停留在了想法层面,而如今回看那些想法,也觉得那是些对于ai理解的不彻底导致的想法。转折点发生在报名ai课之后。
在6、7月时候报名了一个湛叔的ai课,开始系统地学习机器学习,从最简单的线性回归到Transformer,也有些概念和模型没学明白,但是这无所谓,因为学到了tinkering的技能,我觉得好老师并不只在于能不能把知识讲清楚(现在很多ai都可以做到),而在于能不能教你tinker ,或者启发你去tinker,tinker在该语境下是捣鼓的意思。当你只有每周一节课和只有18节课的时间,处于模型结构跨越几十年的过程中,以及数学基础不扎实的情况下,你会发现如果你不去捣鼓那些结构和模型,你只会对它们留有模糊的印象,哦是的,我知道它,但是它到底是什么样的,适合什么场景,我可以如何改造它。这些具体的应用和实践你无法做到,你只是run了一遍教科书上的代码,这谁都可以做到,因为代码是写好的,结果也是有预期的,而对于那些未知的东西,你没有预期的结果,你只有去摸索和tinker,你的理解发生于tinker:我能不能把模型的维度数提升到512,多加几层全连接,让ai教我用非手动地寻找最佳超参数,这些细节只有自己做过项目才能理解和掌握。湛叔也教过我们看论文,不要害怕那些新的论文,借助ai你完成可以把握它的思想,你掌握了思想,你只需要问ai将那些细节补充清楚,找数据集和写代码来做复现。是的,最重要的是理解核心想法。最后湛叔在最后的课上也谈到交互媒介的转变以及未来可能的情况,也值得深思。当然不止是模型上的理解,还有ai应用层面,Kyle也带我们从最基础的调用api到理解agent,最前沿的ai使用方式。这一路不仅加深了对于ai tools的理解,而且对于某些功能也祛魅了,它只不过如此。总之我觉得这算是今年最大的收获了,对于知识的惊叹❗️
我觉得ai的使用也随着技术的进步和我的理解而改变。最初我开始笨拙地调用不同厂商的api接口到cherry中,尝试着使用不同的system prompt,后来开始尝试mcp等ai工具,再到comet ai浏览器,ai的影响面不断扩大,以及最后到使用cli和claude code。这些过程历历在目,我也觉得可以通过看一个人如何使用ai来判断对方对于ai的理解程度。
ai的最后的惊叹,便是gemini-3.0 pro的出现,它是作为最好的学习ai。我觉得学的也更快了。还有谷歌利用ai在各方面的应用的成就,简直让人叹为观止。
除了ai方面还有个人成长方面……
开始接触不同的东西,不再用繁琐的事情和关系填补自己,开始享受自己的生活以及保持对于知识的追求。
还有时间,我欠太多债了,我还有太多想学没有学的知识,太多没有学明白的课,太多没有看完的书……我明年再好好还债。
最后以我在2025年1231,最后一天,编的模型收尾吧……期待2026年的ai变化。
好的时间超过了,不过我的模型也开始训练了。