2025年总结

31 Dec, 2025

回顾一下我经历的2025:

我今年早些，ds横空出世，首次在llm训练中引入RL，并且推出R1模型，这是我觉得一大亮点。当时也想做一些模型的研究，无论是应用还是训练，但是…由于基地不扎实，我只停留在了想法层面，而如今回看那些想法，也觉得那是些对于ai理解的不彻底导致的想法。转折点发生在报名ai课之后。

在6、7月时候报名了一个湛叔的ai课，开始系统地学习机器学习，从最简单的线性回归到Transformer，也有些概念和模型没学明白，但是这无所谓，因为学到了tinkering的技能，我觉得好老师并不只在于能不能把知识讲清楚（现在很多ai都可以做到），而在于能不能教你tinker ，或者启发你去tinker，tinker在该语境下是捣鼓的意思。当你只有每周一节课和只有18节课的时间，处于模型结构跨越几十年的过程中，以及数学基础不扎实的情况下，你会发现如果你不去捣鼓那些结构和模型，你只会对它们留有模糊的印象，哦是的，我知道它，但是它到底是什么样的，适合什么场景，我可以如何改造它。这些具体的应用和实践你无法做到，你只是run了一遍教科书上的代码，这谁都可以做到，因为代码是写好的，结果也是有预期的，而对于那些未知的东西，你没有预期的结果，你只有去摸索和tinker，你的理解发生于tinker：我能不能把模型的维度数提升到512，多加几层全连接，让ai教我用非手动地寻找最佳超参数，这些细节只有自己做过项目才能理解和掌握。湛叔也教过我们看论文，不要害怕那些新的论文，借助ai你完成可以把握它的思想，你掌握了思想，你只需要问ai将那些细节补充清楚，找数据集和写代码来做复现。是的，最重要的是理解核心想法。最后湛叔在最后的课上也谈到交互媒介的转变以及未来可能的情况，也值得深思。当然不止是模型上的理解，还有ai应用层面，Kyle也带我们从最基础的调用api到理解agent，最前沿的ai使用方式。这一路不仅加深了对于ai tools的理解，而且对于某些功能也祛魅了，它只不过如此。总之我觉得这算是今年最大的收获了，对于知识的惊叹❗️

我觉得ai的使用也随着技术的进步和我的理解而改变。最初我开始笨拙地调用不同厂商的api接口到cherry中，尝试着使用不同的system prompt，后来开始尝试mcp等ai工具，再到comet ai浏览器，ai的影响面不断扩大，以及最后到使用cli和claude code。这些过程历历在目，我也觉得可以通过看一个人如何使用ai来判断对方对于ai的理解程度。

ai的最后的惊叹，便是gemini-3.0 pro的出现，它是作为最好的学习ai。我觉得学的也更快了。还有谷歌利用ai在各方面的应用的成就，简直让人叹为观止。

除了ai方面还有个人成长方面……

开始接触不同的东西，不再用繁琐的事情和关系填补自己，开始享受自己的生活以及保持对于知识的追求。

还有时间，我欠太多债了，我还有太多想学没有学的知识，太多没有学明白的课，太多没有看完的书……我明年再好好还债。

最后以我在2025年1231，最后一天，编的模型收尾吧……期待2026年的ai变化。

好的时间超过了，不过我的模型也开始训练了。

#jotting