2025年2月总结与展望
2025年3月1日,星期六,雾霾,第51篇博客。
假期 -> 开学
2月是过渡的一个月,从假期的状态慢慢恢复到了开学后的学习、工作状态。
2.24号开始,开学第一周。
结束完第一周的课程,感觉这半年又将是收获满满的一个学期,因为这学期选了几门感兴趣的硬核好课。
计算所陈云霁老师团队的《智能计算系统》当之无愧的好课,这门课很创新、很硬核。从软硬件、编程框架多角度剖析大模型时代下的计算系统;而且每周四下午还第一次开设了这门课程对应的实验《智能计算系统开发与实践》,对于我这个不务正业的二流选手,岂有不蹭之理。
计算所徐俊刚老师团队的《深度学习》,国科大每年爆火的一门课程。希望这学期能认认真真跟下来,把每个实验都扎扎实实做完,再把DP的整个框架梳理梳理,建立起知识体系。徐俊刚老师这学期还开了一门《高级数据管理》,但是和我的论文讨论课冲突了,想着如果后面大老师不来的话,就翘了去听一听《高级数据管理》这门课。
计算所陈世敏老师的《大数据系统与大规模数据分析》是一门很硬的课,感觉比上学期《大数据技术》还要硬核。陈世敏老师是清华本硕,CMU博士。感觉听陈老师的课,总能听到一名互联网老兵对于技术的读到见解。
自动化所张家俊老师的《大模型技术与应用》也很不错,蹭课选手计划前两节课一定去认真听完。感觉张老师讲课很干练,基本功很扎实,没有废话、直击要害,NLP领域宗成庆老师团队的人果然都是大佬啊。
软件所彭启民老师的《Java程序设计》也值得一听,打算这学期跟着老师,把Java基础再夯实一遍。
非常幸运抢到了朱天宇老师的篮球课,以后每周二都能去打篮球咯,这学期要把篮球的基本技术在提高提高~
珍惜雁栖湖的教育资源,别和上学期一样总是逃课了😂
阅读收获
开学前购入了一款汉王clear6,墨水屏的小显示器像口袋书一样,完美地解决了我的阅读的需求。开通了微信读书会员,今年开始,要努力培养阅读习惯,多读点书。
《认知觉醒》
重新认识大脑:我们人类(这一物种)经过经过漫长的进化,大脑也是逐步进化的。从进化路径来看,大脑分为三种三范式演进过程:本能脑 → 情绪脑 → 理性脑。
- 本能脑源自于爬行时代,主管本能
- 情绪脑源于哺乳动物时代,主管情绪
- 理性脑源于灵长类动物时代,主管认知
本能脑和情绪脑伴随人类发展进化的时间最长,从远古人类开始,就是本能脑和情绪脑在支配着我们的行为,避难趋易、急于求成、躲避危险都是人性最基本的行为模式。
焦虑的根源在于:想同时做很多事,又想立即见到效果。焦虑时人的天性,是人类的默认出厂设置。千百年来所有人都一样,所以,允许自己适当的焦虑,不要较劲。
- 想同时做很多事:避难趋易
- 又想立即见到效果:急于求成
快速进步的本质就是永远让自己始终处于学习拉伸区(舒适区与难度区的交界)。
刻意练习是在处于拉伸区的同时,要定义明确清晰的目标(学会任务拆解、拆分目标) - 极度专注(最触动你的地方) - 有效的反馈 - 在拉伸区刻意练习。
一些基本问题
每个人的进度都是不同的,过分的关注别人的进度成果只会加剧自身的焦虑与迷茫,不要既想又想,还要必须有好结果。
做好科研的方法是什么?应该如何做有价值的科学研究?为了发论文而发,为了评奖评优而发??底层逻辑必须想清楚。
这半年要一直去想:如何做好科研?那么多学术大佬,他们的方法论是什么?怎么建立起来的?技术与研究要两手抓、两手都要硬。
任务
2月份完成的任务:
- 结合王鹏、谷清水、卞龙鹏新书《大模型RAG实战》梳理了RAG基础概念与范式变迁,完成对langchain框架学习。
- 动手实践了RAG-from-scratch的项目代码。
- 读了三篇关于Graph RAG的paper// 但是仍然找不到什么好的idea。
3月份目前计划要完成的任务:
- 实践RAGflow项目,复盘下多模态RAG的实践项目
- 总结梳理langchain框架的核心组件与常用方法,熟悉LCEL编程范式
- 总结一下常用的Tokenizer(中文/英文),熟练掌握文本预处理的技术(以拿到文本快速适配任何E-D架构为目标)