2025年3月总结与展望 2025年3月31日,星期一,晴天☀️,第56篇博客。 3月的最后一周,难受3月最后一周非常难受,因为这周一整个周都没好天气,天气忽冷和热的给我整的很不适应,一周也没打球训练。。。 花粉过敏一直流鼻涕、打喷嚏,难受死我了。在北京的第一个春天,没想到会花粉过敏😢 上周一周为了跑实验、设计实验代码,熬夜/不按时吃饭、暴饮暴食又把胃口搞坏了 总之,3月的最后一周过的很衰。。。 但是,总体来看 2025-03-31 动机 #科研心路
2025年3月阅读书目与摘录反思 2025年3月24日,星期一,晴天☀️,第55篇博客。 自从买了汉王的Clear6便对墨水屏爱不释手了,开通了微信读书会员,感觉以后会在买纸质书上省下一大笔开销。2025年争取把买汉王阅读器的钱读回来,先读699块钱的书再说,加油,坚持!✊ 3月读完 《沧浪之水》 《深度学习入门:基于Python的理论与实践》 《征服市场的人》 《高质量读研:教你如何写论文、做科研》 3月在读 《大明王朝156 2025-03-24 动机 #科研心路
SmallCap Source Code 2025年3月15日,星期六,雨夹雪,第54篇博客。三一五打假日~ SmallCap复现与代码设计细节分析——基于Cursor Claude3.7-sonnet项目源代码:https://github.com/RitaRamo/smallcap 项目结构123456789101112131415161718192021222324252627282930313233343536373839smal 2025-03-15 大模型相关 #MLLM #VQA
从SmallCap出发切入Image Caption 2025年3月8日,星期六,晴天☀️,第53篇博客。今天是3·8妇女节,恭祝所有女神节日快乐!! SmallCap: Lightweight Image Captioning Prompted with Retrieval Augmentation CVPR 2023 研究背景 研究问题: 这篇文章要解决的问题是如何在减少计算资源消耗的情况下,生成高质量的Image Caption。当前的 2025-03-08 大模型相关 #MLLM #VQA
王坚院士最新访谈录 2025年3月3日,星期一,阴天,第52篇博客。 谈谈阿里(我眼中的) 王坚:中国工程院院士、之江实验室主任、阿里云创始人 我是一直看好阿里的,从本科接触到大数据技术以来,我就在一直慢慢探索大数据技术领域的领先技术。随着短视频爆火、电商领域重大变革,马老师退居二线“靠边站”,阿里系内部也有人事重大调整,很多人唱衰阿里。 但是我是一直看好阿里的,因为我 2025-03-04 动机 #科研心路 #前沿讲座
2025年2月总结与展望 2025年3月1日,星期六,雾霾,第51篇博客。 假期 -> 开学2月是过渡的一个月,从假期的状态慢慢恢复到了开学后的学习、工作状态。 2.24号开始,开学第一周。 结束完第一周的课程,感觉这半年又将是收获满满的一个学期,因为这学期选了几门感兴趣的硬核好课。 计算所陈云霁老师团队的《智能计算系统》当之无愧的好课,这门课很创新、很硬核。从软硬件、编程框架多角度剖析大模型时代下的计算系统;而且每 2025-03-01 动机 #科研心路
LLM开发必备 2025年2月26日,星期三,晴,第50篇博客。 困扰的问题:在进行RAG、多模态检索的实践中难免要调用大模型,但是由于“网络”和注册等诸多因素,使得我们很难方便调用的Open API。 推荐一个API网站:https://www.dmxapi.com/ ,网站集成了当前主流的大模型的调用方法。 openai接口使用openai库调用大模型: 12 2025-02-26 大模型相关 #LLM #RAG #部署
开工大吉 2025年2月5日,乙巳年正月初八,星期三,晴,第49篇博客/2025年第8篇博客,正式开工!!! 关于DeepSeek以及未来1年有关LLM的一些观点和思考 观点整理自刘焕勇老师,转发切记注明出处! 明天就开工了,针对deepseek,我们静下心来看看,这波造神热度迟早要消散或者翻车。LLM帮大家解决落地问题,让大家有饭吃,有活干,才能 2025-02-05 动机 #生活随笔
2025年1月总结与展望 2025年1月30日,星期四,阴天,这是写的第48篇博客文章。 这个月很忙,主旋律是考试与春节·过年。咱中华文化就是博大精深,按理说,每年的1月、2月都应该是一年的开端,事情的开始阶段所有人的状态都应该鼓足干劲的。但是我们中国人不然,每年的1月、2月,中国人都要过自己的节日——春节。对于全体中国人来说,春节正式一年当中为数不多的放下手里工作回家团聚、休息调整的时光~ 只有过了春节,才真正意味着中国 2025-01-30 动机 #科研心路
梁文锋专访 暗涌Waves专访DeepSeek创始人梁文锋暗涌:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。 梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年 IT 浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里 18 个月就会出来更好的硬件和软件。Scaling Law 也在被如此对待。 但其实 2025-01-29 动机 #科研心路 #LLM #前沿讲座