湖仓一体技术调研 湖仓一体技术调研 中国科学院大学计算机科学与技术学院 2025春·大数据系统与大规模数据分析 授课老师:陈世敏老师(https://www.shimin-chen.com/index-gb.html) 小组成员:杨桂淼、王子曰、王晓妍 2025-04-25 论文研读 #big data #分布式计算 #存储 #数据仓库 #数据湖
沐神论文阅读速览 2025年4月15日,星期二,晴天☀️,第58篇博客。 这篇Blog耗时长,花费了很大精力和心血,但是感觉一切都值得、有价值! 跟着李沐读经典论文今天听了大老师讲文献阅读课后很受启发,主要讲了文献阅读的方法以及如何找idea。 WWH → IDEA why:为什么要做这个研究? what:研究发现了什么? how:研究时如何实施的,用了什么方法? 明确科研目的 - 结果导向 以终为始 看文献 2025-04-15 论文研读 #LLM #人工智能 #MLLM
Ask in Any Modality 2025年4月1日,星期二,晴天☀️,第57篇博客。 Ask in Any Modality:多模态检索增强生成的研究综述本研究综述提供了对Multimodal-RAG系统的结构化和全面分析,涵盖了数据集、度量、基准、评估、方法以及检索、融合、增强和生成方面的创新。 2025-04-05 大模型相关 #RAG #多模态 #MLLM
王坚院士最新访谈录 2025年3月3日,星期一,阴天,第52篇博客。 谈谈阿里(我眼中的) 王坚:中国工程院院士,云计算技术专家,之江实验室主任,阿里巴巴集团技术委员会主席 我是一直看好阿里的,从本科接触到大数据技术以来,我就在一直慢慢探索大数据技术领域的领先技术。随着短视频爆火、电商领域重大变革,马老师退居二线“靠边站”,阿里系内部也有人事重大调整,很多人唱衰阿里。 2025-04-01 动机 #科研心路 #前沿讲座
2025年3月总结与展望 2025年3月31日,星期一,晴天☀️,第56篇博客。 3月的最后一周,难受3月最后一周非常难受,因为这周一整个周都没好天气,天气忽冷和热的给我整的很不适应,一周也没打球训练。。。 花粉过敏一直流鼻涕、打喷嚏,难受死我了。在北京的第一个春天,没想到会花粉过敏😢 上周一周为了跑实验、设计实验代码,熬夜/不按时吃饭、暴饮暴食又把胃口搞坏了 总之,3月的最后一周过的很衰。。。 但是,总体来看 2025-03-31 动机 #科研心路
2025年3月阅读书目与摘录反思 2025年3月24日,星期一,晴天☀️,第55篇博客。 自从买了汉王的Clear6便对墨水屏爱不释手了,开通了微信读书会员,感觉以后会在买纸质书上省下一大笔开销。2025年争取把买汉王阅读器的钱读回来,先读699块钱的书再说,加油,坚持!✊ 3月读完 《沧浪之水》 《深度学习入门:基于Python的理论与实践》 《征服市场的人》 《高质量读研:教你如何写论文、做科研》 3月在读 《大明王朝156 2025-03-24 动机 #科研心路
SmallCap Source Code 2025年3月15日,星期六,雨夹雪,第54篇博客。三一五打假日~ SmallCap复现与代码设计细节分析——基于Cursor Claude3.7-sonnet项目源代码:https://github.com/RitaRamo/smallcap 项目结构123456789101112131415161718192021222324252627282930313233343536373839smal 2025-03-15 大模型相关 #MLLM #VQA
从SmallCap出发切入Image Caption 2025年3月8日,星期六,晴天☀️,第53篇博客。今天是3·8妇女节,恭祝所有女神节日快乐!! SmallCap: Lightweight Image Captioning Prompted with Retrieval Augmentation CVPR 2023 研究背景 研究问题: 这篇文章要解决的问题是如何在减少计算资源消耗的情况下,生成高质量的Image Caption。当前的 2025-03-08 大模型相关 #MLLM #VQA
2025年2月总结与展望 2025年3月1日,星期六,雾霾,第51篇博客。 假期 -> 开学2月是过渡的一个月,从假期的状态慢慢恢复到了开学后的学习、工作状态。 2.24号开始,开学第一周。 结束完第一周的课程,感觉这半年又将是收获满满的一个学期,因为这学期选了几门感兴趣的硬核好课。 计算所陈云霁老师团队的《智能计算系统》当之无愧的好课,这门课很创新、很硬核。从软硬件、编程框架多角度剖析大模型时代下的计算系统;而且每 2025-03-01 动机 #科研心路
LLM开发必备 2025年2月26日,星期三,晴,第50篇博客。 困扰的问题:在进行RAG、多模态检索的实践中难免要调用大模型,但是由于“网络”和注册等诸多因素,使得我们很难方便调用的Open API。 推荐一个API网站:https://www.dmxapi.com/ ,网站集成了当前主流的大模型的调用方法。 openai接口使用openai库调用大模型: 12 2025-02-26 大模型相关 #LLM #RAG #部署