精心排版了一本书
整理了一版王教授的日记体传记最近在读王教授的这本写于1994年的日记,收获很多。网络上不难找到很多PDF的电子版,但是发现所有书籍的排版质量均不佳,严重影响阅读体验。于是,在我自己阅读本书的同时,产生了这样一个想法,精选一些好的篇章,使用latex重新精排一下。 第一次听说这本书,是在沧州一中就读期间(高一),政治老师刘欣湄在课堂上提到过。依稀记得老师当时在课堂上说,这个作者很牛逼,很多社会现象都
2025年度总结
一篇一篇地去翻看自己这一年每个月的月度总结,发现时间过的真快。这一年感觉做了很多事情,也感觉没做很多事情。 收获还是蛮多的专业层面: 系统地掌握的LLM基本原理 系统地复现了一系列LLM/VLM源码结构设计细节 发了一篇CCF-C论文 发了一篇专利 性格方面: 更加开朗、更加主动了 身体方面: 系统性开始健身,比去年更壮了,体脂变低了,快有腹肌了(加油💪) 财富方面: 国科
2025年12月总结与展望
焦虑为啥坐立难安,因为科研上实在没有进展了。。。💔 这个月挺难的,每天在工位,浑浑噩噩地就过去了。可能到冬天了,一到工位浑身就不自在,犯困🥱 好在26号晚上和秦老师聊了一个多小时,稍微喘了口气。能感觉到秦老师一直在强调稳扎稳打,好工作还是要有扎实的积累和沉淀。 珍惜机会,积极主动。 读了两本传记,一本日记这个月淘了两本近乎绝版的书,一本是温总理写的《地质笔记》,一本李明博的个人传记《经营未来》
2025年11月总结与展望
11月留下的文字不多,因为11月大部分时间都在代码实战,收获还是蛮多的。 越来越文艺了一直觉着自己是个粗人,活得很粗糙。我其实是不太注重自己衣着打扮这些的,但是来到科学院读研究生以来,慢慢的开始有所改变了。朋友们大多都是非常体面、立整的人,都会把自己收拾的干干净净的,向优秀的人看齐,把自己收拾立整了,也是对自己最大的尊重。习惯了干净,生活才会变的干净。 我和lcx都是比较闷、娱乐活动比较少的人;从
Colpali 复现与源码剖析
写在前面——谈谈我认为的论文复现绝对不是按着GitHub上READ文件跑一遍,而是仔细去阅读源代码,真正弄清楚代码的设计逻辑》前提是你复现的工作作者非常的良心,譬如这篇colpali工作,基本都很透明。 这篇工作我是真去下功夫去理解复现的,前前后后奖奖将近两周多一点。实验记录我整理的非常详细,每一张架构图、类图都是我通过阅读源代码精心制作的,希望能让大家弄清楚colpali的结构设计。 侯捷老师说
从ColBERT到Colpali
从ColBERT到Colpali,唯一不变的核心本质是Late interaction——晚交互机制。 理解Late interaction梳理一下Late interaction之前所有的“Query-Document”交互方式: 双塔结构:将query和文档各自编码为一个向量,然后通过简单的点积或余弦相似度计算分数。 缺点:强行