2025-W11-03¶

Review¶

周末写了一个 RSS + RAG 的小 bot 玩玩。
周中写了一个 QQ bot（总算是成功了，换了一套技术栈，用自己熟悉语言 NcatBot + NapCatQQ 作为 api 接口）
- GitHub - WncFht/QQ-Agent
- 把别人的 bot 抄了几个功能过来
- 然后用 Deepseek V3 的接口做了个总结 bot，效果还行。
- 还接了个 RAG，后续打算把自己的项目接上去。
拿和朋友的聊天记录微调了一下 GLM-4，玩了玩 LoRA & p-tuning v2 等 PEFT 方案，不过效果不是很好。对于 9B 模型来说我的卡和数据量都不太够。而且我也懒得进行数据预处理，导致模型总是摆烂发表情。
看完了 smolagent 的代码，然后被 Mentor 订了个 meeting 的时间，火速看 agent memory 的论文。不过感觉现在的论文很多都水啊。
重构了标注软件的代码，进行了封装，感觉用 cursor 写代码写多了，就总是关注架构层面的东西。
调研了一下现在的 AI 落地应用和所有 agent 相关的论文，下周再好好研究一下。
- 自己提的方案感觉还不错
开了个仓库，用来放各种 AI 使用的技巧。
- GitHub - WncFht/Awesome-AI-Usage: A repo contains several best practice of AI tools, including cursor, relfy, chat model, agent.
看了看 lerobot 的代码，去实验室玩了玩遥操作，有点意思，但是也太敏感了点。
用了一下 refly，确实很不错。感觉自己以前一直觉得 canvas 这种形式是给零基础的人群使用的，现在看来自己还是不愿意接收新事物。
整理开源了 obsidian 配置
- GitHub - WncFht/.obsidian

Next Week Plan¶

完善方案调研，并实现基本的 demo。
了解搜广推技术栈，大规模学习相关知识。
了解 RL 相关知识，梳理近期 LLM 相关论文。
去看看 transformer 之前的东西，尝试找点灵感。
也许
- 实现一个最简单的 code autocomplete，我还是比较好奇这里的性能优化的
- 用 discourse 搭建一个论坛
- 完善 QQ bot，尝试让它拥有 long-term memory，在和群友交流的过程中学习
- 看看 15445，了解一下数据库，用来完善现在的方案
- 去学一点独立开发的技能。前端大概是：Nextjs。不过这个再说吧，有点忙不过来。

THOUGHTS¶

我还挺喜欢现在在做的东西的，比挤着去发论文有意思多了。
输出才能让自己的知识学习有导向，有清晰的结构和框架。