约 672 个字 预计阅读时间 3 分钟 共被读过 120 次
2025-W11-03¶
Review¶
- 周末写了一个 RSS + RAG 的小 bot 玩玩。
- 周中写了一个 QQ bot(总算是成功了,换了一套技术栈,用自己熟悉语言 NcatBot + NapCatQQ 作为 api 接口)
- GitHub - WncFht/QQ-Agent
- 把别人的 bot 抄了几个功能过来
- 然后用 Deepseek V3 的接口做了个总结 bot,效果还行。
- 还接了个 RAG,后续打算把自己的项目接上去。
- 拿和朋友的聊天记录微调了一下 GLM-4,玩了玩 LoRA & p-tuning v2 等 PEFT 方案,不过效果不是很好。对于 9B 模型来说我的卡和数据量都不太够。而且我也懒得进行数据预处理,导致模型总是摆烂发表情。
- 看完了 smolagent 的代码,然后被 Mentor 订了个 meeting 的时间,火速看 agent memory 的论文。不过感觉现在的论文很多都水啊。
- 重构了标注软件的代码,进行了封装,感觉用 cursor 写代码写多了,就总是关注架构层面的东西。
- 调研了一下现在的 AI 落地应用和所有 agent 相关的论文,下周再好好研究一下。
- 自己提的方案感觉还不错
- 开了个仓库,用来放各种 AI 使用的技巧。
- 看了看 lerobot 的代码,去实验室玩了玩遥操作,有点意思,但是也太敏感了点。
- 用了一下 refly,确实很不错。感觉自己以前一直觉得 canvas 这种形式是给零基础的人群使用的,现在看来自己还是不愿意接收新事物。
- 整理开源了 obsidian 配置
Next Week Plan¶
- 完善方案调研,并实现基本的 demo。
- 了解搜广推技术栈,大规模学习相关知识。
- 了解 RL 相关知识,梳理近期 LLM 相关论文。
- 去看看 transformer 之前的东西,尝试找点灵感。
- 也许
- 实现一个最简单的 code autocomplete,我还是比较好奇这里的性能优化的
- 用 discourse 搭建一个论坛
- 完善 QQ bot,尝试让它拥有 long-term memory,在和群友交流的过程中学习
- 看看 15445,了解一下数据库,用来完善现在的方案
- 去学一点独立开发的技能。前端大概是:Nextjs。不过这个再说吧,有点忙不过来。
THOUGHTS¶
- 我还挺喜欢现在在做的东西的,比挤着去发论文有意思多了。
- 输出才能让自己的知识学习有导向,有清晰的结构和框架。