Skip to content

672 个字 预计阅读时间 3 分钟 共被读过 120

2025-W11-03

Review

  • 周末写了一个 RSS + RAG 的小 bot 玩玩。
  • 周中写了一个 QQ bot(总算是成功了,换了一套技术栈,用自己熟悉语言 NcatBot + NapCatQQ 作为 api 接口)
    • GitHub - WncFht/QQ-Agent
    • 把别人的 bot 抄了几个功能过来
    • 然后用 Deepseek V3 的接口做了个总结 bot,效果还行。
    • 还接了个 RAG,后续打算把自己的项目接上去。
  • 拿和朋友的聊天记录微调了一下 GLM-4,玩了玩 LoRA & p-tuning v2 PEFT 方案,不过效果不是很好。对于 9B 模型来说我的卡和数据量都不太够。而且我也懒得进行数据预处理,导致模型总是摆烂发表情。
  • 看完了 smolagent 的代码,然后被 Mentor 订了个 meeting 的时间,火速看 agent memory 的论文。不过感觉现在的论文很多都水啊。
  • 重构了标注软件的代码,进行了封装,感觉用 cursor 写代码写多了,就总是关注架构层面的东西。
  • 调研了一下现在的 AI 落地应用和所有 agent 相关的论文,下周再好好研究一下。
    • 自己提的方案感觉还不错
  • 开了个仓库,用来放各种 AI 使用的技巧。
  • 看了看 lerobot 的代码,去实验室玩了玩遥操作,有点意思,但是也太敏感了点。
  • 用了一下 refly,确实很不错。感觉自己以前一直觉得 canvas 这种形式是给零基础的人群使用的,现在看来自己还是不愿意接收新事物。
  • 整理开源了 obsidian 配置

Next Week Plan

  • 完善方案调研,并实现基本的 demo
  • 了解搜广推技术栈,大规模学习相关知识。
  • 了解 RL 相关知识,梳理近期 LLM 相关论文。
  • 去看看 transformer 之前的东西,尝试找点灵感。
  • 也许
    • 实现一个最简单的 code autocomplete,我还是比较好奇这里的性能优化的
    • discourse 搭建一个论坛
    • 完善 QQ bot,尝试让它拥有 long-term memory,在和群友交流的过程中学习
    • 看看 15445,了解一下数据库,用来完善现在的方案
    • 去学一点独立开发的技能。前端大概是:Nextjs。不过这个再说吧,有点忙不过来。

THOUGHTS

  • 我还挺喜欢现在在做的东西的,比挤着去发论文有意思多了。
  • 输出才能让自己的知识学习有导向,有清晰的结构和框架。