Skip to content

656 个字 预计阅读时间 3 分钟 共被读过

2025-W02-01

Review

Completed

  • 实验室打工
    • 换了 pipeline 中的一个步骤,效果变好了很多,然后就造了几天的数据。
    • 感觉一小部分的工作差不多,然后要开始训练了?
  • 学了点 RL
    • 其实感觉还是挺有意思的,多臂老虎机,MCTS 搜索,然后看着别人的仓库写了个 alpha zero
    • 去了解了一下 DPO, 看了点视频,也挺有意思的。
  • 捡起来 CS61C
    • 星期六心情不好,然后 emo 了一整天,晚上想了想,感觉还是要把基础的学了,就回去继续做 CS61C 了。
    • 还是挺有意思的,看了 4 lecture,做了 2 lab,把 proj3 做了。
    • proj3 造了个基于 RISC-V cpu,最后写了个二级流水线,就处理了一下跳转语句的 hazard(还是最 low 的,就搞点 bubble 就好了。本来还以为会有 forwarding 之类的。但是确实,搭线累的一批,对指令也是熟悉了一点。
    • 几个 lab 就是主要是为 proj 铺垫的一些用来熟悉 logisim 的,和一些关于 cache 的知识:block_size,TIOl,LRU,associativity 之类的,不得不说 61C 老师是真有激情。中间去听了 15-213 的讲 cache 的,直接就把这些概念扔出来了,感觉不如 61C 讲得好。
  • 跟着 Andrej Karpathy 写了个 mirograd
    • 大概就是写个 mini pytorch,不过只能支持一些四则运算 / 指数啥的,主要就是 chain rule 的运用。
    • 但是讲得真好啊,一层一层展开,他的代码能力也是很强,信手拈来很多实现。感觉对代码实现的理解更细致了一些。

Uncompleted

  • 调整作息
    • 基本每天还是睡的晚,焦虑,迷茫。
  • 看论文
    • 没怎么看,主要是没有方向。最近还是先学学传统 CS 吧。

Next Week Plan

  • 也许继续学 CS61C,也许学 15-213, 也许去看 OSTEP 然后开 081 了。没想好。
  • 写个简单的 GPT2 ?主要是整理以前学过的知识。
  • 继续学 RL,然后读读 RLHF 的工作,看看 DPO 具体实现。
  • 实验室打工,估计下个星期工作量不会小。
  • 回高中宣讲。

THOUGHTS

  • emo,感觉那条路都不好走。想到如果要做大模型就要有卡,然后就要去实习。然后 GPA 就不保,学校这里没用的课还好多,还要签到。
  • 感觉基本一直都是一个人在路上,东搞搞西搞搞。🤣,大概我太封闭了。