AI¶
约 410 个字 预计阅读时间 2 分钟 共被读过 次
- DDAO
- UMich EECS 498-007 / 598-005: Deep Learning for Computer Vision课程笔记
- SpatialLM-Llama-1B
- 人工智能基础学习 - pd_ch's blog
- Policy-based Methods to DRL
- Ng-Machine learning 课程笔记 - amaranth的叶栈漫谈
- 群友整理的 AI 高阶课程列表(更新中)
- 动手学深度学习笔记:CNN、RNN、CV、NLP
- Diffusion入门资源整理(持续更新ing) - 嘉然今天赶DDL
- 概率图模型&机器学习 -- 精确推断方法 -- 变量消去(Variable Elimination)和信念传播(Belief Propagation) - 伊犁纯流莱 - 博客园
- 深度学习知识合集 · 语雀
- 读AFL++的文档总结
- 变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)串讲 - 伊犁纯流莱 - 博客园
- CMU10414-hw0 - PAC's Blog
- multimodal (vision-language) 的话可以看看
- Hugging Face
RL¶
- OpenAI RL
- Reward Hacking in Reinforcement Learning - Lil'Log
- 王树森深度强化学习 L1
- 王树森深度强化学习 L2
- 王树森深度强化学习 L3
- 王树森 深度强化学习 L4 - Actor-Critic方法
- 王树森 深度强化学习 L5 - AlphaGo
- 王树森 深度强化学习 L6 - Monte Carlo
- 王树森 深度强化学习 L7 - 均匀随机排列与Fisher-Yates算法
- 王树森 深度强化学习 L8,9,10 - TD-learning
- 王树森 深度强化学习 L10,11,12 - 价值学习高级技巧
- 王树森 深度强化学习 L13,14,15,16 - 策略梯度中的baseline
- 王树森 深度强化学习 L17,18,19 - 连续控制
-
Simple PyTorch Implementations of Deep RL Algorithms for Continuous Control Research