Skip to content

Awesome Tech Share

AI

Initializing search

Awesome-Tech-Share

Home
CS课程
数学
后端
嵌入式
算法
系统
图形学
编译器
科研
工具
总结
其他
杂谈
Tags
贡献者

Awesome Tech Share

Awesome-Tech-Share

Home
CS课程
CS课程
- C++
- 6.S081
- AI AI
  Table of contents
  - RL
- CS61A
- CS61C
- CSAPP
- 电路理论
- 算法
- 软件分析
- CS236
- CS285
- None
- 湖科大计算机网络
数学
数学
- 数学课程
- 杂谈
后端
后端
- 后端
嵌入式
嵌入式
- 嵌入式
算法
算法
- 算法基础
- 具身智能
- 多模态
- RAG
- LLM
- AI Agent
- AIGC
系统
系统
- 系统
- MLSys
图形学
图形学
- 图形学
编译器
编译器
- 编译器和编程语言
科研
科研
- 科研
工具
工具
- 工具
总结
总结
- 总结
其他
其他
- 暂时难以整理的
杂谈
杂谈
- 杂谈
Tags
Tags
贡献者

Table of contents

RL

#AI #RL #DL

AI¶

约 410 个字预计阅读时间 2 分钟共被读过次

DDAO
UMich EECS 498-007 / 598-005: Deep Learning for Computer Vision课程笔记
SpatialLM-Llama-1B
人工智能基础学习 - pd_ch's blog
Policy-based Methods to DRL
Ng-Machine learning 课程笔记 - amaranth的叶栈漫谈
群友整理的 AI 高阶课程列表（更新中）
动手学深度学习笔记：CNN、RNN、CV、NLP
Diffusion入门资源整理(持续更新ing) - 嘉然今天赶DDL
概率图模型&机器学习 -- 精确推断方法 -- 变量消去(Variable Elimination)和信念传播(Belief Propagation) - 伊犁纯流莱 - 博客园
深度学习知识合集 · 语雀
读AFL++的文档总结
变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)串讲 - 伊犁纯流莱 - 博客园
CMU10414-hw0 - PAC's Blog
multimodal (vision-language) 的话可以看看
Hugging Face

RL¶

OpenAI RL
Reward Hacking in Reinforcement Learning - Lil'Log
王树森深度强化学习 L1
王树森深度强化学习 L2
王树森深度强化学习 L3
王树森深度强化学习 L4 - Actor-Critic方法
王树森深度强化学习 L5 - AlphaGo
王树森深度强化学习 L6 - Monte Carlo
王树森深度强化学习 L7 - 均匀随机排列与Fisher-Yates算法
王树森深度强化学习 L8，9，10 - TD-learning
王树森深度强化学习 L10，11，12 - 价值学习高级技巧
王树森深度强化学习 L13，14，15，16 - 策略梯度中的baseline
王树森深度强化学习 L17,18,19 - 连续控制
王树森深度强化学习 L20 - 置信域策略优化
王树森深度强化学习 L21，22 - 多智能体强化学习（完结篇）
Simple PyTorch Implementations of Deep RL Algorithms for Continuous Control Research
Teaching Robots to Listen and Think Harder

May 11, 2025 15:19:24 February 16, 2025 22:58:11

Powered by MkDocs with theme Material modified by WncFht