English
全部
搜索
图片
视频
短视频
地图
资讯
Copilot
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
20:37
YouTube
Shaw Talebi
Reinforcement Learning with LLMs: a new era of AI agents
📈 Transform Your Business with AI: https://aibuilder.academy/yt/slJqu3N16Xc 🤓 Get the (free) Claude Code Course: https://aibuilder.academy/courses/yt/slJqu3N16Xc This is the 2nd video in a larger series on reinforcement learning (RL) with LLMs. Here, I discuss 3 ways people are using RL to train modern LLMs and AI agents. ️ Series ...
已浏览 3869 次
2 个月之前
LLM Study Tips
28:37
JMI LLM Updated Syllabus 2026 📚 | Complete Breakdown + Subjects, Pattern & Preparation Strategy
YouTube
MLS LAW ACADEMY
已浏览 288 次
1 个月前
13:14
NISM LLM 2026 Preparation Strategy | Complete Syllabus & Subject-Wise Plan
YouTube
Jurisedge LLM & UGC Law
已浏览 768 次
2 个月之前
1:06:12
Mastering LLM Chatbots And RAG Evaluation Crash Course
YouTube
Krish Naik
已浏览 2.5万 次
1 个月前
热门视频
11:56:26
LLM Fine-Tuning Course – From Supervised FT to RLHF, LoRA, and Multimodal
YouTube
freeCodeCamp.org
已浏览 5.7万 次
1 个月前
39:33
Reinforcement Learning with Verifiable Rewards - Teaching LLMs to Solve Problems
YouTube
Adam Lucek
已浏览 5530 次
5 个月之前
32:34
LLM Full Course 2026 | LLM Tutorial For Beginners | Introduction to LLM | LLM Training | Simplilearn
YouTube
Simplilearn
已浏览 1467 次
3 周前
LLM Application Process
9:22:21
Generative AI+LLM Full Course 2026 | Gen AI & LLM Tutorial for Beginner | Gen AI Explained | Edureka
YouTube
edureka!
已浏览 1.1万 次
7 个月之前
31:29
Building LLM Application Part 1- Prompt Engineering
YouTube
M365 & Modern Tech Hub
已浏览 1837 次
4 个月之前
7:25
2025 BC Law LLM Application Workshop
YouTube
BC Law
已浏览 87 次
5 个月之前
11:56:26
LLM Fine-Tuning Course – From Supervised FT to RLHF, LoRA, and Multimodal
已浏览 5.7万 次
1 个月前
YouTube
freeCodeCamp.org
39:33
Reinforcement Learning with Verifiable Rewards - Teaching LLMs to Solve Problems
已浏览 5530 次
5 个月之前
YouTube
Adam Lucek
32:34
LLM Full Course 2026 | LLM Tutorial For Beginners | Introduction to LLM | LLM Training | Simplilearn
已浏览 1467 次
3 周前
YouTube
Simplilearn
56:01
Lecture 4 - Reinforcement Learning - Basics | Reasoning LLMs from Scratch
已浏览 7554 次
2025年4月17日
YouTube
Vizuara
1:10:30
Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 10: RL for LLM Reasoning
已浏览 3754 次
4 个月之前
YouTube
Stanford Online
6:54
Microsoft Agent Lightning: Next-Gen LLM Reinforcement Learning Framework Explained
已浏览 960 次
5 个月之前
YouTube
AI Learning Hub - Byte-Size AI Learn
9:45
Reinforcement Learning With Human Values - New LLM Reasoning Training Method
已浏览 212 次
6 个月之前
YouTube
Vuk Rosić
51:06
How to finetune LLMs to THINK with Reinforcement Learning (GRPO from scratch!)
已浏览 2.5万 次
10 个月之前
YouTube
Neural Breakdown with AVB
1:18:19
Reinforcement Learning for LLMs in 2025
已浏览 1.5万 次
2025年2月10日
YouTube
Trelis Research
24:50
Reinforcement Learning: A (practical) introduction
已浏览 2783 次
3 个月之前
YouTube
Shaw Talebi
1:10:08
How to do Distributed RL Training for LLM? feat. Eric Yang from Gradient
已浏览 1316 次
3 周前
YouTube
Deep Learning with Yacine
9:16
Reinforcement Learning for LLM Reasoning. RL / RLHF / RLAIF.
已浏览 86 次
5 个月之前
YouTube
AI Podcast Series. Byte Goose AI.
1:01:58
[UCLA RL-LLM] Chapter 3.2: Reinforcement learning with verifiable rewards (RLVR)
已浏览 3640 次
9 个月之前
YouTube
Ernest Ryu
2:42:28
[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han
已浏览 11.2万 次
9 个月之前
YouTube
AI Engineer
18:09
How Reinforcement Learning Works (Tutorial)
已浏览 3.3万 次
4 个月之前
YouTube
Matthew Berman
1:04:07
verl: Flexible and Scalable Reinforcement Learning Library for LLM Reasoning and Tool-Calling
已浏览 4921 次
8 个月之前
YouTube
PyTorch
46:22
Train & Fine-Tune Your Own LLM - සිංහලෙන් | Pre-Training, Fine-Tuning with LoRA & QLoRA
已浏览 2006 次
2 周前
YouTube
Adomic
3:57
Efficient LLM RL Training with Experience Replay
已浏览 20 次
2 周前
YouTube
AI Research Roundup
3:14:37
RLHF from scratch, step-by-step, in code
已浏览 2825 次
10 个月之前
YouTube
Ashwani Kumar
2:02:52
Intro to Fine-Tuning Large Language Models
已浏览 5.7万 次
7 个月之前
YouTube
freeCodeCamp.org
1:05:48
Evolution Strategies at Scale: LLM Fine Tuning Beyond Reinforcement Learning
已浏览 454 次
1 个月前
YouTube
alphaXiv
5:04
How LLMs Are Actually Trained: Pre-Training vs. Post-Training Explained (with Julien Launay)
已浏览 4571 次
8 个月之前
YouTube
Super Data Science: ML & AI Podcast with Jo…
9:00
GDPO Explained: NVIDIA Fixes GRPO for LLM Reinforcement Learning
已浏览 3196 次
3 个月之前
YouTube
AI Papers Academy
2:15:04
LLM Course – Build a Semantic Book Recommender (Python, OpenAI, LangChain, Gradio)
已浏览 40.4万 次
2025年1月27日
YouTube
freeCodeCamp.org
1:35:48
[UCLA RL-LLM] Chapter 1.1: MDP foundations, imitation learning, and value iteration
已浏览 7758 次
9 个月之前
YouTube
Ernest Ryu
33:10
Reinforcement Learning (RL) for LLMs
已浏览 1.3万 次
2025年3月12日
YouTube
Natasha Jaques
29:38
Training LLM to play chess using Deepseek GRPO reinforcement learning
已浏览 1.9万 次
2025年3月1日
YouTube
Efficient NLP
13:42
GRPO 2.0? DAPO LLM Reinforcement Learning Explained
已浏览 6369 次
2025年3月25日
YouTube
AI Papers Academy
39:15
Advanced LLM Post-Training: SFT, DPO, Reinforcement Learning w/ Maxime Labonne (Liquid AI)
已浏览 274 次
5 个月之前
YouTube
Youth AI Initiative
展开
更多类似内容
反馈