2025  13

五月  2

vLLM:高吞吐、有效内存的LLM服务引擎

2025-05-17 · 15 分钟 · 7477 字 · Yue Shui

多模态大语言模型

2025-05-04 · 38 分钟 · 18647 字 · Yue Shui

四月  2

DeepSeek-V2 vs V3

2025-04-18 · 46 分钟 · 23038 字 · Yue Shui

LLaMA 系列模型

2025-04-06 · 26 分钟 · 12788 字 · Yue Shui

三月  2

大语言模型智能体

2025-03-27 · 24 分钟 · 11998 字 · Yue Shui

训练大模型并行和内存优化技术

2025-03-01 · 46 分钟 · 22788 字 · Yue Shui

二月  4

OpenAI Deep Research 案例分享 - 深度研究技术综合研究报告

2025-02-15 · 52 分钟 · 25985 字 · Yue Shui & OpenAI Deep Research

大语言模型对齐: 直接偏好优化(DPO)

2025-02-08 · 9 分钟 · 4127 字 · Yue Shui

RAG 技术综述(长期更新中)

2025-02-03 · 13 分钟 · 6494 字 · Yue Shui

深度学习中的归一化

2025-02-01 · 10 分钟 · 4690 字 · Yue Shui

一月  3

OpenAI o1复现进展:DeepSeek-R1

2025-01-27 · 36 分钟 · 17571 字 · Yue Shui

Transformer注意力机制:MHA、MQA与GQA的对比

2025-01-16 · 22 分钟 · 10726 字 · Yue Shui

构建特定领域的大语言模型

2025-01-05 · 18 分钟 · 8675 字 · Yue Shui

2024  1

十二月  1

基于双卡 RTX 4090 搭建家用深度学习主机

2024-12-21 · 9 分钟 · 4095 字 · Yue Shui

2021  1

四月  1

基于深度学习的股票价格预测和量化策略

2021-04-21 · 51 分钟 · 25260 字 · Yue Shui