Archive

2026 ¹

February ¹

Self-Evolving Agents

Created: 2026-02-20 · Updated: 2026-03-16 · 14 min · 2785 words · Yue Shui

2025 ¹⁷

December ¹

DeepSeek-V3.2 Series

Created: 2025-12-31 · Updated: 2025-12-31 · 14 min · 2917 words · Yue Shui

November ¹

Scaling Laws

Created: 2025-11-19 · Updated: 2025-12-03 · 12 min · 2365 words · Yue Shui

September ¹

Agentic RL

Created: 2025-09-30 · Updated: 2025-09-30 · 24 min · 5072 words · Yue Shui

August ¹

gpt-oss & GPT-5

Created: 2025-08-24 · Updated: 2025-08-24 · 12 min · 2541 words · Yue Shui

June ¹

Large Language Model Inference

Created: 2025-06-29 · Updated: 2025-06-29 · 43 min · 9025 words · Yue Shui

May ²

vLLM: High-Throughput, Memory-Efficient LLM Serving

Created: 2025-05-17 · Updated: 2025-05-17 · 20 min · 4204 words · Yue Shui

Multimodal Large Language Models

Created: 2025-05-04 · Updated: 2025-05-04 · 48 min · 10182 words · Yue Shui

April ²

DeepSeek-V2 vs V3

Created: 2025-04-18 · Updated: 2025-04-18 · 63 min · 13242 words · Yue Shui

The LLaMA Herd

Created: 2025-04-06 · Updated: 2025-04-06 · 33 min · 6862 words · Yue Shui

March ²

Large Language Model Agents

Created: 2025-03-27 · Updated: 2025-09-02 · 38 min · 7923 words · Yue Shui

Parallelism and Memory Optimization Techniques for Training Large Models

Created: 2025-03-01 · Updated: 2025-03-01 · 61 min · 12817 words · Yue Shui

February ²

LLMs Alignment: DPO

Created: 2025-02-08 · Updated: 2025-02-08 · 13 min · 2577 words · Yue Shui

Normalization in Deep Learning

Created: 2025-02-01 · Updated: 2025-02-01 · 13 min · 2576 words · Yue Shui

January ⁴

Deep Reinforcement Learning (Ongoing Updates)

Created: 2025-01-31 · Updated: 2025-01-31 · 34 min · 7230 words · Yue Shui

OpenAI o1 Replication Progress: DeepSeek-R1

Created: 2025-01-27 · Updated: 2025-01-27 · 48 min · 10182 words · Yue Shui

Attention Mechanisms in Transformers: Comparing MHA, MQA, and GQA

Created: 2025-01-16 · Updated: 2025-01-16 · 29 min · 6141 words · Yue Shui

Building Domain-Specific LLMs

Created: 2025-01-05 · Updated: 2025-01-05 · 21 min · 4340 words · Yue Shui

2024 ¹

December ¹

Building a Home Deep Learning Rig with Dual RTX 4090 GPUs

Created: 2024-12-21 · Updated: 2024-12-21 · 10 min · 1988 words · Yue Shui

2021 ¹

April ¹

Stock Price Prediction and Quantitative Strategy Based on Deep Learning

Created: 2021-04-21 · Updated: 2021-04-21 · 65 min · 13710 words · Yue Shui

2026 1

February 1

Self-Evolving Agents

2025 17

December 1

DeepSeek-V3.2 Series

November 1

Scaling Laws

September 1

Agentic RL

August 1

gpt-oss & GPT-5

June 1

Large Language Model Inference

May 2

vLLM: High-Throughput, Memory-Efficient LLM Serving

Multimodal Large Language Models

April 2

DeepSeek-V2 vs V3

The LLaMA Herd

March 2

Large Language Model Agents

Parallelism and Memory Optimization Techniques for Training Large Models

February 2

LLMs Alignment: DPO

Normalization in Deep Learning

January 4

Deep Reinforcement Learning (Ongoing Updates)

OpenAI o1 Replication Progress: DeepSeek-R1

Attention Mechanisms in Transformers: Comparing MHA, MQA, and GQA

Building Domain-Specific LLMs

2024 1

December 1

Building a Home Deep Learning Rig with Dual RTX 4090 GPUs

2021 1

April 1

Stock Price Prediction and Quantitative Strategy Based on Deep Learning

2026 ¹

February ¹

2025 ¹⁷

December ¹

November ¹

September ¹

August ¹

June ¹

May ²

April ²

March ²

February ²

January ⁴

2024 ¹

December ¹

2021 ¹

April ¹