Post Training Articles

Page 1 of 1 (3 articles)

1/23/2025 • EN

How to align open LLMs in 2025 with DPO and and synthetic data

A technical guide on aligning open-source large language models (LLMs) in 2025 using Direct Preference Optimization (DPO) and synthetic data.

Direct Preference Optimization LLM Alignment Post Training Preference Learning Synthetic Data

Philipp Schmid

8/17/2024 • EN

New LLM Pre-training and Post-training Paradigms

Analyzes the latest pre-training and post-training methodologies used in state-of-the-art LLMs like Qwen 2, Apple's models, Gemma 2, and Llama 3.1.

Fine Tuning Language Models llm Post Training Pre Training

Sebastian Raschka

8/17/2024 • EN

New LLM Pre-training and Post-training Paradigms

A technical review of the latest pre-training and post-training methodologies used in state-of-the-art large language models (LLMs) like Qwen 2 and Llama 3.1.

ai large language models llm Post Training Pre Training

Sebastian Raschka

Post Training Articles

How to align open LLMs in 2025 with DPO and and synthetic data

New LLM Pre-training and Post-training Paradigms

New LLM Pre-training and Post-training Paradigms

Select Language

We use cookies