Model Alignment Articles

Page 1 of 1 (3 articles)

3/31/2024 • EN

Analysis of recent AI research papers on continued pretraining for LLMs and reward modeling for RLHF, with insights into model updates and alignment.

Continued Pretraining LLM Pretraining Model Alignment Reinforcement Learning Reward Modeling

3/31/2024 • EN

Discusses strategies for continual pretraining of LLMs and evaluating reward models for RLHF, based on recent research papers.

AI Research LLM Pretraining Model Alignment Reinforcement Learning Reward Modeling

3/4/2024 • EN

A technical paper exploring the causes, measurement, and mitigation strategies for hallucinations in Large Language Models (LLMs).

AI Safety Hallucination Mitigation large language models LLM Evaluation Model Alignment

Select Language