hiyouga/LLaMA-Factory v0.9.1 on GitHub

🔥Support Llama-3.2 and Llama-3.2-Vision by @marko1616 in #5547 and #5555
🔥Support LLaVA-NeXT, LLaVA-NeXT-Video and Video-LLaVA by @BUAADreamer in #5574
🔥Support Pixtral model by @Kuangdd01 in #5581
Support EXAONE3.0 by @shing100 in #5585
Support Index-series models by @Cuiyn in #5910
Support Liger-Kernel for Qwen2-VL by @aliencaocao in #5438
Support download models from ModelHub by @huniu20 in #5642
Fix abnormal loss values in transformers 4.46 by @hiyouga in #5852 #5871
Support multi-image inference by @hiyouga in #5895
Support calculating effective tokens for SFT and DPO by @wtmlon in #6078

Note: now you can install transformers>=4.46.0,<=4.46.1 to make the gradient accumulation fix enabled.

Update version of rocm docker by @HardAndHeavy in #5427
Fix Phi-3-small template by @menibrief in #5475
Fix function call dataset process function by @whybeyoung in #5483
Add docker args by @StrangeBytesDev in #5533
Fix logger by @chengchengpei in #5546
Fix Gemma2 flash attention warning by @amrear in #5580
Update setup by @johnnynunez in #5615 #5665
Add project by @NLPJCL in #5801
Fix saving Qwen2-VL processor by @hiyouga in #5857
Support change base image in dockerfile by @sd3ntato in #5880
Fix template replace behaviour by @hiyouga in #5907
Add image_dir argument by @hiyouga in #5909
Add rank0 logger by @hiyouga in #5912
Fix DPO metrics by @hiyouga in #5913 #6052
Update datasets version by @hiyouga in #5926
Fix chat engines by @hiyouga in #5927
Fix vllm 0.6.3 by @hiyouga in #5970
Fix extra args in llamaboard by @hiyouga in #5971
Fix vllm input args by @JJJJerry in #5973
Add vllm_config args by @hiyouga in #5982 #5990
Add shm_size in docker compose config by @XYZliang in #6010
Fix tyro version by @hiyouga in #6065
Fix ci by @hiyouga in #6120
Fix Qwen2-VL inference on vLLM by @hiyouga in #6123 #6126
Release v0.9.1 by @hiyouga in #6124
Fix #3881 #4712 #5411 #5542 #5549 #5611 #5668 #5705 #5747 #5749 #5768 #5796 #5797 #5883 #5904 #5966 #5988 #6050 #6061

Full Changelog: v0.9.0...v0.9.1

hiyouga/LLaMA-Factory v0.9.1 v0.9.1: Many Vision Models, Qwen2.5 Coder, Gradient Fix on GitHub