forum | Unsloth AI | Page 15

How does max_seq_length affect a models current context window? 2 messages

May 15, 2025, 7:25 PM

Question about conversational datasets 3 messages

May 15, 2025, 6:42 PM

Pretraining then merging Gemma 3 doesn't work 5 messages

May 15, 2025, 4:21 AM Open

mistral:7.0-Instruct 4 messages

May 14, 2025, 6:26 PM

Gemma3 `save_pretrained_merged()` doesn't work. 98 messages

May 14, 2025, 8:30 AM Open

load_lora for Gemma3ForCausalLM 4 messages

May 14, 2025, 2:36 AM Solved

Custom Trainer 9 messages

May 14, 2025, 2:24 AM Solved

Question about dynamic quants 2 messages

May 13, 2025, 9:03 PM

Request for unsloth version of canopylabs/3b-hi-ft-research_release 12 messages

May 13, 2025, 11:36 AM Open

Help in understanding train_on_responses_only 3 messages

May 13, 2025, 10:51 AM Open

Fine tuning Qwen 3 - need tips to improve final loss 49 messages

May 13, 2025, 9:10 AM Solved

Tokenizing issue after installing unsloth 11 messages

May 12, 2025, 8:04 PM Open

undefined symbol: _ZN5torch3 3 messages

May 12, 2025, 1:54 PM Open

Qwen3-8B-Q4_K_M GGUF Looping forever 31 messages

May 12, 2025, 12:53 PM Open

RuntimeError: PassManager::run failed 2 messages

May 12, 2025, 12:18 PM Open

Difference between FastLanguageModel and FastModel. 3 messages

May 12, 2025, 10:04 AM Solved

Help in finetuning Qwen2.5 for SQL Generation 2 messages

May 12, 2025, 6:14 AM Open

Saving Gemma 3 LoRA finetune failed 7 messages

May 12, 2025, 5:48 AM Open

Model acting differently in colab than ollama. 2 messages

May 11, 2025, 3:46 PM

Segmentation fault (Core dumped) 2 messages

May 11, 2025, 6:44 AM

Running inference on saved model behaves weirdly 11 messages

May 11, 2025, 5:17 AM

Unsloth GRPO trainer evaluates entire eval set every eval_step 2 messages

May 9, 2025, 6:59 PM

Help on Choosing a Model for a Prompt-Processing. 7 messages

May 9, 2025, 4:00 PM Open

Merging 4-bit Checkpoint into Phi-4 Base Model – Model Inference Inconsistent 20 messages

May 9, 2025, 8:06 AM Open

Gemma3 Finetune Save_pretrained_merged error 31 messages

May 8, 2025, 9:42 PM

Vision finetune gemma3 raised "TypeError: 'int' object is not iterable." 479 messages

May 8, 2025, 8:08 AM

how can i use prompt-completion dataset and completion_only_loss paramater in SFTTrainer？ 4 messages

May 8, 2025, 3:29 AM

AttributeError: 'LLMEngine' object has no attribute 'model_executor' - fix in this thread 32 messages

May 7, 2025, 4:39 PM Open

Does this snippet only accepts GGUF models? 4 messages

May 7, 2025, 6:53 AM

QLORA's specific features 9 messages

May 7, 2025, 5:28 AM Open

How to use custom optimiser ? 14 messages

May 6, 2025, 3:48 PM

Gemma3 gguf conversion doesn't work 11 messages

May 6, 2025, 8:30 AM Open

Error creating PEFT model with Qwen3MoE 48 messages

May 5, 2025, 10:11 PM Open

modernbert issue 2 messages

May 5, 2025, 8:35 PM

Confused about reasoning + non-reasoning data mix in Qwen3 (14B) notebook 10 messages

May 5, 2025, 1:09 AM Open

BLEU compute metrics causes trainer to crash 4 messages

May 4, 2025, 12:54 PM Open

Help, unsloth compiled cash 2 messages

May 4, 2025, 12:08 PM

GRPO custom parameters 15 messages

May 3, 2025, 1:02 PM

Phi-4-reasoning not separating thought in llama.cpp 4 messages

May 1, 2025, 9:47 PM

NotImplementedError: No operator found for `memory_efficient_attention_backward` 39 messages

May 1, 2025, 4:39 PM Solved

Need some help to understand the results I got from custom dataset fientuning 66 messages

May 1, 2025, 9:42 AM

unsloth/Qwen3-32B-unsloth-bnb-4bit 4 messages

May 1, 2025, 5:46 AM

Questions regarding multi-turn conversation finetuning 13 messages

Apr 30, 2025, 11:20 AM Open

Thank you Unsloth bros 2 messages

Apr 29, 2025, 10:35 PM

Cannot load local checkpoints 61 messages

Apr 29, 2025, 7:54 PM

Qwen3 doesn't support vLLM 16 messages

Apr 28, 2025, 10:34 PM Open

So i tried to tune qwen using a grpo and eventually i got some problem. 55 messages

Apr 28, 2025, 11:35 AM Open

Unsloth: Failed to patch SmolVLMForConditionalGeneration forward function. 2 messages

Apr 27, 2025, 6:51 PM

Fine-tuning Gemma3 6 messages

Apr 26, 2025, 7:36 AM Solved

Support for GLM? 13 messages

Apr 26, 2025, 12:41 AM Open