#Vps
27 messages · Page 1 of 1 (latest)
Je vĂ©rifie vite la doc pour ne pas te raconter nâimporte quoi.
Oui, câest faisable, mais il y a un point important, ce ne sera plus vraiment âlocalâ, ce sera self-hosted sur une VM/VPS.
En pratique :
- VPS CPU classique â pas suffisant pour un gros LLM
- VM avec GPU â oui, là ça devient rĂ©aliste
- gratuit â OK pour tester, pas fiable pour du 24/7 ni pour un gros modĂšle
Je te conseillerais 3 options :
-
Le plus simple
utiliser un modĂšle cloud via API, souvent moins cher et moins prise de tĂȘte quâune VM GPU -
Le plus âje garde la mainâ
louer une VM GPU et faire tourner Ollama dessus -
Pour tester quasi gratos
Oracle free / Colab / Kaggle, mais ça coupe souvent, donc pas top pour un assistant toujours allumé
Si tu veux brancher ça Ă OpenClaw + Ollama distant, il faut utiliser lâURL native dâOllama, pas /v1 :
{
models: {
providers: {
ollama: {
baseUrl: "http://ton-serveur:11434",
apiKey: "ollama-local",
api: "ollama"
}
}
}
}
Docs utiles :
Mon avis honnĂȘte, sur un MacBook Air, pour un âLLM puissantâ, le mieux est soit :
- API cloud si tu veux juste que ça marche
- GPU loué si tu veux absolument du self-hosted
Si tu veux, je peux te faire un plan concret selon ton budget :
- 0 Ă 20 âŹ/mois
- 20 Ă 80 âŹ/mois
- 80 âŹ+ /mois
Et on est dâaccord que si je loue une VM GPU ça va me revenir moins chers que si jutilise Claude sonnet par exemple
Non, pas forcĂ©ment. Pour un seul utilisateur, câest mĂȘme souvent lâinverse.
En gros :
- API cloud = tu paies Ă lâusage
- VM GPU = tu paies Ă lâheure / au mois, mĂȘme quand elle ne bosse pas
Donc :
- si tu fais usage occasionnel Ă moyen, lâAPI type Sonnet revient souvent moins cher
- si tu fais beaucoup de volume, longtemps chaque jour, ou pour plusieurs utilisateurs, la VM GPU peut devenir plus rentable
Les trucs quâon oublie souvent avec une VM GPU :
- temps dâadmin
- drivers / CUDA / Ollama / sécurité
- machine allumée en permanence
- modĂšle open source parfois moins bon ou moins fiable pour lâagentique que du cloud
Mon avis honnĂȘte :
- pour chatter / coder solo â cloud souvent meilleur rapport emmerdes/prix
- pour du gros volume continu â GPU louĂ© devient intĂ©ressant
Donc je ne partirais pas du principe âVM GPU = forcĂ©ment moins cherâ.
Câest vrai seulement si tu la rentabilises vraiment.
Si tu veux, je peux te faire un comparatif concret :
- usage léger
- usage moyen
- gros usage
et te dire Ă partir de quand la VM commence Ă gagner.
Câest quoi pour toi le LLM local le plus puissant qui existe
Franchement, je ne te donnerais pas un seul nom. Ăa bouge trop vite, et la vraie rĂ©ponse câest plutĂŽt :
le âplus puissantâ LLM local, câest le plus gros modĂšle open-weight rĂ©cent que tu peux faire tourner correctement sur ton hardware, sans le massacrer en quantization.
Les vrais critĂšres sont :
- taille réelle du modÚle
- qualité de la quantization
- VRAM dispo
- contexte supporté
- stabilité en tool calling / agentique
Pour OpenClaw, le point important câest surtout :
- les petits modĂšles locaux sont souvent trop fragiles
- un GPU 24 GB reste assez limitĂ© pour du âtrĂšs puissantâ
- pour un setup agentique vraiment costaud, on parle vite de gros GPU ou carrément de setup cloud
Donc si ta question est âle meilleur absolu ?â
ma rĂ©ponse honnĂȘte est : ne cherche pas un nom magique, cherche le plus gros modĂšle rĂ©cent que tu peux faire tourner stablement.
Pour des reco Ă jour, va plutĂŽt dans #models et regarde aussi :
- https://docs.openclaw.ai/concepts/models
- https://docs.openclaw.ai/concepts/models#model-discussions-community-notes
- https://docs.openclaw.ai/gateway/local-models
Si tu veux, je peux aussi te répondre autrement, plus utile :
âquel est le meilleur LLM local pour ton budget / ta VRAM / ton usage ?â
Dis moi quoi taper dans mon terminal pour
Installer la MAJ de open claw
Et pour que open claw fonctionne avec glm 5.1 cloud via ollama bien car il est bien en proposition dans ma conversation je lâai bien installer mais ça me marque failed to set model: gateway request error model not alowed ollama glm 5.1 cloud
Je vérifie la doc avant de te donner les commandes exactes.
Oui, là ton erreur est presque sûrement ça :
Model "... is not allowed" = tu as une allowlist dans agents.defaults.models, et ollama/glm-5.1:cloud nâest pas dedans.
Le plus simple, tape ça dans cet ordre :
openclaw --version
openclaw update
openclaw doctor
openclaw gateway restart
Puis pour GLM 5.1 cloud via Ollama :
ollama signin
openclaw models list --provider ollama
openclaw config unset agents.defaults.models
openclaw config set agents.defaults.model.primary "ollama/glm-5.1:cloud"
openclaw gateway restart
openclaw models status
Points importants :
- le nom exact câest
ollama/glm-5.1:cloud - il faut bien faire
ollama signin - si
openclaw models list --provider ollamane montre pasglm-5.1:cloud, refais lâonboarding Ollama :
openclaw onboard --auth-choice ollama
et choisis Cloud + Local
Si tu veux garder ton allowlist au lieu de la supprimer, on peut aussi lâajouter proprement, mais le unset est le fix le plus rapide.
Docs :
- https://docs.openclaw.ai/install/updating
- https://docs.openclaw.ai/providers/ollama
- https://docs.openclaw.ai/help/faq#why-do-i-see-model--is-not-allowed-and-then-no-reply
Si ça coince encore, colle-moi juste la sortie de :
openclaw --version
openclaw models list --provider ollama
openclaw config get agents.defaults.models --json
openclaw models status
et je te dirai exactement quoi corriger.
Je veux quâil utilise en premier plan glm 5.1cloud et quâil supprime qwen 3.5 et mistral nemo
Oui, si tu veux que OpenClaw nâutilise que ollama/glm-5.1:cloud et quâil nâaffiche plus Qwen 3.5 et Mistral Nemo dans son choix de modĂšles, tape ça :
ollama signin
openclaw config set agents.defaults.models '{"ollama/glm-5.1:cloud":{"alias":"glm"}}' --strict-json
openclaw config set agents.defaults.model.primary "ollama/glm-5.1:cloud"
openclaw gateway restart
openclaw models status
Ăa fait 2 choses :
- modĂšle principal =
ollama/glm-5.1:cloud - allowlist = seulement ce modÚle, donc Qwen 3.5 et Mistral Nemo ne seront plus proposés par OpenClaw
Si tu veux aussi les supprimer dâOllama sur le disque, fais ensuite :
ollama list
ollama rm <id-exact-de-qwen>
ollama rm <id-exact-de-mistral-nemo>
Important :
- prends les IDs exacts depuis
ollama list
(parfois câestqwen3.5:latestou autre) - pour
glm-5.1:cloud, pas besoin deollama pull, mais il faut bien ĂȘtre connectĂ© avecollama signin
Si tu veux, colle-moi la sortie de :
ollama list
openclaw models status
et je te donne les 2 commandes ollama rm exactes.
Jai ⊠auth-choice ollama je rĂ©ponds Ă tout jusquâĂ quâon me demande oĂč je veux discuter je fais skip car il a dĂ©jĂ mes info telegram et ça mâaffiche type error cannot read properties of unefined ( reading âtrimâ)
Je checke si câest un bug connu avant de te faire tourner en rond.
Oui, ça ressemble Ă un bug du prompt Skip sur lâĂ©tape âoĂč discuterâ.
Comme Telegram est déjà configuré chez toi, le plus simple est de ne pas passer par cette étape.
Tape ça :
openclaw --version
openclaw doctor
openclaw onboard --auth-choice ollama --skip-channels
Si tu veux Ă©viter carrĂ©ment lâonboarding complet et juste forcer GLM 5.1 cloud en modĂšle principal, fais directement :
ollama signin
openclaw config set agents.defaults.models '{"ollama/glm-5.1:cloud":{"alias":"glm"}}' --strict-json
openclaw config set agents.defaults.model.primary "ollama/glm-5.1:cloud"
openclaw gateway restart
openclaw models status
Donc en clair :
- bug actuel = quand tu fais Skip sur le choix du canal
- workaround =
--skip-channels - encore mieux dans ton cas = ne plus relancer tout lâonboarding, juste configurer le modĂšle directement
Si tu veux, je peux te donner la commande unique exacte selon ton objectif :
- rĂ©parer lâonboarding
- mettre GLM cloud par défaut tout de suite sans onboarding