#Vps

27 messages · Page 1 of 1 (latest)

split venture
#

si je peux tourner en local sur ollama sur un LLM trĂšs bruissant je veux le faire tourner sur un ordinateur virtuel ou louer au mois un connexion ou mĂȘme gratuitement mĂȘme si il faut coder ça mon Mac air nes pas assez puissant pour un LLM puissant en local

sick harborBOT
#

Je vĂ©rifie vite la doc pour ne pas te raconter n’importe quoi.

#

Oui, c’est faisable, mais il y a un point important, ce ne sera plus vraiment “local”, ce sera self-hosted sur une VM/VPS.

En pratique :

  • VPS CPU classique → pas suffisant pour un gros LLM
  • VM avec GPU → oui, lĂ  ça devient rĂ©aliste
  • gratuit → OK pour tester, pas fiable pour du 24/7 ni pour un gros modĂšle

Je te conseillerais 3 options :

  1. Le plus simple
    utiliser un modĂšle cloud via API, souvent moins cher et moins prise de tĂȘte qu’une VM GPU

  2. Le plus “je garde la main”
    louer une VM GPU et faire tourner Ollama dessus

  3. Pour tester quasi gratos

#

Oracle free / Colab / Kaggle, mais ça coupe souvent, donc pas top pour un assistant toujours allumé

Si tu veux brancher ça à OpenClaw + Ollama distant, il faut utiliser l’URL native d’Ollama, pas /v1 :

{
  models: {
    providers: {
      ollama: {
        baseUrl: "http://ton-serveur:11434",
        apiKey: "ollama-local",
        api: "ollama"
      }
    }
  }
}
#

Docs utiles :

Mon avis honnĂȘte, sur un MacBook Air, pour un “LLM puissant”, le mieux est soit :

  • API cloud si tu veux juste que ça marche
  • GPU louĂ© si tu veux absolument du self-hosted

Si tu veux, je peux te faire un plan concret selon ton budget :

  • 0 Ă  20 €/mois
  • 20 Ă  80 €/mois
  • 80 €+ /mois
split venture
#

Et on est d’accord que si je loue une VM GPU ça va me revenir moins chers que si jutilise Claude sonnet par exemple

sick harborBOT
#

Non, pas forcĂ©ment. Pour un seul utilisateur, c’est mĂȘme souvent l’inverse.

En gros :

  • API cloud = tu paies Ă  l’usage
  • VM GPU = tu paies Ă  l’heure / au mois, mĂȘme quand elle ne bosse pas

Donc :

  • si tu fais usage occasionnel Ă  moyen, l’API type Sonnet revient souvent moins cher
  • si tu fais beaucoup de volume, longtemps chaque jour, ou pour plusieurs utilisateurs, la VM GPU peut devenir plus rentable

Les trucs qu’on oublie souvent avec une VM GPU :

  • temps d’admin
  • drivers / CUDA / Ollama / sĂ©curitĂ©
  • machine allumĂ©e en permanence
  • modĂšle open source parfois moins bon ou moins fiable pour l’agentique que du cloud
#

Mon avis honnĂȘte :

  • pour chatter / coder solo → cloud souvent meilleur rapport emmerdes/prix
  • pour du gros volume continu → GPU louĂ© devient intĂ©ressant

Donc je ne partirais pas du principe “VM GPU = forcĂ©ment moins cher”.
C’est vrai seulement si tu la rentabilises vraiment.

Si tu veux, je peux te faire un comparatif concret :

  • usage lĂ©ger
  • usage moyen
  • gros usage
    et te dire Ă  partir de quand la VM commence Ă  gagner.
split venture
#

C’est quoi pour toi le LLM local le plus puissant qui existe

sick harborBOT
#

Franchement, je ne te donnerais pas un seul nom. Ça bouge trop vite, et la vraie rĂ©ponse c’est plutĂŽt :

le “plus puissant” LLM local, c’est le plus gros modĂšle open-weight rĂ©cent que tu peux faire tourner correctement sur ton hardware, sans le massacrer en quantization.

Les vrais critĂšres sont :

  • taille rĂ©elle du modĂšle
  • qualitĂ© de la quantization
  • VRAM dispo
  • contexte supportĂ©
  • stabilitĂ© en tool calling / agentique

Pour OpenClaw, le point important c’est surtout :

  • les petits modĂšles locaux sont souvent trop fragiles
  • un GPU 24 GB reste assez limitĂ© pour du “trĂšs puissant”
  • pour un setup agentique vraiment costaud, on parle vite de gros GPU ou carrĂ©ment de setup cloud
#

Donc si ta question est “le meilleur absolu ?”
ma rĂ©ponse honnĂȘte est : ne cherche pas un nom magique, cherche le plus gros modĂšle rĂ©cent que tu peux faire tourner stablement.

Pour des reco Ă  jour, va plutĂŽt dans #models et regarde aussi :

Si tu veux, je peux aussi te répondre autrement, plus utile :
“quel est le meilleur LLM local pour ton budget / ta VRAM / ton usage ?”

split venture
#

Dis moi quoi taper dans mon terminal pour
Installer la MAJ de open claw
Et pour que open claw fonctionne avec glm 5.1 cloud via ollama bien car il est bien en proposition dans ma conversation je l’ai bien installer mais ça me marque failed to set model: gateway request error model not alowed ollama glm 5.1 cloud

sick harborBOT
#

Je vérifie la doc avant de te donner les commandes exactes.

#

Oui, là ton erreur est presque sûrement ça :

Model "... is not allowed" = tu as une allowlist dans agents.defaults.models, et ollama/glm-5.1:cloud n’est pas dedans.

Le plus simple, tape ça dans cet ordre :

openclaw --version
openclaw update
openclaw doctor
openclaw gateway restart

Puis pour GLM 5.1 cloud via Ollama :

#
ollama signin
openclaw models list --provider ollama
openclaw config unset agents.defaults.models
openclaw config set agents.defaults.model.primary "ollama/glm-5.1:cloud"
openclaw gateway restart
openclaw models status

Points importants :

  • le nom exact c’est ollama/glm-5.1:cloud
  • il faut bien faire ollama signin
  • si openclaw models list --provider ollama ne montre pas glm-5.1:cloud, refais l’onboarding Ollama :
#
openclaw --version
openclaw models list --provider ollama
openclaw config get agents.defaults.models --json
openclaw models status

et je te dirai exactement quoi corriger.

split venture
#

Je veux qu’il utilise en premier plan glm 5.1cloud et qu’il supprime qwen 3.5 et mistral nemo

sick harborBOT
#

Oui, si tu veux que OpenClaw n’utilise que ollama/glm-5.1:cloud et qu’il n’affiche plus Qwen 3.5 et Mistral Nemo dans son choix de modùles, tape ça :

ollama signin
openclaw config set agents.defaults.models '{"ollama/glm-5.1:cloud":{"alias":"glm"}}' --strict-json
openclaw config set agents.defaults.model.primary "ollama/glm-5.1:cloud"
openclaw gateway restart
openclaw models status

Ça fait 2 choses :

  • modĂšle principal = ollama/glm-5.1:cloud
  • allowlist = seulement ce modĂšle, donc Qwen 3.5 et Mistral Nemo ne seront plus proposĂ©s par OpenClaw

Si tu veux aussi les supprimer d’Ollama sur le disque, fais ensuite :

#
ollama list
ollama rm <id-exact-de-qwen>
ollama rm <id-exact-de-mistral-nemo>

Important :

  • prends les IDs exacts depuis ollama list
    (parfois c’est qwen3.5:latest ou autre)
  • pour glm-5.1:cloud, pas besoin de ollama pull, mais il faut bien ĂȘtre connectĂ© avec ollama signin

Si tu veux, colle-moi la sortie de :

ollama list
openclaw models status
#

et je te donne les 2 commandes ollama rm exactes.

split venture
#

Jai 
 auth-choice ollama je rĂ©ponds Ă  tout jusqu’à qu’on me demande oĂč je veux discuter je fais skip car il a dĂ©jĂ  mes info telegram et ça m’affiche type error cannot read properties of unefined ( reading ‘trim’)

sick harborBOT
#

Je checke si c’est un bug connu avant de te faire tourner en rond.

#

Oui, ça ressemble Ă  un bug du prompt Skip sur l’étape “oĂč discuter”.

Comme Telegram est déjà configuré chez toi, le plus simple est de ne pas passer par cette étape.

Tape ça :

openclaw --version
openclaw doctor
openclaw onboard --auth-choice ollama --skip-channels

Si tu veux Ă©viter carrĂ©ment l’onboarding complet et juste forcer GLM 5.1 cloud en modĂšle principal, fais directement :

ollama signin
#
openclaw config set agents.defaults.models '{"ollama/glm-5.1:cloud":{"alias":"glm"}}' --strict-json
openclaw config set agents.defaults.model.primary "ollama/glm-5.1:cloud"
openclaw gateway restart
openclaw models status

Donc en clair :

  • bug actuel = quand tu fais Skip sur le choix du canal
  • workaround = --skip-channels
  • encore mieux dans ton cas = ne plus relancer tout l’onboarding, juste configurer le modĂšle directement

Si tu veux, je peux te donner la commande unique exacte selon ton objectif :

  1. rĂ©parer l’onboarding
  2. mettre GLM cloud par défaut tout de suite sans onboarding
split venture
#

Tu peux me donner un site pour trouver des skills pour que mon agent sois un machine de guerre

#

?