api providers

— cerebras (recommended) cerebras is the default provider because it offers:

create a cerebras account

go to cloud.cerebras.ai and sign up for free.

generate an api key

once logged in, navigate to the api keys section and create a new key. copy it.

paste in layersense

open layersense settings → api tab → paste your key in the “api key” field.

select a model

recommended models:

cerebras free tier has generous rate limits. if you hit them, the plugin automatically retries with delays.

— google gemini (free) google offers a generous free tier for gemini models.

get your api key

go to aistudio.google.com and create an api key.

configure layersense

settings → api tab → provider: google gemini → paste your key.

select a model

— openrouter openrouter aggregates multiple providers and offers some free models.

create an account

go to openrouter.ai and sign up.

get your api key

find your api key in the dashboard.

configure layersense

settings → api tab → provider: openrouter → paste your key.

use free models

look for models tagged :free like:

— local (lm studio) run models on your own computer for complete privacy and no rate limits.

download lm studio

get it from lmstudio.ai — available for windows, mac, and linux.

download a model

inside lm studio, search for and download a model. recommended:

start the local server

in lm studio, go to the “local server” tab and click start. the default endpoint is http://127.0.0.1:1234/v1/chat/completions.

configure layersense

settings → api tab → provider: local (lm studio) → verify the endpoint matches your lm studio server.

local models require a decent gpu for fast inference. cpu-only works but is slower.

— paid providers if you already have api keys from paid providers:

provider	setup	recommended models
openai	paste your key, select provider “openai”	`gpt-5.1` (best for agents), `gpt-5-nano` (cheapest), `gpt-4.1-mini`
anthropic	paste your key, select provider “anthropic”	`claude-sonnet-4-5` (best balance), `claude-haiku-4-5` (fastest), `claude-opus-4-5` (most capable)

— which provider to choose?

your situation	recommended provider
just want it to work for free	cerebras with `gpt-oss-120b` (3,000+ tok/s)
need maximum privacy	local with lm studio
already have openai/anthropic keys	use your existing provider
want cutting-edge intelligence	google gemini with `gemini-3-pro`
want to try different models	openrouter for variety