ローカルLLM(GGUF)推論ビューア

指定URLのGGUFモデルをブラウザでダウンロードし、IndexedDBに保存して再利用しながら実推論を行います。Ollama互換の /api/tags / /api/generate / /api/chat も利用できます。

推論エンジンを初期化中...

※ 初回および定期的に約1GBの通信が発生します。

モデル未ロード(ボタン押下でダウンロード/キャッシュ再利用)
API状態: 未確認
ここにレスポンスが表示されます。
GET /api/tags POST /api/generate {"model":"default","prompt":"こんにちは","stream":false} POST /api/chat {"model":"default","messages":[{"role":"user","content":"こんにちは"}],"stream":false}

※ stream を省略すると既定値は true(NDJSON ストリーム)です。モデル未ロード時は 503 を返します。