Wllama WebGPU Local Playground v3.4.1

ブラウザ上で100%ローカル稼働するWebGPU高速LLMランタイム

WebGPUを確認中...

1. モデルの準備・ロード

Hugging Faceから直接DLしてブラウザにキャッシュするか、ローカルに保存済みのGGUFファイル(Qwen3.6-27B等含む)を選択します。

GPUオフロード設定

※99=全レイヤーWebGPU優先
メモリ消費量に影響します
LLAMA.CPP & WEBGPU LOGS
[SYSTEM] ページがロードされました。WebGPUランタイム待機中...
ローカル・推論チャット
推論速度: -- t/s キャッシュ: 未使用

こんにちは!私はWebGPU駆動のWllamaサンドボックスです。左側のパネルからGGUF形式のモデルをロードして、完全なローカル・オフラインAIチャットを始めましょう。