1. モデルの準備・ロード
Hugging Faceから直接DLしてブラウザにキャッシュするか、ローカルに保存済みのGGUFファイル(Qwen3.6-27B等含む)を選択します。
GPUオフロード設定
※99=全レイヤーWebGPU優先
メモリ消費量に影響します
LLAMA.CPP & WEBGPU LOGS
[SYSTEM] ページがロードされました。WebGPUランタイム待機中...
ローカル・推論チャット
推論速度: -- t/s
キャッシュ: 未使用
こんにちは!私はWebGPU駆動のWllamaサンドボックスです。左側のパネルからGGUF形式のモデルをロードして、完全なローカル・オフラインAIチャットを始めましょう。