操作マニュアル

このページは、Android アプリ実装に合わせて、LLM tester with llama.cpp の使い方と挙動を整理した公開マニュアルです。

関連文書: 技術仕様 | プライバシーポリシー

【重要】ダウンロード通信について

モデルのダウンロードには数GB単位の通信が必要になる場合があります。モバイルデータ通信を使用すると高額な通信料が発生する可能性があるため、可能な限りWi-Fi環境でのダウンロードを強く推奨します。

1. アプリ概要

2. 初期設定(推奨手順)

  1. アプリ起動時にAPI/WebUI有効化ポップアップが表示された場合は、必要に応じて有効化するか、「次回以降は表示しない」をチェックすると次回から表示されません。
  2. 初回起動時のQuick Startで「次回以降は表示しない」をチェックすると、次回起動以降は表示されません。
  3. メイン画面で「設定」を開きます。
    ※推論中(Busy)は設定ボタンが無効化されます。処理完了後に自動で再有効化されます。
  4. モデルURLを入力するか、ローカル端末から .gguf ファイルを取り込み、「モデルを読み込む」を押してモデルを読み込みます。
    ※ローカル取り込みのファイル選択は Downloads フォルダを既定で開き、必要に応じて端末内の他の場所へ移動して選択できます。HTTP/HTTPS URLを利用でき、HTTPSでは通常のSSL/TLS証明書検証を行います。ローカル取り込み時は設定欄にファイル名のみが保存されます。
  5. パラメータを調整する場合は各項目を編集し「設定を保存」で保存します。
  6. 「保存して閉じる」を押すと設定が保存され、モデルに即座に適用されます。

3. メイン画面の各機能

4. 設定画面の操作

5. モデルパラメータの詳細説明

基本パラメータ

ペナルティパラメータ

Mirostatパラメータ

追加サンプリングパラメータ

DRYパラメータ

出力設定

Think設定

6. プロンプトテンプレートの自動選択

カスタムテンプレートが設定されていない場合、まずGGUFのchat_templateメタデータからファミリーを推定し、利用できない場合はモデルファイル名から自動選択します。

7. 停止シーケンス

生成時に一般的なチャットテンプレートの区切り文字を検出すると自動的に生成を停止します。

8. API/WebUIサーバー(任意)

9. 🧭 GGUFファイルの探し方

9-1. GGUF対応モデルを探す

9-2. 量子化バリエーションの選び方(概要)

10. 📥 ブラウザから直接ダウンロードする手順

10-1. 手動ダウンロード

  1. モデルページを開く
    例:https://huggingface.co/unsloth/Mistral-Small-3.1-24B-Instruct-2503-GGUF
  2. Files タブを開く
  3. 目的の *.gguf ファイルをクリック
  4. 右上の Download ボタンを押してダウンロード

10-2. GGUFファイルの直接URLを取得する

  1. Files タブで目的の *.gguf をクリックしてファイルページを開く
  2. Download ボタンを右クリック → 「リンクのコピー」
  3. これで 直接アクセス可能なGGUFファイルURL を取得できる

補足

大きなモデルのロードは、アドレス空間の確保失敗またはユーザ操作により中断される場合があります。その場合は次回起動時に一時ファイルを削除して通知を表示します。必要に応じて、より小さいモデルを試すか、設定から再度モデルを読み込んでください。