Ollama#

Ollama 是一个开源工具，旨在简化在本地机器上运行大型语言模型（LLM）的过程。它提供了一个统一的框架，让用户可以轻松地下载、安装、管理和运行各种开源 LLM（如 Llama 系列、Mistral、Gemma 等）。Ollama 抽象了模型部署的复杂性，包括模型量化、硬件加速（如 GPU 支持）和 API 服务，使得普通用户也能在自己的电脑上体验和开发基于 LLM 的应用。

ollama.com官网下载app

https://github.com/ollama/ollama/releases/latest/download/Ollama-darwin.zip

下载app后运行，按提示安装命令行工具，在命令行执行 ollama run llama3.2 下载模型。

>>>  /show info
  Model
    architecture        llama
    parameters          3.2b
    context length      131072
    embedding length    3072
    quantization        Q4_K_M

  Parameters
    stop    "<|start_header_id|>"
    stop    "<|end_header_id|>"
    stop    "<|eot_id|>"

  License
    LLAMA 3.2 COMMUNITY LICENSE AGREEMENT
    LLAMA 3.2 Version Release Date: September 25, 2024

然后就可以在Shell直接与模型交互。

执行ollama list查看大模型，run运行大模型

% ollama list
NAME               ID              SIZE      MODIFIED
llama3.2:latest    a80c4f17acd5    2.0 GB    10 minutes ago
% ollama run llama3.2
>>> Hi
Hello! How can I assist you today?

>>> Send a message (/? for help)