Ollama

Ollama#

Ollama 是一个开源工具,旨在简化在本地机器上运行大型语言模型(LLM)的过程。它提供了一个统一的框架,让用户可以轻松地下载、安装、管理和运行各种开源 LLM(如 Llama 系列、Mistral、Gemma 等)。Ollama 抽象了模型部署的复杂性,包括模型量化、硬件加速(如 GPU 支持)和 API 服务,使得普通用户也能在自己的电脑上体验和开发基于 LLM 的应用。

ollama.com官网下载app

https://github.com/ollama/ollama/releases/latest/download/Ollama-darwin.zip

下载app后运行,按提示安装命令行工具,在命令行执行 ollama run llama3.2 下载模型。

>>>  /show info
  Model
    architecture        llama
    parameters          3.2b
    context length      131072
    embedding length    3072
    quantization        Q4_K_M

  Parameters
    stop    "<|start_header_id|>"
    stop    "<|end_header_id|>"
    stop    "<|eot_id|>"

  License
    LLAMA 3.2 COMMUNITY LICENSE AGREEMENT
    LLAMA 3.2 Version Release Date: September 25, 2024

然后就可以在Shell直接与模型交互。

执行ollama list查看大模型,run运行大模型

% ollama list
NAME               ID              SIZE      MODIFIED
llama3.2:latest    a80c4f17acd5    2.0 GB    10 minutes ago
% ollama run llama3.2
>>> Hi
Hello! How can I assist you today?

>>> Send a message (/? for help)