Meta 发布了 llama3.2，我试了一下 ollama 版本，发现这是假的

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 453 天前的主题，其中的信息可能已经有所发展或是发生改变。

https://imgur.com/a/MuyiVFa

怎么想 meta 都不至于出现这种低级问题，大概只可能是 ollama 的问题

第 1 条附言 2024-09-27 10:24:36 +08:00

imgur 的图经常访问不了，大家有兴趣可以尝试比较本地 ollama 和 groq 上相同版本的 llama3.1/3.2 的回复，另外，英文的确是基本准确的

第 2 条附言 2024-09-27 11:25:49 +08:00

再补充一下：刚才的本地运行是 Mac 环境，换到 Windows 后，无论中英文都可以正常回答难道 mac 版本有啥不一样？

meta

ollama

代码

14 条回复

jifengg

2024-09-27 09:45:05 +08:00

图片看不了。
怎么发现是假的？

paopjian

2024-09-27 09:54:42 +08:00

不是,靠问问题问他版本???

winglight2016

2024-09-27 09:57:21 +08:00

@jifengg imgur 免费版太容易超请求数了

其实就问了两个问题：1. 你是谁； 2. 你的版本是什么

中文提问，3.1 和 3.2 的回答都是 chatgpt/openai

英文提问，基本答对了，但是版本是 llama2.0

winglight2016

2024-09-27 09:58:04 +08:00

@paopjian 对于 chat ai ，你还有其他方式吗？

kaichen

PRO

2024-09-27 09:59:15 +08:00

你问大部分的模型，都会说自己是 chatgpt ，因为大部分厂商都拿 chatgpt 来合成训练数据，用来训练自己的模型。

这不是判断模型真假的标准。

jifengg

2024-09-27 10:18:24 +08:00

https://ollama.com/library/qwen2.5/blobs/66b9ea09bd5b

像 qwen ，会内置一个 system 文件告诉他自己是谁。
llama 系列的都没有这个内置 prompts ，问是谁都会随机回答。我的 llama 还说它是 bing 呢

bluehr

2024-09-27 10:18:37 +08:00

问它是问不出来正确版本的，不信你可以试一试其他方式部署的

yianing

2024-09-27 10:19:03 +08:00

ollama 上面的是 3B 版本的吧，性能很弱的

winglight2016

2024-09-27 10:22:27 +08:00

@kaichen
@jifengg
@bluehr
@yianing
并不是呀，我在 groq 上的 llama3.1/3.2 ，3B/11B/70B 都试了同样问题，全部回答正确，只有一个版本有点答非所问，但是追问后是正确的。

laooong

2024-09-27 10:32:14 +08:00

5 楼回答已经可以解释你的问题了。
“这不是判断模型真假的标准。”
不用纠结的。
Qwen2.5 也被人测出来会说自己是 chatgpt 、sonnet 乃至其他的，gemini 此前也被人测出来说自己是文心一言。

winglight2016

2024-09-27 11:25:18 +08:00

再补充一下：刚才的本地运行是 Mac 环境，换到 Windows 后，无论中英文都可以正常回答难道 mac 版本有啥不一样？

myxingkong

2024-09-27 11:30:43 +08:00

Ollama 的默认模型基本都是量化过后的，而 Groq 模型是未量化的。另外，temperature 也会影响模型的回答。

```shell
$ ollama run llama3.2
>>> /set parameter temperature 0.0
```

winglight2016

2024-09-27 11:43:41 +08:00

@myxingkong 的确，环境/设置因素都可能影响回答，不过我测试时都是用了默认设置，方便对比。

yuting0501

2024-09-28 21:34:16 +08:00 via iPhone

llama 的中文实在太差了，训练数据来源可能非常有限。可以试试用英文再问一次。