BV1AL 之無所不記: 低效款電腦執行AI distilled model

2025-02-27

低效款電腦執行AI distilled model

前一篇提到被媒體大力炒作的Deepseek R1，因為手上電腦比較薄弱，所以拿它的distilled 8b model來跑，之後陸續再試的也都挑能力差不多的distilled model，像是tulu3:8b model, 感覺它明顯比deepseek R1:8b model來得聰明，如果說deepseek R1:8b是小學生，那tulu3 8b幾乎是高中生，因為問tulu3有關宗教的問題它也能清楚對答，不像前者常常胡說八道不知所云。

接著又試了gemma2:9b model, 不曉得是不是多了1b ? 發現它比前兩種更聰明，對這三個能力差不多的distilled AI model 用同樣的「台灣台北市木柵以出產什麼聞名？」來提問，得到的回答是:

deepseek R1:8b -> 高品质木材(它聲稱自己會用正體中文，但所有回答都是簡體字)
tulu3:8b -> 優質竹炭
gemma2:9b -> 文山包種茶

看來多了1b的model確實有比較聰明一些！

沒有留言:

張貼留言