2025-02-27

低效款電腦執行AI distilled model

 前一篇提到被媒體大力炒作的Deepseek R1,因為手上電腦比較薄弱,所以拿它的distilled 8b model來跑,之後陸續再試的也都挑能力差不多的distilled model,像是tulu3:8b model, 感覺它明顯比deepseek R1:8b model來得聰明,如果說deepseek R1:8b是小學生,那tulu3 8b幾乎是高中生,因為問tulu3有關宗教的問題它也能清楚對答,不像前者常常胡說八道不知所云。

 接著又試了gemma2:9b model, 不曉得是不是多了1b ? 發現它比前兩種更聰明,對這三個能力差不多的distilled AI model 用同樣的「台灣台北市木柵以出產什麼聞名?」來提問,得到的回答是:

  1.  deepseek R1:8b -> 高品质木材(它聲稱自己會用正體中文,但所有回答都是簡體字)
  2.  tulu3:8b -> 優質竹炭
  3.  gemma2:9b -> 文山包種茶

看來多了1b的model確實有比較聰明一些!

沒有留言: