BV1AL 之無所不記: 2025-01

2025-01-31

Deepseek R1與π小數點

農歷新年這幾天，Deepseek成為新聞談話的主題，因為它把NVDA股價嚇了一大跳，原本只是到Youtube找找看有什麼評論資訊，其中看到包括微軟退休工程師David Plummer的看法，他提到如果Deepseek所宣稱的都是真的，那就像你在家裡就可以自製一台法拉利跑車，而且功能完全跟公司貨真品法拉利一模一樣，這當會嚇掉法拉利公司的股價。

David又提到從它的model來看，它是從大model來training出小model，這個小model不必依賴強大的硬體就能在一般人家裡的電腦執行AI。

就像幾十年前個人電腦發展史一樣，PC出來的時候讓一般人不必購買像大公司大機構裡的大電腦，而可以擁有自己的個人電腦來執行各種軟體。但這樣的問題是，當大model裡有什麼bug，由它train出來的小model便繼承了先前的bug。

另外也看了Jeff Geerling以及Aleksandar Haber的Youtube video，發現只要用Raspberry Pi也可以安裝小model的Deepseek在家裡玩，於是動手用一台比Pi的性能還高一些的舊Macmini(16GB RAM)裝來玩玩看。從https://www.ollama.com可以找到六個distill的版本，當然也有原本的R1(671b)。我的舊Macmini完全沒有NVidia GPU，所以不可能快，不過我想正確性應該相同。

先裝一個最低階1.5b來玩，發現它幾乎答非所問，於是再裝一個8b的，問它列出π小數點後面100位，結果它開始跟我聊天，說什麼一般人不會用到小數點後面100位，接著東扯西扯。我想這跟我的電腦沒有NVidia GPU應該無關吧？但它還是繼續東扯西扯就是不肯列出小數點後面100位，後來終於列了小數點後40位，不過我一看，從第21位數開始就是錯的！因為我記得小數點後面50位，可以百分之百確認從第21位之後就是錯的。

我再孤狗一下「怎麼用python程式列出π小數點後面100位」，得出來的結果是只用了三行python code就能做到要列幾位數就列幾位數，但是為什麼8b model 的deepseek一直列不出來？

另外在一篇網路文章https://www.kelacyber.com/blog/deepseek-r1-security-flaws/ 裡看到說他利用兩年前早就公開的技術，可以jailbreak Deepseek來得到想要的資料，也就是說別的AI裡早已補起來的漏洞，在Deepseek卻仍存在！而且能從Deepseek得到一些違法的知識，像是製造爆裂物等等。

目前OpenAI也質疑Deepseek偷了他們的東西來用，這也讓人難免不想到中國各行各業過去幾十年來總是盜用、抄襲別人的智慧財，OpenAI指責Deepseek利用OpenAI的model來train Deepseek的model，也就像盜印圖書館的書來自己成立一間圖書館，這樣當然不必花大錢買書。但目前對於版權的法律還沒進步到AI這一塊，因此就算OpenAI能舉出Deepseek抄襲、盜用，這個問題目前仍是無解。