OpenAI於今天正式發佈ChatGPT o1-preview及o1-mini,亦即傳言中Strawberry的新模型。o1-preview最令人震驚的地方,是AI可以「思考」清楚後才回答。雖然每一次問問題時,回答時間較長,但準確度提升了不少,尤其是解決複雜的數學或寫程式問題。至於一些經典AI無法回答正確的問題,包括Strawberry有幾多個r等,ChatGPT o1-preview也可以正確回答。OpenAI研究主管Jerry Tworek向傳媒表示,o1-preview的訓練方式完全不同,並且用全新邏輯。
ChatGPT o1-preview可以自行自動一步一步想清楚才回答,外國傳媒報道指,在國際奧數表現中,ChatGPT 4o只答對約13%,而o1-preview則答對高達83%。小編大概進行了簡單測試,o1-preview的確相當出色。尤其問及寫程式問題時,「它」會慢慢想清楚才回答,4o經常會因為「趕住出答案」而出現老作問題。雖然OpenAI也強烈表明,目前仍未能完全解決hallucinations問題,但不少人試過o1-preview後都發覺表現明顯更好,也比早前大熱的Claude 3.5 Sonnet出色。至於o1-mini則是較細的模型,可以快一點回答問題。
不過,o1-preview的每星期可問的訊息數量也極少,有傳只有數十個。而API收費更貴了3倍,100萬個輸入token售價為US$15,而4o則是US$5而已。而且,o1-preview及o1-mini目前不允許用戶上載檔案,也不能生成相片。o1-preview及o1-mini目前僅讓付費的Plus與Teams用戶使用,OpenAI稱或許在未來讓公眾免費試用o1-mini,但時間表未定。