DeepSeek是中國人工智慧公司DeepSeek創建的聊天機器人。 DeepSeek-R1 於 1 月 10 日發布,截至 1 月 27 日,它已超過 ChatGPT,成為美國 iOS 應用程式商店下載次數最多的免費軟體應用程式。
DeepSeek大語言模型概述
1. DeepSeek大語言模型是由北京深度求索人工智慧基礎技術研究有限公司自主研發的深度神經網路模型。
2. 該模型基於Transformer架構和注意力機制,透過海量語料資料進行預訓練,並經由監督微調、人類回饋強化學習等方式進行優化。
3. 模型內建審核、過濾等安全機制,確保部署後能根據人類指令或提示,執行語義分析、計算推理、問答對話、篇章生成、程式碼編寫等多項任務。
4. 主要應用於智慧對話場景,為企業客戶提供服務,根據使用者輸入的文字數據,生成符合需求的文字、程式碼等內容。
5. DeepSeek大語言模型演算法於2024年4月上線,並於同年4月完成演算法備案。
