Tech

Mistral推出Codestral，作为其首个用于代碼生成的AI模型

瑪詩北歐 Thursday, July 25 2024

擁有價值60億美元的法國人工智能初創公司Mistral，獲得微軟支持，推出了其首個用於編碼的生成式AI模型，被稱為Codestral。

如其他代碼生成模型一樣，Codestral旨在幫助開發人員編寫和交互代碼。Mistral在一篇博客文章中解釋，它在80多種編程語言上進行了訓練，包括Python、Java、C++和JavaScript。Codestral可以完成編碼功能，編寫測試和“填寫”部分代碼，還可以用英語回答有關代碼基底的問題。

Mistral稱該模型為“開放”，但這還有待商榷。該初創公司的許可證禁止用於Codestral及其輸出進行任何商業活動。雖然有一個針對“開發”的豁免條款，但即使如此，許可證還明確禁止“員工在公司業務活動上的任何內部使用”。

這可能是因為Codestral部分是在受版權保護的內容上進行訓練。Mistral在博客文章中沒有證實或否認這一點，但這也不足為奇，因為有證據表明該初創公司先前的訓練數據集包含受版權保護的數據。

無論如何，Codestral可能不值得麻煩。230億個參數的模型需要強大的個人電腦才能運行。(參數基本上定義了AI模型在解决問題上的能力，如分析和生成文本。)雖然根據一些基準來看，它超過了競爭對手（但我們知道，這些基準是不可靠的），但它並不是壓倒性的。

雖然對於大多數開發人員來說不切實際並且在性能改進方面是逐步的，Codestral無疑會引發有關依賴代碼生成模型作為編程助手的智慧的辯論。

開發人員肯定至少對一些編碼任務使用生成式AI工具。根據2023年6月Stack Overflow的一項調查，44%的開發人員表示他們現在在開發過程中使用AI工具，而26%計劃很快開始。然而，這些工具顯然有缺陷。

通過GitClear對過去幾年提交到項目存儲庫的1.5億行代碼進行的分析發現，生成式AI開發工具導致更多的錯誤代碼被推送到代碼庫。在其他地方，安全研究人員警告說這些工具可能會放大軟件項目中現有的漏洞和安全問題；根據普渡的研究，OpenAI的ChatGPT對編程問題的答案中超過一半是錯誤的。

這並不會阻止像Mistral和其他公司一樣試圖從其模型中獲利（並在吸引人們記憶中占據一席之地）。今天上午，Mistral在其Le Chat對話式人工智能平台上推出了Codestral的托管版本，以及其付費API。Mistral表示，它還努力建立Codestral到應用框架和開發環境中，如LlamaIndex、LangChain、Continue.dev和Tabnine。

瑪詩北歐