国产成+人+综合+亚洲专,亚洲人成综合网站7777香蕉,亚洲精品久久无码

(相關資料圖)

國盛證券劉高暢在節目中表示，數據方面，高質量的中文語料庫相對稀缺，會有一些誤差率的問題；算力方面，訓練端對算力的要求不是很極限，但應用端對算力的消耗非常顯著。

以下為文字精華：

提問：除了算法，人工智能訓練的時候也需要很大的算力，包括海量的數據，特別是我們中國跟海外的數據源可能還存在一些割裂。在算力和數據方面，我們和海外有多少差距？

劉高暢：數據方面，在GPT3以前用的都是互聯網的公開數據，中文目前來看，客觀的條件就是高質量的語料庫相對來講會稀缺一些。

在整個OpenAI的大模型中，我們了解到中文的語料庫使用只有5%，從誤差率的角度來講，英文可能在2%—3%，中文大概在10%以上。用中文去測試ChatGPT，效果也不如英文。但是，我們也看到國內的高質量語料庫在快速生成中，大家也在探索，包括知乎和萬方這樣的一些高質量語料庫在形成。

大模型的數據還是以互聯網公開數據為主，可能在寫代碼這個階段，一些頂尖大廠比如微軟，代碼的水平會比較高，但是畢竟這一塊只是小部分，我們推測起不了決定性的作用，應該不是特別大的瓶頸。OpenAI在去年GPT3.5的時候，大概用了45TB的數據，做模型數據集處理和傾斜的部分應該是不超過1TB的，所以其實是很少的數據，這一點不用特別擔心。

算力方面，如果從訓練端的角度來看，如果在GPT3以前，用2000張英偉達A100的算力，如果你訓不出來成果，我們建議就不要去做了，說明這個團隊水平有點問題。如果在GPT3.5以前，5000張如果訓不出來，我們建議也不要再做訓練了，說明這個團隊多多少少有點問題。

我們認為在訓練階段，對算力的需求量沒有那么極限，國內明面上和潛在的產業中的儲備我們認為是夠的。

應用端來看，做模型蒸餾和模型裁剪，把算力的消耗做到以前的90%，已經是很高的縮減度了。但是就這樣的情況來看，算力還是會捉襟見肘，對未來算力的消耗還會非常顯著，包括我們國家的一些晶圓代工和設計廠商，這也是他們需要努力的地方，其實是機遇也是挑戰。

關鍵詞：

責任編輯：Rex_27

亚洲大香人伊一本线_久久久久久a亚洲欧洲aⅴ_国产精品亚洲视频_亚洲精品无码久久一线

環球熱資訊！國盛證券劉高暢：中文數據欠缺算力消耗顯著

環球熱資訊！國盛證券劉高暢：中文數據欠缺算力消耗顯著

一季度民企貸款新增3.7萬億元

天天快播：無大礙！哈姆透露濃眉哥傷病：右髖部受傷但他幾乎能做任何事

環球頭條：“與大理美景撞個滿懷！”

當前焦點!汽車電瓶使用壽命多長時間_汽車電瓶使用壽命

加入“鐵門”第一步：從搶注UID開始

環球熱資訊！kb2919355無法安裝_kb2919355

視焦點訊！星際穿越迅雷下載藍光_星際穿越迅雷下載地址

GGII：2023Q1中國儲能電池出貨量為42GWh 大儲增長趨勢仍在

全球今日報丨如何識別花園害蟲蠕蟲

天天關注：河北武邑萬畝高油酸花生播種機械化助農增收

環球微頭條丨歐盟認定19家公司受《數字服務法案》管轄

【環時深度】“安全神話”褪色，日本哪來那么多戾氣？

全球訊息：1-2！客場不敵巴列卡諾，萊萬破門無功，巴薩輸球依然11分領跑

環球熱文：有效教學是什么意思_什么是有效學習有效教學高效課堂

天天快消息！消費者訂“五一”期間民宿遭砍單，山東長島：嚴罰商家

世界熱推薦：暗影惡魔_對于暗影惡魔簡單介紹

世界最新：為什么天生喜歡作死的人，沒有被自然法則淘汰掉？

世界微動態丨動視暴雪跌近10% 英國阻止微軟收購動視暴雪的交易

全球今日報丨碧水源：東騰投資投資者于4月25日調研我司

環球熱資訊！國盛證券劉高暢：中文數據欠缺 算力消耗顯著

環球熱資訊！國盛證券劉高暢：中文數據欠缺算力消耗顯著