畫畫太歲 作品

第258章 怎麼總感覺是在給自己挖坑呢(第二更!)

 實在不行,就上阿狸雲唄,算起來比自己建數據中心便宜多了。

 華澤成並不負責數據中心的整體規劃和優化,對y系列的數據中心有多強大一無所知。

 聽到啊華澤成的抱怨,方豫也很無奈。

 前幾天他讓柚子去英偉達的服務器上看一下,p100到底什麼時候才能發貨。

 結果柚子去轉了一圈之後回來告訴他,至少還得六個月,這還是它樂觀估計。

 按照目前它觀測到的英偉達的工作效率,估計得一年了。

 這個號稱採用了hbn),取而代之的是完全不同的注意力機制以及編碼器-解碼器架構。

 值得注意的是,openai中的伊利亞並不是這篇文章的作者之一的伊利亞波洛蘇金。

 這篇文章在17年6月12日發佈後,並沒有第一時間造成很大影響,並且由於其難以收斂,並不比相對成熟的lstm效率更高,因此在這個階段,大部分研究者的視線並未投向注意力機制的transformer架構,這裡也包括openai。

 openai在2018年年初,還在用lstm進行訓練,並且在dota2裡擊敗了人類。而僅僅幾個月之後,openai就發佈了gpt-1。

 這說明,幾個月的時間,足夠製作一個大模型。