畫畫太歲 作品
第258章 怎麼總感覺是在給自己挖坑呢(第二更!)
實在不行,就上阿狸雲唄,算起來比自己建數據中心便宜多了。
華澤成並不負責數據中心的整體規劃和優化,對y系列的數據中心有多強大一無所知。
聽到啊華澤成的抱怨,方豫也很無奈。
前幾天他讓柚子去英偉達的服務器上看一下,p100到底什麼時候才能發貨。
結果柚子去轉了一圈之後回來告訴他,至少還得六個月,這還是它樂觀估計。
按照目前它觀測到的英偉達的工作效率,估計得一年了。
這個號稱採用了hbn),取而代之的是完全不同的注意力機制以及編碼器-解碼器架構。
值得注意的是,openai中的伊利亞並不是這篇文章的作者之一的伊利亞波洛蘇金。
這篇文章在17年6月12日發佈後,並沒有第一時間造成很大影響,並且由於其難以收斂,並不比相對成熟的lstm效率更高,因此在這個階段,大部分研究者的視線並未投向注意力機制的transformer架構,這裡也包括openai。
openai在2018年年初,還在用lstm進行訓練,並且在dota2裡擊敗了人類。而僅僅幾個月之後,openai就發佈了gpt-1。
這說明,幾個月的時間,足夠製作一個大模型。