作者簡介:dan olds是技術(shù)趨勢和客戶情緒方面的人士,他也是經(jīng)常被行業(yè)和商業(yè)出版物頻頻引用的專家,比如《華爾街日報》、彭博新聞社、《computerworld》、《eweek》、《cio》和《pcworld》等。
ai軟件界在迅速發(fā)展。新的應(yīng)用幾乎每天都在層出不窮,現(xiàn)在正好可以趁機了解人們到底在用機器學習和其他ai技術(shù)做什么、這些技術(shù)可能何去何從。
我們在之前的兩篇文章中探討了實際用戶在如何對待ai,以及如何利用ai來解決問題、優(yōu)化企業(yè)。我們在本文中將深入了解數(shù)據(jù)中心的ai角落,看看公司在使用什么樣的軟硬件。
為此我們orionx.net開展了一項調(diào)查,向用戶展示了二十幾種ai框架,詢問他們是否打算使用某框架、是否已經(jīng)在使用某框架,或者是否認為自己是專家。
很少有人自稱是任何一種框架方面的專家,平均比例在2%左右。tensorflow和scikit learn是兩種的框架,分別有9%和12%的人自稱是這種框架方面的專家。然而如上圖所示,客戶熟悉大量的ai框架,不過他們不認為自己是專家。
ibm watson是使用率*三的ai框架,spark-mlib名列第四。我們驚訝地發(fā)現(xiàn),所有24種框架都有各自的粉絲和擁躉。你將這樣一份列表拿給調(diào)查用戶看時,通常會看到四五種大受歡迎的選擇,其余淪為默默無聞。ai框架方面無疑不是這種情況。
雖然這些都是機器學習工具集,但它們并不是*取代對方,這意味著像tensorflow和sciket learn這樣一兩種流行框架不會淘汰其他框架。
ai硬件:更進一步的觀察
那么,這些項目有多龐大?它們用于處理ai的集群又有多龐大?這是我們的發(fā)現(xiàn)結(jié)果。
對調(diào)查對象如今從事的所有ai項目而言,平均數(shù)據(jù)量為442 tb,zui大單個項目的平均數(shù)據(jù)量為235 tb。因此,從下面的平均數(shù)據(jù)量來看,調(diào)查中的典型企業(yè)似乎在從事一些很大的項目。
然而,這些統(tǒng)計數(shù)據(jù)有點欺騙性。如果你看一下中位數(shù)而不是平均數(shù),真實情況變得明朗化。ai項目的合并總數(shù)據(jù)量中位數(shù)僅為17tb,而zui大單個項目的數(shù)據(jù)量只有5tb。
平均數(shù)和中位數(shù)之間差異這么大,合理的解釋就是,有一小部分的大型項目讓數(shù)值出現(xiàn)了很大程度的偏差。ai趨勢仍處于起步階段,目前鮮有企業(yè)在開展極其龐大的ai項目。
如果看一下調(diào)查對象用于其ai項目的平均集群大小,就可以證明這一點。如圖所示,60%以上的調(diào)查對象擁有節(jié)點數(shù)量不到128個的集群,一大批調(diào)查對象使用節(jié)點數(shù)量不到32個的集群。另一方面,一小批調(diào)查對象擁有超過2048個節(jié)點的集群,僅20%的調(diào)查對象聲稱集群的節(jié)點數(shù)量在512個到1024個之間。
這也證實了我們處于ai時代的較早時期。隨著我們進一步發(fā)展,可能會看到ai集群的規(guī)模會迅速變大。
廣闊的加速器世界
在本次調(diào)查的硬件部分,我們詢問了關(guān)于gpu和fpga等計算加速器的幾個問題。*,這些便捷的設(shè)備可以加快數(shù)字處理,還可以顯著加快深度學習任務(wù),尤其是在機器學習訓練模型方面。gpu已成為大多數(shù)用戶的優(yōu)選加速器,但隨著用戶對專門定制的ai fpga越來越熟悉,我們預計這類加速器的使用量會逐漸增加。
我們詢問了客戶他們對于特定的gpu和fpga加速器有多熟悉,為此給他們看了一份列有眾多候選者的長長列表,詢問他們是否熟悉該設(shè)備或目前是否在使用該設(shè)備。
下表代表了我們在2017年春夏期間所能找到的每一款加速器。到目前為止,可能還有更多的加速器即出現(xiàn)在市面上,或者更大的玩家會收購本文列表上的更多加速器。
看到80%的調(diào)查對象使用英偉達gpu加速器或熟悉英偉達gpu加速器,這不足為奇。
amd gpu和谷歌tpu的熟悉度/使用率不相上下,都是60%多一點,而英特爾的altera fpga排在第四位。事實上,由于四處收購fpga技術(shù)公司(具體來說指altera和movidius),英特爾有多款gpu加速器上榜。
我們沒有料想到的一個方面是,調(diào)查對象很熟悉或在使用榜單上不大的技術(shù)。就連榜單上度/使用量zui小的硬件(來自krtkl,這是一家設(shè)計嵌入式fpga等產(chǎn)品的小公司)也被我們25%的調(diào)查對象所認可。
結(jié)束語
在*篇文章中,我們的數(shù)據(jù)顯示,雖然幾乎所有的調(diào)查對象都在開展ai項目,但很少有人(約7%)真正在生產(chǎn)環(huán)境下搞ai項目。在第二篇文章中,我們發(fā)現(xiàn)大多數(shù)實際的ai項目旨在推進和簡化典型應(yīng)用,比如預測性維護和分析大數(shù)據(jù)。雖然圖像、語音和視頻ai分析似乎備受媒體的關(guān)注,但大多數(shù)客戶在使用ai來分析數(shù)字和文本。
我們在本文中了解到,雖然有幾個非常大的ai項目(至少由我們的300多個調(diào)查對象來判斷是這樣),但就數(shù)據(jù)量而言,中位數(shù)項目還是相當?。s5tb)。我們還發(fā)現(xiàn),說到gpu和fpga之類的ai加速器,實際的客戶熟悉行情,他們知道這個市場的大小玩家。我們還再次證實了自己的假設(shè):ai的發(fā)展處于早期階段;對于這個激動人心的細分市場而言,真正的發(fā)展還未到來。