毫不客氣地說,人工智能(ai)和機器學習(ml)已然“滲透”到了各行各業(yè),企業(yè)們期待通過機器學習基礎架構平臺,以推動人工智能在業(yè)務中的利用。在機器學習加快推進的過程中,卻是有喜也有憂。
近日,數(shù)據公司(idc)發(fā)布了《中國人工智能軟件及應用(2019下半年)跟蹤》報告。據該報告顯示,中國機器學習開發(fā)平臺市場2019年市場規(guī)模達2.05億美元。
機器學習開發(fā)平臺的部署,包括數(shù)據獲取、數(shù)據準備、模型訓練、應用程序集成、模型運維、生產監(jiān)控以及有明確kpi的業(yè)務治理過程。在這個過程中,由框架、算法模型、開發(fā)語言等各種工具賦能,由數(shù)據科學家、業(yè)務分析師、數(shù)據架構師和專業(yè)人員協(xié)作,基于數(shù)據建模,不斷的進行概念驗證,將好的模型部署到生產環(huán)境,協(xié)作以管理模型運維的全生命周期。
算力不斷提升、算法模型創(chuàng)新、開源技術發(fā)展、廠商加大投入,已經成為了機器學習產業(yè)實現(xiàn)快速發(fā)展的重要驅動力。其中,算力的提升,對于ai技術的進步與成熟、相關智能產業(yè)的應用模式創(chuàng)新等,無疑提供了強大的支撐。
受益于加速計算技術的不斷突破,機器學習、深度學習模型訓練和推理速度持續(xù)提升,加快推動了ai應用產業(yè)化的進程。從廠商情況來看,2020年gtc、英偉達發(fā)布了將算力再度提升數(shù)十倍的安培架構的a100 gpu。此外,intel華為昇騰系列,xilinx alveo系列、寒武紀等也在特定領域為ai負載提供加速能力。
單就商業(yè)化機器學習開發(fā)平臺而言,2018年包括硬軟服在內的中國機器學習市場達到10億元人民幣,預計2018-2023年五年復合增長率將達到62.0%。當前的機器學習開發(fā)平臺基本可以提供30種以上的經典機器學習算法,且基本已支持tensorflow、pytorch、caffe等主流框架。不僅是深度學習、機器學習,圖算法也開始走向市場,現(xiàn)階段應用十分普及的是經典機器學習。
從市場空間來看,對于還沒有成熟的ai軟件產品的領域,機器學習、深度學習開發(fā)平臺建設將成為一大趨勢,相關頭部廠商將借助已有的軟件、硬件、系統(tǒng)等技術優(yōu)勢,致力于為行業(yè)系統(tǒng)性機器學習體系的完善與健全貢獻更大力量。
雖然機器學習是“顯學”,但其發(fā)展還是存在不少阻力,其一,人工智能、機器學習等知識相對高深,相應的,掌握這些知識的人也就比較少,因此,各行業(yè)發(fā)展對于機器學習、圖像識別等的人才十分迫切。
此外,機器學習的部署實施其實是一項非常復雜的工作。例如,對數(shù)據進行可視化、轉換和預處理,算法的優(yōu)化、模型的訓練,而所有這些工作都需要大量的專業(yè)知識,并耗費龐大的算力、數(shù)據存儲和時間成本。在較短的時間內,要達到相當?shù)臋C器學習部署和推進能力實屬不易。
機器學習平臺底層,可以簡單地理解成是把數(shù)據治理、算法與算力合在一起,第四范式叫之為先知平臺。它既是一種科技平臺,也是產品研發(fā)系統(tǒng)。它的目標是能夠有更好的企業(yè)級適配效果,更大的延展性和更強的計算水平。在先知平臺獲得突破,已經成為許多企業(yè)的目標。