新聞資訊
公司新聞

網站首[Shǒu]頁 > 公司新聞

百度為[Wéi]何開源深度機器學▽習▽平台?

5月20日,百度在github上開源了其深度機器學習平台。此番發布的◈深◈度機器學習(Xí)開源(Yuán)平台◈屬◈于“深盟”的開源組織,其核心[Xīn]開發者來自百度深(Shēn)度學習研究院[Yuàn](IDL),微軟亞洲研究院、華盛▾頓▾大學、紐約大學、香∆港∆科技大學,卡耐[Nài]基·梅隴◆大◆學等知名公司和高校。

通過這◈一◈開源平台,世(Shì)界各地的開發者們可以[Yǐ]免○費○獲得更優質和更容易∇使∇用○的○分布式機器學習算法源碼,從[Cóng]而大幅降低開發和部[Bù]署分布式機器學習系(Xì)統及相關應用的門檻。包括◇今◇[Jīn]日▿頭▿(Tóu)條、汽車之家等在内的(De)多▽家▽公司已經通(Tōng)過該開放(Fàng)平台受益。

作為在人工智能布局較早的玩家,百◊度◊(Dù)擁有領先業∆界∆的實[Shí]▽力▽(Lì)。從2013年百度深度學習研究院(IDL)的創建及2014年Andrew Ng的(De)加盟至今,百度DMLC分布式深度機器◆學◆習開(Kāi)源項目(簡[Jiǎn]稱“深盟”)已在深度學習的多(Duō)個應用領域做過探索,上線了如[Rú]xgboost(●速●度[Dù]快效果好的(De)Boosting模型(Xíng))、CXXNET(極緻的C++深度[Dù]學習庫)、Minerva(高效靈活(Huó)的并行深度學習引擎)以及Parameter Server(一小時訓練600T數據)等産品,在語音識别、OCR識别、人⋄臉⋄識别(Bié)以及計算效率提升上發布了多[Duō]個成熟産品。

而具◆有◆一系列[Liè]領先優勢的(De)百[Bǎi]度卻選[Xuǎn]擇開源其深度機器學習平台[Tái],為何交[Jiāo]底自己的[De]核心技術?

●深●思之[Zhī]下,卻是在面對業(Yè)界無奈(Nài)時的遠見之舉。

擁▲抱▲世界:開源(Yuán)的魅力

開源,顧名思義,就是開放自己的源代碼給[Gěi]别人查閱(Yuè)和使用,盡管看起來很傻,然而諸多曆[Lì]史事實[Shí]卻告訴我們擁(Yōng)抱世界也(Yě)能讓世界擁抱你。

Android的逆襲[Xí]就是明證,在iOS侵占絕大多[Duō]數智能手[Shǒu]機操作系統的時(Shí)∇代∇(Dài)誕生,Google選擇開源,讓◆早◆已(Yǐ)在蘋果面前沒有機▾會▾的業界見到了[Le]希望,至(Zhì)今Android已擁有過半的市場份額,以至◈于◈[Yú]在移動互聯網大[Dà]行其道的今天(Tiān),Google可(Kě)以憑借∆它∆與旗下産[Chǎn]品的整合打造屬于▲自▲[Zì]己的強大生(Shēng)态系統。相比之下,生而嬌●貴●[Guì]的Windows mobile◆的◆故事夠令人發醒的[De],終于∇微∇軟也不(Bú)得不寄人●籬●下[Xià]地去兼容Android和iOS平台(Tái)應用。此[Cǐ]外,作為微軟最主要的應用程[Chéng]○序○框架,微軟◈對◈.net寄予厚望,希望(Wàng)它的(De)開源可以來到(Dào)所[Suǒ]有平台,進而重現JAVA的光(Guāng)輝曆史。這也證[Zhèng]明了即[Jí]使強大如微[Wēi]軟也(Yě)無法[Fǎ]憑借◊一◊己之力讓其産品得到[Dào]世界的擁抱。

衆[Zhōng]人拾材火焰高:用平台[Tái]∇籠∇絡[Luò]世界的力量

要∇實∇(Shí)現人工智能,機器必須(Xū)具備自主學習能力,深度學習作(Zuò)為▿機▿器學習領∇域∇的重大突破,可以完成具有(Yǒu)高◊度◊抽象特征的人(Rén)工智能任務,如自然語言理(Lǐ)解(Jiě)等複雜場景,因而備受業界追[Zhuī]捧。當然,機器學習領域并不隻是有深度學習這一(Yī)種算法的(De)存在,然而深度學習(Xí)卻有着顯著的優勢(Shì):在◈數◈據集足夠大的情況下,深度學習擁有最∆好∆的[De]預測能力[Lì]。盡管在算法的選擇[Zé]上仍然存在“殺雞焉用[Yòng]宰牛刀”的争論,但深度[Dù]學習算法為人(Rén)工⋄智⋄能●領●[Lǐng]域注入的強大能◈力◈(Lì)卻是其他算法無以◊比◊拟的;◆同◆時,随着深度學[Xué]習技術的[De]成熟,諸多傳∆統∆機器學習算[Suàn]法的∆淘∆汰幾乎是必◆然◆的。然[Rán]而正如前述,深▾度▾學習對大量數據的∆需∆求及其本身的複雜性仍然是(Shì)其發展壯大路上[Shàng]的最大阻礙,也是∆業∆界的▿無▿奈所(Suǒ)在。

百度在此領域發力▿較▿[Jiào]早,且在諸多(Duō)方[Fāng]向上進行了深(Shēn)入的研[Yán]究,利用深入(Rù)學◆習◆結合(Hé)自身搜索引⋄擎⋄[Qíng]的大數據∇讓∇機器翻譯及自(Zì)然語言等技[Jì]術實現◈了◈[Le]新的飛∆躍∆(Yuè)。然而在面向更廣(Guǎng)大(Dà)更具體的●應●用[Yòng]場▿景▿時,任何一個公司都難以滿足[Zú]所有需求(Qiú)。借鑒曆(Lì)史[Shǐ],開放共赢(Yíng)不◊僅◊[Jǐn]可以把事情做的,也讓業界和生态系統●得●到健康發∇展∇。

百度此次開源(Yuán)也○是○完全奔着建(Jiàn)平台去的。完全▲采▲用C++語言搭建核心,為平台的穩[Wěn]定[Dìng]高效運行奠定了基(Jī)礎;覆蓋了三類⋄最⋄[Zuì]常用的機[Jī]器學習算法,包括用于點擊預測的稀疏[Shū]線[Xiàn]性∆模∆型[Xíng]、用于排序[Xù]的(De)決策樹模型以[Yǐ]及深入學習(Xí),滿足了最廣大的需求;重點[Diǎn]開發的“蟲○洞○”項目将自動構建▲深▲[Shēn]盟(Méng)所有項目,為所有組(Zǔ)件提供一緻的數(Shù)據流支持且提供包括Amazon EC2,Microsoft Azure, Google Compute Engine在内的雲計算平台兼容支持,降低平台的[De]準入門⋄檻⋄。

開源并入駐Github也進[Jìn]一步強[Qiáng]調了其開放的心态[Tài]和對平台的信心。一系列的動(Dòng)作都是▽希▽望讓(Ràng)開發者可[Kě]以獲[Huò]得更優質更容易使○用○的深入(Rù)學習算法源碼,降低開發和▲部▲署深入學習系統及相關應用的門檻,進而利用世界的力∇量∇(Liàng)壯大自身。

面[Miàn]對可●預●料的爆發,技術一定(Dìng)程度上漸發成熟,∇但∇(Dàn)也因為[Wéi]各自的技術(Shù)基因[Yīn]和路線差[Chà]∆異∆,面(Miàn)臨着極大的分裂傾(Qīng)向。開放的心态(Tài)擁抱世界,打造機器學(Xué)▿習▿[Xí]領域的國際标準,百◇度◇的此舉既是對前[Qián]期研(Yán)究▲投▲(Tóu)入的回收(Shōu)保障,更●是●攜手(Shǒu)籠絡友商,确保自身的話(Huà)語權所在。