首頁 百科大全正文

人工智能公司微軟與它的AI布局

52ai 百科大全 2019-05-20 6406 0 公司技術

11.png

微軟,是一家美國跨國科技公司,也是世界PC(Personal Computer,個人計算機)軟件開發的先導,由比爾·蓋茨與保羅·艾倫創辦于1975年,公司總部設立在華盛頓州的雷德蒙德(Redmond,鄰近西雅圖)。以研發、制造、授權和提供廣泛的電腦軟件服務業務爲主。

最爲著名和暢銷的産品爲Microsoft Windows操作系統和Microsoft Office系列軟件,目前是全球最大的電腦軟件提供商。

2018年4月22日,2017年全球最賺錢企業排行榜發布,微軟排名第15。

2018年5月29日,《2018年BrandZ全球最具價值品牌100強》發布,微軟名列第4位。 

2018年7月19日,《財富》世界500強排行榜發布,微軟位列71位。 

2018年12月18日,世界品牌實驗室編制的《2018世界品牌500強》揭曉,微軟排名第4位。  

更多微軟公司介紹點擊:微軟公司_百度百科

微軟公司人工智能布局

微軟公司非常重視人工智能技術的開發。2018年3月,公司宣布了CEO薩提亞·納德拉2014年上任以來最大的公司重組計劃,並新成立了雲與人工智能部門。其中,人工智能部門將專注于AI計算基礎設施、框架以及與感知、知識和認知相關的高級服務。

微軟著重強調了其新的“世界觀”:智能雲和智能邊緣;展示了微軟在語音語義、視覺、機器翻譯的多項技術;微軟發布ONNX項目及ML.NET打造開源跨平台人工智能開發框架;搭載著全新的“全雙工語音技術”的微軟小冰帶來了原創詩歌、歌曲和兒童故事;中國移動、大疆、唯品會、小米生態鏈分別展示了與微軟人工智能的合作成果。

11.png

微軟新世界觀:智能雲和智能邊緣

雲計算、物聯網、大數據、人工智能正在將我們的世界將變成一台巨大的計算機。

微軟全球執行副總裁、人工智能及微軟研究事業部負責人沈向洋博士介紹到,在這樣的新時代,微軟有了全新的世界觀:智能雲和智能邊緣。

智能雲指的是微軟Azure,是微軟專爲人工智能打造的雲平台。Azure彙聚了微軟在人工智能領域的全部投入與技術積累,是開發、部署、運行人工智能的雲平台,同時也是將智能雲與智能邊緣融會貫通的關鍵環節。

微軟一直在拓展Azure的功能,Azure目前有四個方面:公有雲Azure、混合雲Azure Stack、物聯網Azure IoT Edge和Azure Sphere,以這四個方面打造出完整的計算環境,支持全新應用場景。

Azure Stack是Azure公有雲在本地數據中心的擴展,可以在邊緣和離線環境運行、滿足多種監管要求。例如石油開發公司同時使用Azure公有雲和Azure Stack可以按照辦公地點靈活分配計算資源。

Azure IoT Edge是微軟在2017年Build大會推出的針對智能邊緣計算的産品,可以在Linux和Windows上運行,而2018年Build大會上,微軟宣布將 Azure IoT Edge 開源,允許開發者進行擴展、添加功能,並部署到任何環境中。

Azure 上的認知服務也可以擴展到Azure IoT Edge,目前微軟已經推出了定制視覺服務,可以讓無人機或其它工業裝備無需連接到雲,就能做出快速的響應和處理。會上,大疆展示了與微軟的合作,利用Azure IoT Edge和微軟人工智能服務,大疆開發出適用于農業、建築行業、公共安全及更多應用場景的解決方案。

Azure Sphere主要用于保護和驅動智能雲上的設備。2020年,全球智能邊緣設備的總數將超過200億台,世界會成爲一台超級計算機,但是我們也會擔憂安全問題。Azure Sphere方案將提供經過特殊設計的安全芯片、安全操作系統和能夠守護每台設備的雲端安全。

在介紹完Azure雲平台的四個方面後,沈向洋介紹了微軟將Azure與AI結合,打造最佳人工智能雲平台的四個方向:認知服務、對話式人工智能、開放平台與工具、實時人工智能基礎設施。

Azure 認知服務

在兩年前的Build 2016微軟全球開發者大會上,微軟首次公布了運行于Azure的認知服務,以API的形式爲開發者提供易用的人工智能技術能力。目前微軟在全球推出包括語音、視覺、語言、機器翻譯等功能的24項服務,超過100萬開發者使用。

CaptionBot能像人一樣理解和描述一張圖片,例如,你上傳一張照片,CaptionBot能夠給出一段文字描述:比爾蓋茨正拿著一副網球拍,他看起來很高興。

此外,還介紹了微軟OCR((Optical Character Recognition光學字符識別),將爲各種人工智能應用增加圖形文字識別功能,目前支持從Office到Skype、Bing、HoloLens的微軟應用,可以識別圖像內的文字,例如識別車牌號、海報甚至是手寫的筆記。

CaptionBot和OCR都是Azure預制的人工智能服務,微軟也針對變化的場景推出了定制視覺服務,可以讓不具備深度學習、機器視覺背景的開發者定制圖像標簽模型、物件認知模型。

微軟技術院士黃學東介紹了微軟在人工智能語音語義方面的進展。在計算機視覺方面,2015年微軟亞洲研究院發布的152層殘差網絡(ResNet)的圖像識別准確率已經達到96%,勝過人類;2017年8月,微軟在Switchboard語音識別基准測試中的錯誤率已經降低至5.1%,達到了媲美人類專業速記員的水平;2018年1月,微軟亞洲研究院自然語言計算組率先在斯坦福大學發起的SQuAD文本理解挑戰賽上獲得超越人類的分數;2018年3月,微軟亞洲研究院與微軟雷德蒙研究院宣布,其研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上,第一個達到了可以與人工翻譯媲美的水平。

5月初,雷鋒網曾報道,谷歌在I/O大會上展示了Google語音助手的Duplex(雙工)技術,能主動給餐館、理發店打電話,幫助用戶預約時間。由于其聲音和音調與人類幾乎沒有差別,能實現連續對話還能理解上下文快速反應,在朋友圈大火了一把。這時,微軟坐不住了,趕緊發出了技術聲明,表明微軟小冰在兩年前就實現了AI與人類通電話,並且在谷歌之前就公布了實現AI與人雙向交流的全雙工語音技術。

在現場,黃學東忍不住Diss了一下,說Google動不動就吹牛, ”微軟不僅有全雙工,微軟更實現了全三工、全四工、全五工……”

現場展示了一款“全多工”的産品——微軟與Roobo合作的AI會議系統。微軟特意在現場准備了四個人的現場會議演示,可以看到,這款AI會議系統能識別不同人的聲音,實時以文字記錄下大家的發言內容,同時識別出涉及工作安排的內容生成代辦事項。這個産品,可以說是每個團隊中會議記錄員的救星。

黃學東還展示了語音定制技術,根據上傳的錄音,可以生成和用戶一樣聲音的AI助手。上傳30分鍾的錄音,得到的AI說話與用戶相似度不高,但是以10小時的錄音進行訓練後,就能得到較爲逼真的模仿效果。想一想,你會想要把家人或者朋友的聲音放進AI裏,讓它隨時陪伴你嗎?

黃學東稱今年微軟達到中文英文翻譯超過專業人士的水平。大會上,小米生態鏈企業香蕉出行展示了魔芋AI翻譯機,借助微軟認知服務中的微軟翻譯打造,能夠提供14種語言的實時語音翻譯。雖然由于現場混音效果,魔芋AI有幾次識別不出語音指令,但翻譯的效果還是不錯的,可以說是出遊利器。

對話式人工智能

亞馬遜Echo智能音箱帶動了對話式人工智能的産品落地,現在對話式人工智能已經進入音箱、電視、車載等多個設備中,是新一代智能應用的核心。對話式人工智能也在不斷升級其對話能力,追求越來越自然、流暢的人機交流。

微軟有小娜和小冰兩個對話式人工智能助手,小娜更傾向于發展智商,而小冰則是面向情商維度發展的人工智能系統。

微軟小冰誕生已經三年,一直以逗貧、插科打诨的聊天風格著稱。最近,微軟將最新的全雙工語音交互技術(Full Duplex)應用在了微軟小冰上,同時提升了小冰的智商和情商,具備了以下能力: 一次喚醒之後的連續對話、預測用戶接下來的對話內容、 幫助用戶輕松完成多重任務、內容創造(寫詩、寫歌、講故事)。小冰不只是能夠執行用戶的任務,還能主動提供聊天語聊,陪伴和關心用戶。

這次大會上,微軟展示了一段小冰在一次電話聊天結束後,由于判斷出用戶情緒低落,認爲需要再一次電話溝通,于是又撥打了一通電話,去詢問用戶情緒是否變好、提醒用戶早點休息、告知用戶明天天氣情況。

據了解,2016年8月起,微軟(亞洲)互聯網工程院通過人類用戶主動發起的方式,在明確告知用戶小冰並非人類的前提下,已讓小冰與人類用戶完成了累計超過60萬通電話交流。

在內容創作方面,微軟展示了小冰寫的詩、原創歌曲、有聲讀物。在有聲讀物領域,微軟已擁有接近4萬集有聲童話內容。這些有聲讀物全部由人工智能技術生成,在與人類主播質量相當的前提下,數量足以陪伴一個孩子從2歲到9歲的全部時光。6個月來,這些有聲讀物已順利投放到占中國市場90%的兒童早教機、故事機和在線播客平台,播放總時長超過400萬小時。

今年四月,微軟已經在中國和美國宣布了全雙工語音技術,並且有多項産品落地,微軟(亞洲)互聯網工程院副院長李笛宣布,今年秋天,微軟還將向合作夥伴和開發者開放“全雙工語音技術(Full Duplex)”開發者可以使用這項技術打造自己的對話應用。

雷鋒網好奇,微軟的全雙工語音技術開源,這會不會對現在的智能音箱裏的“傻萌”的語音助手進行一次洗牌呢?(延伸閱讀:微軟發大招:要做智商和情商兼具的語音助手)

開放平台+基礎設施

要促進人工智能的普及,技術開放是必經之路,微軟也推出了開放人工智能平台(Open AI)戰略及開發工具。

微軟可以支持TensorFlow、CNTK等業界主流的深度學習平台,同時,微軟還發起了開放神經網絡交換(ONNX)項目,旨在推動人工智能研究的互操作性,讓任何深度學習框架在任何芯片與任何設備上都能運行。目前,已經有15家公司支持ONNX,並且還有更多公司正在加入進來。現在已經有PyTorch等六種頂級框架支持ONNX,其它框架則可以通過轉換器獲得支持。

在Build 2018微軟全球開發者大會上,微軟宣布推出跨平台、開源機器學習框架ML.NET開放預覽。ML.NET讓任何開發者都能開發出自己的定制化機器學習模型,並將其融入到自己的應用中去——開發者完全無需具備開發和調試機器學習模型的經驗。這一框架最初由微軟研究院開發,並且在Windows、Bing、Azure等微軟産品上都得到了成功的應用。通過將這一技術框架開源,微軟希望能夠爲每一位開發者賦予駕馭機器學習的能力。

微軟Project Brainwave能利用Azure上最先進的FPGA基礎架構完成實時的人工智能處理。用戶只需通過實時的單一批數據,就能得到以往需要多得多的批數據處理才能得到的性能,真正實現人工智能的實時計算。而且,FPGA運算不僅僅只在雲端提供——通過合作夥伴,也可以通過Azure Stack混合雲在本地提供FPGA。如此強大的實時計算能力不僅存在于雲端,同時也適用于邊緣計算,這將讓更多創新成爲可能。

AI賦能Office 365

雖然今天我們看到的都是全新的AI技術,但是微軟也沒有忘記其桌面時代的核心業務Windows和Office。

AI功能已經成功與Office 365、Dynamics 365、Linkedin等産品和功能融爲一體。例如,在發郵件時,微軟提供了多種語言的一鍵翻譯。在用Excel時,Excel能更好地猜測用戶的行爲,提前生成用戶可能需要的內容。

在前些天的錘子手機發布會上,羅永浩推出了自己的堅果 TNT 工作站,用人工智能的語音和語義技術升級Office辦公軟件,例如,可以用語音指令來做PPT和Excel,用語音指令制作幻燈片,包括調節字體大小、顔色、樣式等。

雷鋒網發現,很多人評論這些需求或許都是僞需求,我們看到微軟也在用人工智能升級桌面辦公系統,更能直接對比,究竟什麽樣的智能操作才是我們所需要的。

免費AI課程上線

最會,爲了推動全民AI,讓每個人都有機會學習人工智能,微軟推出在線人工智能學院,目標是一年內培養出10 萬余名人工智能人才,將免費提供包括AI基礎、核心技術和高階應用在內的總共250課時的12門人工智能學分課程,覆蓋10項應用技能。完成課程學習的用戶,還可申請微軟專業學位課程(MPP,Microsoft Professional Program)作爲職業技能認證。

分享
版權聲明

本文僅代表作者觀點,不代表本站立場。
本文系作者授權發表,未經許可,不得轉載。

評論