文章来源:由「百度新聞」平台非商業用途取用"http://tech.huanqiu.com/it/2016-11/9663112.html"
【環球科技綜合報道】作為雙11背后龐大系統的大腦,忙碌的阿里云人工智能ET還抽空表演了一個神奇的魔術。 11月10日晚,天貓雙11狂歡夜在深圳大運中心拉開巨幕。除了匯聚全球半個娛樂圈的明星外,還有一位擁有超能力的神秘嘉賓登場阿里云人工智能ET。在全球上億觀眾的見證下,ET隔空計算出5人手中的撲克牌,震驚全場。 在狂歡夜的壓軸環節中,ET一出場便秀出強悍的語音識別和交互能力,與主持人華少神同步。眾所周知,華少憑借400字分鐘的語速被譽為中國好舌頭。ET竟然可以實時將華少的現場口播翻譯成文字,投在電視機屏幕上,達到極高的準確率。好玩的是,一旦出現錯誤,ET還會結合上下文語境進行毫秒級修正。 不但能聽懂華少的問題,ET還能通過現場觀察和思考,模仿人類的聲音回答問題。 華少發出挑戰:從32張撲克牌中抽出5張,ET你能不能猜出是什麼?隨后主持人邀請五位現場觀眾上臺,并依次切牌打亂順序后抽出5張。ET能算出他們手中的牌嗎? ET略略沉思,提了一個小要求,請抽到黑色牌面的觀眾轉身。通過機器視覺識別出轉身觀眾后,ET瞬間計算出答案:梅花A……五個居然全中!ET的神奇表現讓主持人大吃一驚,實在是太,不,可,思,議了! 理論上32張撲克牌分到5人手里要全部猜對的概率是2400萬分之一。ET究竟是如何做到的呢? 這是一個經典的魔術,不過這次是由人工智能魔術師來表演。32張撲克牌以DeBruijn序列排列,五人洗牌之后,實際上排列可能減少到32種,ET將轉身觀眾(黑牌)記作1紅牌觀眾記為0。進一步從32種可能性中算出最終的唯一排列,阿里云人工智能科學家初敏說,通常這個魔術非常考驗魔術師的記憶和推算能力。對ET來說,這些都不是難題。 難的是整個過程中需要ET要具備高精確度、高實時性的視頻識別能力,并用人類的語言和主持人溝通交流。因直播環境受到場地、燈光、音效的影響,語音識別、視頻識別都會受到很大考驗,初敏說。 據了解,無論是語音識別還是圖像識別,底層都依賴于深度學習算法以及大規模計算能力。一套復雜算法模型的訓練往往需要千億級別的樣本數據,這就對背后的計算能力提出了很高的要求。 ET代表的是阿里云語音識別、語音合成、自然語言理解、實時圖像識別、機器學習的綜合技術,背后是阿里云飛天操作系統強大的計算能力。 值得注意的是,這并非ET第一次登上舞臺。在今年4月份湖南衛視《我是歌手》的決賽中,ET在直播現場成功預測了李玟奪冠。而在其他領域,ET已經開始擔任法庭書記員、超級交通警察、影視投資經理、客服等角色。
關鍵字標籤:大型魔術秀推薦
|