狂野角斗士
歡迎訪問新Q.科技!

新Q科技

廣告位
當前位置:首頁 > 智能硬件 > 智能硬件 > 正文

播音員會被人工智能取代嗎?揭開“AI合成主播”的神秘面紗

時間:2018-12-05 點擊:28794 次   來源:網信江蘇
[導讀] 第五屆世界互聯網大會期間,新華社聯合搜狗公司發布了全球首個合成新聞主播人工智能合成主播(以下稱AI合成主播),引起了國內外
 第五屆世界互聯網大會期間,新華社聯合搜狗公司發布了全球首個合成新聞主播——“人工智能合成主播”(以下稱“AI合成主播”),引起了國內外媒體的關注。目前“AI合成主播”已經實現日常新聞播報的量產。“AI合成主播”的算法原理是什么?它的出現是否會取代真人主播?對此,新華社新媒體中心副總編輯齊慧杰接受訪談,為你揭開“AI合成主播”的神秘面紗。

▲“AI合成主播”正在播報新聞

Q:第五屆世界互聯網大會上“AI合成主播”表現搶眼。當初萌發“AI合成主播”的創意靈感是什么?開發過程是怎樣的?開發過程中遇到了哪些困難?

齊慧杰:“AI合成主播”的雛形是搜狗公司研發的一款可以從圖像表情、聲音語言等層面進行擬人化訓練的AI產品。我們看到這款AI產品以后,發現它有很多地方可以和媒體的內容生產相結合,最終我們決定和搜狗公司聯合開發這款“AI合成主播”。

在開發過程中,最大的困難是保證“AI合成主播”在工作時,表情、唇動和聲音完全地自然合一。在此之前國外已經有一些虛擬的主播形象了,但是無法做到表情、唇動和聲音的吻合。因此我們在這方面下了大力氣,最終攻克了這一技術難點,這也是我們的“AI合成主播”在技術層面上最獨特的地方。目前這個“AI合成主播”在世界上是獨一無二的,現在很多海外媒體對我們的“AI合成主播”很感興趣。

▲AI合成主播通過語音播報介紹自己

▲“AI合成主播”播報新聞《(珠海航展)燃 紅鷹飛行表演隊發布宣傳片秀特技》

Q:“AI合成主播”背后的算法機制是怎樣的?如何實現音頻和表情、唇動保持自然一致?

齊慧杰:“AI合成主播”最難的地方是實現表情、唇動和聲音的自然一致。為了實現這一點,我們使用了大量的前沿技術,比如人臉關鍵點檢測、人臉特征提取、人臉重構、唇語識別、情感遷移等,在此基礎上結合語音、圖像等多模態信息進行聯合建模訓練后,生成與真人無異的AI分身模型。該項技術能夠將所輸入的中英文文本自動生成相應內容的視頻,并確保視頻中音頻和表情、唇動保持自然一致,展現與真人主播無差別的效果。

Q:“AI合成主播”未來有可能會取代真人主播嗎?

齊慧杰:目前“AI合成主播”可以代替真人主播做一些基礎性的工作,提高了新聞視頻的制作效率。但是在一些互動性較強的欄目,或一些需要應變和評論的場合,還是需要真人主播來完成工作,這是“AI合成主播”一時半會兒無法取代的。

“AI合成主播”可以完成真人主播的部分工作,這也對真人主播的綜合能力提出了更高的要求,未來的真人主播應該是一個集記者、編輯等多重媒體人身份于一身的多面手。