在線咨詢 9:00-18:00
近日,百度研究院推出一項(xiàng)黑科技:十分鐘內(nèi)文章變視頻的AI神器面世。這個(gè)消息瞬間轟動(dòng)了整個(gè)業(yè)界,尤其是新聞工作者和媒體人,更是奔走相告。這個(gè)AI神器的面世表明,只要有一篇現(xiàn)成的圖文鏈接,AI神器就可以根據(jù)圖文描述的主題,重新組織語(yǔ)言,自動(dòng)搜尋素材,剪出一條短視頻。
換句話說(shuō),如果看到有意思的新聞卻懶得讀文章,那就把你在讀的這篇文章的地址輸入給AI,文章就自動(dòng)變成了短視頻。而且,這個(gè)過(guò)程只需要幾分鐘的時(shí)間,完全無(wú)人化自動(dòng)操作,你下樓買了杯咖啡,視頻就自動(dòng)做好了。
這個(gè)“AI做視頻”技術(shù)來(lái)自百度研究院,產(chǎn)品的名字,叫做VidPress。你看,它可以自己做一條視頻,來(lái)報(bào)道自己的出生:
看起來(lái)就像正常的電視新聞一樣。這下,視頻編輯們?cè)僖膊挥脼榱怂阉夭摹⒏哪_本、加特效、渲染導(dǎo)出而加班熬夜了。
1、文章變視頻的AI
本質(zhì)上,VidPress是做的事情是“圖文轉(zhuǎn)視頻”,把人類寫(xiě)好的圖文稿件重新編輯成視頻,可以參考一下上面視頻內(nèi)容的原文:
比較之下,你會(huì)發(fā)現(xiàn)視頻和文章的文案部分都是類似的,但視頻中用到的素材卻遠(yuǎn)不止文章中這么少,增加了許多人物和場(chǎng)景的動(dòng)態(tài)鏡頭,而且相當(dāng)契合主題。那一定是用語(yǔ)音合成做了配音部分,然后視頻編輯隨手搜了幾個(gè)視頻素材放上去了咯?
并不是。整個(gè)視頻都是AI生成的,視頻編輯只需要給出一篇文章的鏈接,過(guò)幾分鐘,熱騰騰的視頻就出鍋了,不信往下看。
2、文章自動(dòng)生成視頻,只需有文章地址鏈接
用VidPress來(lái)做視頻,不需要視頻編輯有任何技術(shù)背景,會(huì)復(fù)制粘貼就行。
首先,把需要改成視頻的文章地址復(fù)制,粘貼到VidPress。
然后,選擇用哪個(gè)聲音合成,確定所需視頻的長(zhǎng)度以及分辨率。
現(xiàn)在,視頻編輯就可以放手讓AI開(kāi)始工作了。
獲得圖文內(nèi)容后,AI會(huì)借助NLP模型進(jìn)行語(yǔ)義理解,用主題模型聚合相關(guān)新聞和素材。
之后,需要分別完成音頻和圖像的編輯工作。
音頻方面,系統(tǒng)會(huì)用多種語(yǔ)言模型處理解析原文,生成解說(shuō)詞,之后借助語(yǔ)音合成技術(shù)變成音頻。
而圖像方面,原文中的圖片肯定是不太夠的,需要再搜尋更多視頻和圖片素材。素材的來(lái)源可以是視頻編輯自己的素材庫(kù),也可以直接實(shí)時(shí)的用百度搜索來(lái)找素材。
找到素材后,需要借助人臉識(shí)別、物體識(shí)別、OCR、視頻內(nèi)容理解等技術(shù)來(lái)解析理解視頻素材的內(nèi)容,自動(dòng)剪切選取合適的片段。
有了視頻素材和解說(shuō)詞音頻文件,需要把兩者合二為一。在這個(gè)任務(wù)上,百度自研了兩代對(duì)齊算法,第一代對(duì)齊算法是基于段落的對(duì)齊,第二代則是基于錨點(diǎn)的時(shí)間軸對(duì)齊算法。
第二代對(duì)齊的算法首先需要找出解說(shuō)詞里觀眾的興趣點(diǎn),然后再將搜到的素材和這些興趣點(diǎn),進(jìn)行相關(guān)度打分,綜合考慮素材的來(lái)源、相似度、圖片/視頻內(nèi)容的貼合度、內(nèi)容質(zhì)量等方面。
之后,得分高的素材就率先被翻牌子,放到視頻時(shí)間軸里興趣點(diǎn)的位置。而剩下的素材就會(huì)被填充到空隙里,最后再對(duì)整個(gè)時(shí)間軸的內(nèi)容分布進(jìn)行調(diào)整。現(xiàn)在,AI就把視頻做好了,渲染一下,就是一個(gè)完整的視頻。
這個(gè)過(guò)程只花費(fèi)幾分鐘后。當(dāng)編輯再次切回VidPress頁(yè)面,視頻已經(jīng)自動(dòng)生成好了,還自動(dòng)配好了字幕。之后,編輯也可以人工修改。如果覺(jué)得某一部分的文案不夠好,可以替換編輯成所需的文案重新導(dǎo)出視頻。
3、速度快,用時(shí)短:10分鐘內(nèi)完成
誠(chéng)然,VidPress目前還無(wú)法完成真人視頻博主那樣專門策劃拍攝的短視頻作品,但是如果用來(lái)做新聞簡(jiǎn)訊類視頻,那VidPress的水平已經(jīng)足夠?qū)崿F(xiàn)商業(yè)應(yīng)用了,除了沒(méi)有真人播音員,做出來(lái)視頻的樣子和以前的電視新聞節(jié)目十分類似。
但是它勝在速度太快,生成一條視頻可能只要十幾分鐘,而其中一半的時(shí)間都是AI在自動(dòng)工作,人類視頻編輯只要粘貼鏈接,設(shè)置好聲音時(shí)間分辨率就行了,再也不用苦苦守在電腦前剪視頻了。
可以說(shuō),用這種方式來(lái)工作,做視頻的時(shí)間比往各個(gè)平臺(tái)發(fā)視頻的時(shí)間都短,以前一小時(shí)的工作,可能現(xiàn)在10分鐘內(nèi)就能完成,再也不用加班熬夜,短視頻編輯們要笑著迎接955了。
有了這樣的剪輯效率,當(dāng)瓜來(lái)了的時(shí)候,別的編輯還在哼哧哼哧找素材剪視頻,用VidPress的編輯已經(jīng)做好了視頻,發(fā)給了吃瓜群眾,還沒(méi)等撤熱搜就可以收獲10W+,美滋滋。
目前,VidPress生成一個(gè)2分鐘左右的720p視頻, 所需時(shí)間的中位數(shù)僅為2.5分鐘。而在百度好看視頻內(nèi)部,整個(gè)平臺(tái)每天可以生產(chǎn)500到1000條視頻,而且這些視頻所圍繞的新聞熱點(diǎn)都是系統(tǒng)自動(dòng)發(fā)現(xiàn)、自動(dòng)生成的。只要服務(wù)器在跑,即使躺在家里,平臺(tái)上就會(huì)有源源不斷的視頻出現(xiàn),并自動(dòng)分發(fā)給觀眾。
如此高的生產(chǎn)效率,簡(jiǎn)直是短視頻領(lǐng)域的一記驚雷。
如今短視頻火得一塌糊涂,正處紅利期,無(wú)論是騰訊、頭條還是百度自己,都在爭(zhēng)相自研或投資短視頻平臺(tái),這類工具一旦開(kāi)放,會(huì)是大大小小創(chuàng)作者、MCN們爭(zhēng)搶市場(chǎng)的巨大機(jī)遇,AI制造的短視頻,會(huì)像當(dāng)年的中國(guó)制造一樣,涌入各個(gè)視頻平臺(tái),成為新的一波流量收割機(jī)。
畢竟,圖文內(nèi)容的生產(chǎn)成本,可比視頻內(nèi)容低得多,只要寫(xiě)好文章,分分鐘就會(huì)有配套的視頻出來(lái),同一份辛勤,收獲多幾倍的流量,那么至少在目前階段,這類AI生成視頻就是觸手可得的紅利。
以上就是關(guān)于“小泥人解讀百度研究院的黑科技:十分鐘內(nèi)文章變視頻的AI神器面世”的全部?jī)?nèi)容。這項(xiàng)黑科技大大提高了工作效率,同時(shí)也能帶來(lái)超大流量。抓住了這個(gè)機(jī)遇,就抓住了成功。更多精彩請(qǐng)電話咨詢4006566135,或登錄小泥人官網(wǎng)www.635867.com
小泥人成立于2010年,總部位于以創(chuàng)新而著稱的中關(guān)村科技園區(qū),成立以來(lái)一直秉承服務(wù)于企業(yè)和商家,在移動(dòng)互聯(lián)網(wǎng)的背景下,幫助全天下的企業(yè)和商家進(jìn)行基礎(chǔ)信息建設(shè),建立全網(wǎng)營(yíng)銷,打造移動(dòng)營(yíng)銷閉環(huán)為宗旨,幫助全天下的景區(qū)和場(chǎng)館打造智慧景區(qū)和智慧場(chǎng)館為己任,以務(wù)實(shí),專業(yè),創(chuàng)新的態(tài)度,依托強(qiáng)大的技術(shù)研發(fā)能力,成功服務(wù)于百萬(wàn)企業(yè)用戶。
小泥人是一家蓬勃發(fā)展的創(chuàng)新性企業(yè),一直以技術(shù)為驅(qū)動(dòng),市場(chǎng)先行,經(jīng)過(guò)6年發(fā)展,于2016年11月18日在北股交正式敲鐘掛牌,股票代碼是:099189。掛牌后,迅速開(kāi)通了河南,山東,江蘇,上海等40多個(gè)分站。2017年又獲得創(chuàng)新中國(guó)2017年十大領(lǐng)軍企業(yè),國(guó)家高新技術(shù)企業(yè),目前已經(jīng)獲得了千萬(wàn)級(jí)A輪融資。小泥人主營(yíng)業(yè)務(wù)有小程序制作,VR全景拍攝,智慧景區(qū)建設(shè)等,現(xiàn)在發(fā)展更加迅猛,為實(shí)現(xiàn)一家偉大的互聯(lián)網(wǎng)公司而全力以赴!
小泥人是國(guó)內(nèi)領(lǐng)先的小程序一站式解決方案原生案例的提供者和制作平臺(tái),此平臺(tái)是一款基于小程序的可視化編輯器,實(shí)現(xiàn)可視化操作,所做所見(jiàn)即所得,無(wú)需代碼,無(wú)任何編程基礎(chǔ)即可一鍵生成小程序;此平臺(tái)海量小程序模板,多樣功能組件,最大程度滿足開(kāi)發(fā)者需求,只需要簡(jiǎn)單的拖拉就可生成任意行業(yè)的小程序,并能一鍵完成域名注冊(cè)、解析及 SSL證書(shū)部署等;此平臺(tái)輕松上架商品,自定義商品排列方式和分類,實(shí)現(xiàn)線上支付,一鍵組建你的商城,一鍵打包生成小程序代碼,對(duì)接微信平臺(tái)和開(kāi)發(fā)者工具,幫助企業(yè)無(wú)代碼快速搭建自己的小程序,幫助實(shí)體店實(shí)現(xiàn)方圓5公里免費(fèi)展示和海量客戶引流!
小泥人是國(guó)內(nèi)領(lǐng)先的全景和VR(虛擬現(xiàn)實(shí))服務(wù)平臺(tái),融合互聯(lián)網(wǎng)和拍攝技術(shù),為客戶提供全景展示策劃,720度全景拍攝,全景制作,VR發(fā)布和分享。此平臺(tái)幫助企業(yè)提升形象,提高客戶信任度,縮短了用戶與現(xiàn)實(shí)世界的時(shí)空距離感,是一種新型的企業(yè)展示方式和宣傳方式,廣泛應(yīng)用企業(yè),政府機(jī)關(guān),事業(yè)單位,院校,工廠,餐飲,酒店,景點(diǎn)等各個(gè)行業(yè)。
小泥人是互聯(lián)網(wǎng)+智慧景區(qū)和智慧場(chǎng)館的實(shí)踐者和引領(lǐng)者,率先自主研發(fā)了智慧景區(qū)系統(tǒng),獲得國(guó)家版權(quán)局軟件著作權(quán)證書(shū),率先實(shí)現(xiàn)了線下紙票出票檢票系統(tǒng),線上電子票分銷和移動(dòng)微信營(yíng)銷,VR拍攝和小程序建設(shè),硬件支持等四系統(tǒng)的合成,此系統(tǒng)以景區(qū)和場(chǎng)館等資源方為中心,具有跨媒體營(yíng)銷和多硬件支持的能力,既能幫助景區(qū)和場(chǎng)館實(shí)現(xiàn)信息化,全面打通了分銷渠道,又能掌握了終端消費(fèi)者,達(dá)到了宣傳效果,節(jié)約了成本,提升了客戶體驗(yàn)。
閱讀量:20582