為什麼要講視頻的內容,他提到如下幾點。
一是視頻跟圖像相比更加深入,視頻是ToB的東西,但是研究視頻是很大的挑戰,有很大的榮譽;第二是大傢看到視覺領域比如人臉、安防方面的進展,視頻領域是比較嶄新的東西。第三是他本人在十年前做視頻方面的研究,所有人都說視頻是下一個風口,今天看來這個說法也是對的。
要做視覺問題基本上分三個步驟:
第一,理解一個東西,比如說識別一個桌子,在這裡要瞭解一些線條;第二,人為設計一些特征來描述;第三,設計一些分類器。
現在的深度學習的錯誤率在不斷降低,imaGEClassifiCATion從最早的8層到20多層,到現在能達到152層。
視頻的創作、處理和消費:
creation
這裡面有一個基本概念,Video的產生是先把Video切成一個一個的鏡頭,可以看成是一個一個斷碼,然後每一個鏡頭再編成一個故事,每幾個語言可以放成一個故事。每一個鏡頭可以分成Sub-shots,然後有一個數據。
curation
有瞭Video之後要做的事情是給Video打標簽,至今為止可以打上1000個的靜態標簽,有瞭這些靜態標簽就可以設置到內容裡面去。
另外還可以分析動作,給你一個Video,能不能生成一句話來描述這個Video,以前我們說這個Video是一個舞蹈,現在可以告訴你這是一個什麼舞蹈。可以實時產生字母,自動評價,例如微軟小冰,你上傳視頻給小冰,它會誇贊你。小冰還可以寫詩。
也可以將Video進行編輯,加上濾鏡,或是做風格的轉換,把自然的Video變得非常卡通。Video中的人物分割出來可以放到另外一個虛擬的場景裡面去。你可以想象,當兩個人在異地談戀愛的時候,我們能夠給他一個房間,讓他們在房間裡面進行聊天。
另外,也可以提供服務,讓image、Video變得更好,這都是機器產生的效果。加上人工的處理,視頻就可以變得更加時尚。台中註冊商標流程
consumption
梅濤提到,做Video廣告有兩個問題需要解決:第一個問題是廣告到底放在Video的什麼位置;第二個問題是選什麼樣的廣告,這個廣告跟你插入點的信息是不是相關,使得用戶接受度更加好。
他們的解決方案,將Video進行分解,做一系列的動作,從而符合廣告商的需求或滿足不台灣商標註冊查詢同用戶的需求。
最後梅濤總結到,在做科研的人看來,AI也好,深度學習也好,落地都有很長的路要走,我們要腳踏實地的一個一個的去實現。
更多詳細的演講內容參見雷鋒網後續報道。雷鋒網(公眾號:雷鋒網)原創。
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。
申請商標流程
文章標籤
全站熱搜