東京奧運會(huì )已落下帷幕。比賽期間,全球億萬(wàn)觀(guān)眾蜂擁至各大轉播平臺觀(guān)看奧運賽事,平臺直播能力顯的尤為重要。阿里云作為視頻直播平臺的技術(shù)提供商,憑借在產(chǎn)品技術(shù)、資源帶寬、服務(wù)保障等方面優(yōu)勢,可為各大轉播平臺提供全鏈路技術(shù)支持和保障,確保極致觀(guān)賽體驗。本文分享阿里云視頻直播技術(shù)是如何實(shí)現的。
一 視頻直播發(fā)展新趨勢與挑戰
根據第三方機構艾媒咨詢(xún)預測,從2017年至2020年,整個(gè)視頻直播始終處于高速的發(fā)展階段,2020年視頻直播帶動(dòng)市場(chǎng)營(yíng)收規模達到萬(wàn)億元,覆蓋用戶(hù)總數達到5.26億。
視頻直播應用場(chǎng)景從泛互聯(lián)網(wǎng)行業(yè)的視頻娛樂(lè )、電商購物等,向在線(xiàn)教育、視頻安防、廣電傳媒、醫療服務(wù)等傳統行業(yè)延伸,“直播+”成為新趨勢。視頻直播市場(chǎng)空間巨大,參與方眾多,競爭激烈。為了能夠吸引到更多用戶(hù),這就要求直播廠(chǎng)商能夠做到直播內容精細化、直播場(chǎng)景豐富化、營(yíng)銷(xiāo)模式創(chuàng )新化,而實(shí)現這些效果是需要直播平臺支持實(shí)時(shí)加互動(dòng)并在直播的基礎上結合短視頻,從而實(shí)現直播整體效果創(chuàng )新。
直播廠(chǎng)商如果選擇自建直播平臺,必然會(huì )面臨極大挑戰:
資源投入大,硬件投入大,帶寬成本高,自建系統投入高,效果一般企業(yè)可節省資金專(zhuān)注核心業(yè)務(wù),選擇市場(chǎng)專(zhuān)業(yè)、靈活的直播服務(wù)商。
技術(shù)門(mén)檻高,技術(shù)上涉及分布式存儲、分布式計算、視頻編解碼技術(shù)、視頻加密、CDN分發(fā)等多個(gè)技術(shù)棧,開(kāi)發(fā)運維人力和時(shí)間成本難以承受。
運營(yíng)成本高,視頻直播業(yè)務(wù)突發(fā)特性,自建視頻直播分發(fā)業(yè)務(wù)難以滿(mǎn)足帶寬彈性需求,造成運營(yíng)成本高,直播內容安全人工審核帶來(lái)高昂的運營(yíng)成本。
二 阿里云視頻直播服務(wù)架構
阿里云視頻直播是基于領(lǐng)先的內容接入與分發(fā)網(wǎng)絡(luò )和大規模分布式實(shí)時(shí)視頻處理技術(shù)打造的音視頻直播平臺,提供易接入、低延遲、高并發(fā)、高清流暢的音視頻直播服務(wù)。

如上圖,主播通過(guò)采集設備采集直播內容后,通過(guò)推流SDK推送直播流,視頻直播服務(wù)通過(guò)邊緣推流的方式將直播流推送至阿里云直播中心,推送的視頻流通過(guò)CDN邊緣節點(diǎn)進(jìn)行加速保證上行傳輸的穩定性。視頻流推送至阿里云直播中心后,可按需對視頻流進(jìn)行轉碼、時(shí)移、錄制、截圖等處理。處理好的視頻流通過(guò)CDN內容分發(fā)網(wǎng)絡(luò ),下發(fā)至觀(guān)眾的設備中進(jìn)行播放。移動(dòng)端的播放設備可以集成阿里云提供的播放器SDK進(jìn)行開(kāi)發(fā)。直播視頻除了可以進(jìn)行轉碼截圖等操作外,還可以進(jìn)行直播轉點(diǎn)播的操作,將錄制下來(lái)的視頻轉至點(diǎn)播系統中再進(jìn)行點(diǎn)播播放和短視頻云剪輯。方便直播與短視頻內容生產(chǎn)和傳播的聯(lián)動(dòng)。
三 視頻直播的核心優(yōu)勢

1 全球加速:一張覆蓋全球的邊緣云節點(diǎn)網(wǎng)絡(luò )
阿里云擁有遍布全球2800+邊緣云節點(diǎn),9大直播中心,支持海外業(yè)務(wù)無(wú)縫布局,通過(guò)阿里云搭建的全球實(shí)時(shí)音視頻通信網(wǎng)(GRTN),全世界各地的直播流可實(shí)現就近接入,通過(guò)高速通道快速傳輸至指定直播中心進(jìn)行內容分發(fā)。

2 極致視聽(tīng):自研音視頻技術(shù)確保最佳體驗
阿里云窄帶高清技術(shù) ,針對視頻畫(huà)面場(chǎng)景、動(dòng)作、內容、紋理等細節進(jìn)行智能分析,例如針對足球賽事中的足球、隊員、草地進(jìn)行不同策略的編碼優(yōu)化,在畫(huà)質(zhì)輸出的同時(shí),降低碼率,節省帶寬成本20%~40%。

左圖人物畫(huà)面是普通轉碼,右圖人物畫(huà)面是窄帶高清轉碼。當觀(guān)眾看到這幅畫(huà)面時(shí),焦點(diǎn)在人物臉部,智能分析會(huì )把更多的碼率分配在人臉上從而實(shí)現整個(gè)人臉的紋理識別,讓細節更加清晰。然后看下對應碼率分析,當畫(huà)面非常復雜的時(shí)候,比如左邊畫(huà)面非常復雜的時(shí)候,碼率是在1.5M~2M之間。當整個(gè)畫(huà)面慢慢的趨于平靜,比如說(shuō)足球集團中場(chǎng)休息的時(shí)候,就可以通過(guò)智能識別來(lái)降低這個(gè)碼率的消耗。這樣的話(huà)平均下來(lái)看,整體帶寬就降低了30%~40%。即前面所說(shuō)在保證畫(huà)面更加清晰的前提下節省帶寬,這就是阿里云的窄帶高清2.0技術(shù) 。

同時(shí),阿里云還有自研實(shí)時(shí)高性能視頻編碼Ali S265,全面支持H265 1080P高質(zhì)量實(shí)時(shí)轉碼,支持視頻增強算法處理,提升視頻畫(huà)質(zhì)。直播編場(chǎng)景下編碼,有一個(gè)非常關(guān)鍵的條件,就是說(shuō)編碼必須達到實(shí)時(shí),也就是1小時(shí)要能把1小時(shí)的視頻轉碼,或者更精細的比如1秒,需要把1秒1個(gè)的視頻的內容給實(shí)現轉碼,要保證到實(shí)時(shí)。阿里云S265就能保證1080P高質(zhì)量實(shí)時(shí)轉碼,并且支持視頻的一個(gè)增強處理算法,提升整個(gè)畫(huà)面的一個(gè)畫(huà)質(zhì)。通過(guò)對比發(fā)現,經(jīng)過(guò)Ali S265處理后的,動(dòng)物后面的那個(gè)樹(shù)樹(shù)的那個(gè)雪花的細節明顯就是做了一些增強。在保證實(shí)時(shí)和圖像質(zhì)量的情況之下做了一個(gè)增強的算法處理的,使得畫(huà)面整體變得更加清晰,富有層次感。
3 技術(shù)領(lǐng)先:直播技術(shù)不斷創(chuàng )新
低延時(shí)直播是在阿里云視頻直播的基礎上,進(jìn)行全鏈路延時(shí)監控、CDN傳輸協(xié)議改造、UDP等底層技術(shù)優(yōu)化,通過(guò)集成直播播放端SDK,支持千萬(wàn)級并發(fā)場(chǎng)景下的節點(diǎn)間毫秒級延時(shí)直播能力,彌補了傳統直播3~6秒延時(shí)的問(wèn)題,保障低延時(shí)、低卡頓、秒開(kāi)流暢的極致直播觀(guān)看體驗。超低延時(shí)直播RTS具有多重的技術(shù)優(yōu)勢,可廣泛應用于各行業(yè)場(chǎng)景,擁有數百家客戶(hù)實(shí)踐經(jīng)驗,低延時(shí)直播為業(yè)務(wù)提升帶來(lái)巨大價(jià)值。

云導播依托視頻直播、媒體處理服務(wù),對傳統視頻生產(chǎn)工具進(jìn)行云端再造,融合視頻AI識別、雙語(yǔ)翻譯、多種互動(dòng)能力,進(jìn)行視頻導播效果創(chuàng )新,無(wú)需采購硬件,隨時(shí)隨地使用。云導播提供控制臺、API、Web SDK三類(lèi)產(chǎn)品,按需接入,便于二次開(kāi)發(fā)或直接使用,控制臺交互簡(jiǎn)單易于上手,低學(xué)習成本。支持直播、點(diǎn)播視頻源,及圖片、文檔、頁(yè)面等多種內容源,最大6路視頻源實(shí)時(shí)混編。多視角、實(shí)時(shí)圖文包裝組件、多語(yǔ)翻譯字幕、視頻AI等能力,對直播隨時(shí)包裝制作,一鍵同步線(xiàn)上,幫助打造精彩沉浸式的直播體驗。

多機位功能針對活動(dòng)現場(chǎng)的多個(gè)機位進(jìn)行多路流的融合、切換播放,不同機位流通過(guò)視頻幀級別的同步播放,使用戶(hù)同時(shí)擁有多個(gè)觀(guān)看視角,不錯過(guò)任何精彩畫(huà)面?;谏疃人惴ǖ膶?shí)時(shí)自動(dòng)摳像技術(shù)實(shí)現虛擬演播廳,支持多種設備、多機位、異地開(kāi)播,通過(guò)云端摳像合成能力,實(shí)現雙屏幕、分屏、畫(huà)中畫(huà)等開(kāi)播場(chǎng)景,打造沉浸式直播體驗。用于快速聚合多個(gè)視頻節目,創(chuàng )建輪播臺類(lèi)型直播間,豐富直播場(chǎng)景和內容形態(tài)。支持節目單的增刪改查功能,支持節目?jì)热莸木庉嬙O置。靈活調用、高效協(xié)同業(yè)務(wù)場(chǎng)景落地。
導播臺ET實(shí)時(shí)字幕,集成導播臺、達摩院ASR、翻譯服務(wù),提供直播流實(shí)時(shí)多語(yǔ)言語(yǔ)音轉字幕服務(wù),支持直播錄制對翻譯字幕的持久化存儲,支持字體、背景、效果、顯示時(shí)間等多種參數設置,支持中、英、法、西、俄多語(yǔ)言模版靈活調用,字幕實(shí)時(shí)疊加,將直播語(yǔ)音轉為文字,翻譯以字幕形式融入直播流中進(jìn)行展示。

云導播還支持對直播素材、點(diǎn)播素材、圖片、文字、動(dòng)態(tài)H5組件素材、AI能力進(jìn)行融合,重構視頻內容生產(chǎn)鏈路,以多維度數據信息,增強用內容豐富度、拓展流量曝光和廣告變現價(jià)值。
4 視頻智能:視頻AI功能應用
視頻審核服務(wù)基于海量標注數據和深度學(xué)習算法實(shí)現,從語(yǔ)音、文字、視覺(jué)等多維度精準識別媒體文件中包含的違禁內容,包括色情、暴恐、廣告、不良場(chǎng)景識別等多個(gè)功能模塊,同時(shí)支持視頻圖像文件內容質(zhì)量審核功能,保障內容安全。

推流SDK是基于阿里云產(chǎn)品的內容分發(fā)網(wǎng)絡(luò )和音視頻實(shí)時(shí)通訊技術(shù),提供簡(jiǎn)單易用的開(kāi)放接口、網(wǎng)絡(luò )自適應的流暢體驗、多節點(diǎn)的低延遲優(yōu)化、功能強大的實(shí)時(shí)美顏等音視頻直播技術(shù)服務(wù)。智能美顏是基于智能視覺(jué)算法、海量規模的人臉檢測和識別技術(shù),提供美顏、美型、美妝、濾鏡貼紙等編輯加工能力。自研的人臉關(guān)鍵點(diǎn)定位技術(shù),涵蓋106個(gè)基礎點(diǎn)位、280個(gè)高精度點(diǎn)位,效果真實(shí)。持續優(yōu)化的智能視覺(jué)算法和實(shí)時(shí)渲染技術(shù),保證自然流暢的使用體驗。持續升級的美顏美型、濾鏡貼紙玩法,不斷擴充的素材庫,創(chuàng )造更多樂(lè )趣。完善的開(kāi)發(fā)者支持,快速響應客戶(hù)需求,提供優(yōu)質(zhì)可靠的服務(wù)。

5 安全穩定:多種安全策略確保直播視頻安全
視頻直播支持訪(fǎng)問(wèn)控制,如Refer UA黑白名單、IP黑白名單等。支持播放中心鑒權和業(yè)務(wù)方遠程鑒權,播放中心鑒權即推流和播放的URL鑒權,安全URL鑒權支持自定義的鑒權Key和鑒權失效時(shí)間,動(dòng)態(tài)生成鑒權URL。業(yè)務(wù)方遠程鑒權是透傳業(yè)務(wù)請求信息給客戶(hù)自定義的鑒權中心判斷合法性。
通過(guò)主備流切換,實(shí)現正常直播的可靠穩定,整個(gè)切換過(guò)程簡(jiǎn)單易操作。阿里云視頻直播服務(wù)還支持通過(guò)EdgeScript實(shí)現自定義鑒權,簡(jiǎn)單方便,客戶(hù)可以根據業(yè)務(wù)特征自定義,部署上線(xiàn)快。EdgeScript可在直播CDN邊緣節點(diǎn)執行自行編寫(xiě),客戶(hù)無(wú)需關(guān)心代碼部署的機器硬件配置、部署region、調度和彈性擴容,代碼一經(jīng)上傳,即可完成全球阿里云直播邊緣云節點(diǎn)的部署,在全球邊緣執行,根據代碼邏輯個(gè)性化處理全球各地的請求。
直播視頻加密是云端一體的視頻加密解決方案,采用私有加密算法,對視頻流加密確保視頻流安全傳輸。支持行業(yè)通用DRM加密,支持多終端、多平臺、全方位進(jìn)行版權保護。該加密方法擁有獨立加密密鑰,避免單一密鑰泄密引起大范圍的安全問(wèn)題,支持加密轉碼+解密播放,動(dòng)態(tài)密鑰管理更安全地保護視頻資源,可有效防止視頻泄露和盜鏈問(wèn)題。數字水印技術(shù)在直播視頻中應用,實(shí)現大型賽事直播版權視頻內容搬運侵權的取證、溯源和追責。
為滿(mǎn)足客戶(hù)運維需求,阿里云支持對直播推流質(zhì)量,觀(guān)看用量,錯誤狀態(tài),觀(guān)看人數,播放流量帶寬,播放質(zhì)量等秒級實(shí)時(shí)的管理,超低的延時(shí)率可及時(shí)獲知直播過(guò)程中的異常狀況。通過(guò)實(shí)時(shí)日志推送功能,將直播域名日志實(shí)時(shí)推送至日志服務(wù),并進(jìn)行日志分析,便于快速發(fā)現和定位主播推流問(wèn)題,或者分析直播觀(guān)看用戶(hù)數據為運營(yíng)策略提供依據。
四 視頻直播的應用場(chǎng)景
按照應用分類(lèi),視頻直播典型場(chǎng)景有大型體育賽事直播、泛娛樂(lè )直播(秀場(chǎng)、游戲、社交)、電商直播、晚會(huì )活動(dòng)直播、在線(xiàn)教育直播、企業(yè)直播等。
1 大型賽事直播

適用場(chǎng)景:奧運會(huì )、世界杯、體育賽事、電子競技等大型賽事直播場(chǎng)景。
場(chǎng)景訴求:提供高可靠、高品質(zhì)、低延時(shí)的直播服務(wù)。支持千萬(wàn)級并發(fā)穩定流暢觀(guān)看,全鏈路災備與應急預案,影院般沉浸式觀(guān)看體驗。
絕對穩定:主備推流,異地雙中心容災,多碼率對齊,httpDNS+302調度,多種方案保障直播穩定。
內容升級:智能生產(chǎn)自動(dòng)剪輯生成比賽集錦;秒級時(shí)移回看,精彩內容絕不錯過(guò);賽事片頭、片尾插播,品牌 LOGO 露出,視頻廣告融合播放,云導播助力巨大流量下品牌營(yíng)銷(xiāo)與變現。
極致流暢觀(guān)看體驗:窄帶高清™ 2.0 提供影院般的畫(huà)質(zhì)享受。50幀極清給用戶(hù)更流暢的沉浸式賽事觀(guān)看體驗。合流方案,在云端對多路流進(jìn)行匯聚優(yōu)化,動(dòng)態(tài)生成幀率最好的一路流輸出。
直播安全:直播DRM保障內容安全,通過(guò)全鏈路災備與應急預案等保障手段,保障千萬(wàn)級用戶(hù)并發(fā)的視頻直播和彈幕互動(dòng)的流暢體驗。
2 泛娛樂(lè )直播

使用場(chǎng)景:秀場(chǎng)直播(唱吧直播,脫口秀)、UGC視頻(生活,娛樂(lè )直播,視頻交友)、游戲直播解說(shuō)。
場(chǎng)景訴求:秀場(chǎng)、游戲、社交直播,為全球文化娛樂(lè )傳播行業(yè)客戶(hù)提供低成本的直播轉碼、分發(fā)能力,助力客戶(hù)快速進(jìn)行全球范圍內的活動(dòng)直播。
直播端能力:主播通過(guò)手機、PC終端推流,觀(guān)眾通過(guò)終端進(jìn)行觀(guān)看。阿里云直播提供推流SDK和播放SDK,內置美顏美妝功能。
直播服務(wù)端能力:GRTN傳輸網(wǎng)絡(luò )和實(shí)時(shí)轉碼能力保障百萬(wàn)并發(fā)觀(guān)眾都能看到穩定、流暢、高畫(huà)質(zhì)的直播內容。
主播與觀(guān)眾互動(dòng):直播間點(diǎn)贊、評論、連麥互動(dòng)。
智能審核方案:根據用戶(hù)管控尺度,靈活調整策略進(jìn)行視頻畫(huà)面黃反審核。多種識別方案,有效匹配多種語(yǔ)音場(chǎng)景。針對特定廣告事件進(jìn)行定時(shí)管控,識別變種廣告。有效識別靜態(tài)無(wú)意義視頻內容,提高運營(yíng)管控效率。
3 電商直播

適用場(chǎng)景:商城直播(產(chǎn)品介紹、曬單分享、最大化完成售賣(mài)轉化)、微商互動(dòng)(“直播+互動(dòng)“的模式,通過(guò)社交傳播,助力商品快速變)。
場(chǎng)景訴求:直播帶貨最重要的兩個(gè)能力一個(gè)是直播能力,一個(gè)是互動(dòng)通信能力。通過(guò)直播能力,觀(guān)眾能觀(guān)看直播流;通過(guò)互動(dòng)通信能力,觀(guān)眾能在直播間里參與實(shí)時(shí)互動(dòng)。
直播端能力:主播通過(guò)手機、電腦、專(zhuān)業(yè)設備進(jìn)行推流。觀(guān)眾通過(guò)手機、PC、Web、小程序進(jìn)行觀(guān)看。
直播服務(wù)端能力:通過(guò)就近接入直播收流和加速分發(fā),保障全世界買(mǎi)家都能看到穩定、流暢、高畫(huà)質(zhì)的直播內容。
直播錄制與回放:把直播過(guò)程中商品精彩介紹生成短視頻,直播結束后也可以沉淀為精彩內容促進(jìn)售賣(mài)轉化。直播時(shí)移支持直播過(guò)程中任意精彩內容按需回看,買(mǎi)家可以隨意拖拽時(shí)間軸回看錯過(guò)的精彩直播。
主播與買(mǎi)家互動(dòng):賣(mài)家觀(guān)看直播過(guò)程中會(huì )實(shí)時(shí)咨詢(xún)寶貝信息、評論等互動(dòng)交流。直播中進(jìn)行秒殺、抽獎和紅包互動(dòng)營(yíng)銷(xiāo)。直播流端到端延時(shí)1秒或更低。
4 晚會(huì )活動(dòng)直播

適用場(chǎng)景:面向新聞類(lèi)、體育類(lèi)、綜藝類(lèi)等晚會(huì )、活動(dòng)直播。
場(chǎng)景訴求:高質(zhì)量高可靠晚會(huì )、活動(dòng)直播,呈現超高清、杜比全景聲、大規模全球分發(fā)的視頻直播視聽(tīng)盛宴。
更高清+杜比全景聲:使用4K高清轉播車(chē)進(jìn)行信號傳輸和杜比全景聲,讓屏幕前的觀(guān)眾聽(tīng)到的聲音,“比現場(chǎng)觀(guān)眾還真實(shí)”。在用戶(hù)投身購物狂歡的同時(shí),也收獲了視聽(tīng)觀(guān)感上的雙重享受。
高可靠:通過(guò)雙路SRT回傳技術(shù),確保如主路信號源發(fā)生異常,切換到備路后能夠繼續保持前后畫(huà)面同步,真正做到無(wú)縫切換,從而保障重要節目源在復雜的網(wǎng)絡(luò )中高質(zhì)量傳輸,將精彩內容更低成本、更穩定、更快速、更完整地送到用戶(hù)屏幕前。
5 在線(xiàn)教育直播

適用場(chǎng)景:成人教育大班課。
場(chǎng)景訴求:需要支持不同地區不同網(wǎng)絡(luò )情況下學(xué)生都能穩定觀(guān)看高質(zhì)量直播課;低延時(shí)直播保證師生互動(dòng)效果(低延時(shí)直播流和消息互動(dòng)保持同步);直播安全為核心教學(xué)內容保駕護航。
海量直播并發(fā)支持:支持千萬(wàn)并發(fā)觀(guān)看,全球 2800+ CDN 節點(diǎn)覆蓋,150T帶寬儲備,專(zhuān)線(xiàn)保障跨國直播質(zhì)量。
直播回放錄制:云端錄制課程直播內容,生成回放文件可隨時(shí)查閱觀(guān)看。直播時(shí)移支持直播過(guò)程中任意精彩內容按需回看。
直播互動(dòng)答疑:老師和學(xué)生的互動(dòng)促進(jìn)提升在線(xiàn)教育課堂授課效果。一體化SDK支持互動(dòng)連麥、評論發(fā)言、群組管理等功能。
直播安全防盜:支持URL鑒權、遠程鑒權、阿里加密、DRM加密等鏈路和內容加密功能,按需使用保障內容安全防盜播,防范內容。
6 企業(yè)直播

適用場(chǎng)景:企業(yè)營(yíng)銷(xiāo)直播、金融直播場(chǎng)景。
場(chǎng)景訴求:非專(zhuān)業(yè)直播機構,沒(méi)有完善的線(xiàn)下演播室,需要云端支持多機位、導播、虛擬演播室完善直播內容;同時(shí)是低延時(shí)強互動(dòng)直播。
短延遲互動(dòng)直播,營(yíng)銷(xiāo)效果佳:企業(yè)營(yíng)銷(xiāo)直播、金融直播場(chǎng)景需要功能齊全、高性?xún)r(jià)比、超低延時(shí)直播帶貨,支持百萬(wàn)級高并發(fā),端到端延時(shí)1秒?;?dòng)更及時(shí),搶紅包秒殺帶貨更流暢,提升GMV和用戶(hù)轉化。
云端視頻處理,直播更專(zhuān)業(yè):營(yíng)銷(xiāo)直播更有針對性的提前進(jìn)行直播內容策略與準備,直播內容豐富度和專(zhuān)業(yè)性更強。云導播支持點(diǎn)播和直播源融合切換,在直播過(guò)程中可無(wú)縫穿插精品點(diǎn)播宣傳片等內容。虛擬演播室更能支持多種設備、多機位、異地開(kāi)播,通過(guò)云端摳像合成能力,實(shí)現雙屏幕、分屏、畫(huà)中畫(huà)等開(kāi)播場(chǎng)景,打造沉浸式直播體驗。
本文由網(wǎng)上采集發(fā)布,不代表我們立場(chǎng),轉載聯(lián)系作者并注明出處:http://seensnowboarding.com/shbk/37947.html