自“清朗·網(wǎng)絡(luò)平臺(tái)算法典型問(wèn)題治理”專項(xiàng)行動(dòng)開展以來(lái),中央網(wǎng)信辦積極督促指導(dǎo)重點(diǎn)平臺(tái),對(duì)信息推薦算法功能進(jìn)行針對(duì)性優(yōu)化,對(duì)算法規(guī)則作出調(diào)整。在此背景下,各平臺(tái)積極響應(yīng),通過(guò)一系列切實(shí)有效的舉措,致力于為用戶打造更加健康、多元、透明的網(wǎng)絡(luò)環(huán)境。抖音通過(guò)提升算法透明度、打破“信息繭房”、完善推薦內(nèi)容審核等舉措,為網(wǎng)絡(luò)平臺(tái)算法優(yōu)化提供實(shí)踐樣本。
提升算法透明度:基于用戶行為推薦算法
算法是一種以數(shù)學(xué)或計(jì)算機(jī)科學(xué)實(shí)現(xiàn)自動(dòng)化的計(jì)算方式,常用于計(jì)算、數(shù)據(jù)處理和自動(dòng)推理。隨著互聯(lián)網(wǎng)技術(shù)持續(xù)深入生產(chǎn)生活,算法不斷被應(yīng)用于電商、出行、交友等不同屬性的平臺(tái)來(lái)解決用戶需求。
信息爆炸時(shí)代,算法提供了一種與巨量信息相處的方式。推薦系統(tǒng)是一套信息過(guò)濾系統(tǒng),這套系統(tǒng)能實(shí)現(xiàn)個(gè)性化推薦,給每個(gè)用戶量身定制一位信息“快遞員”,高效、準(zhǔn)確地把可能需要的信息推送到用戶面前。
通過(guò)人工智能深度學(xué)習(xí)算法,推薦系統(tǒng)不斷學(xué)習(xí)用戶的使用行為。每一次刷新、滑動(dòng),算法都會(huì)從候選內(nèi)容池中快速對(duì)數(shù)千條用戶可能感興趣的內(nèi)容進(jìn)行排序。排序打分模型會(huì)對(duì)每條內(nèi)容進(jìn)行打分,預(yù)估用戶對(duì)每條內(nèi)容的點(diǎn)贊、關(guān)注、收藏、分享、不喜歡、評(píng)論區(qū)停留時(shí)長(zhǎng)等行為,計(jì)算用戶觀看這條內(nèi)容獲得的價(jià)值總和,然后進(jìn)行排序,排名靠前的內(nèi)容才有機(jī)會(huì)被推薦到用戶面前。
基于深度學(xué)習(xí)的推薦算法機(jī)制,推薦系統(tǒng)被廣泛應(yīng)用于國(guó)內(nèi)外各大主流社交媒體平臺(tái)。以抖音為例,其推薦系統(tǒng)包含召回、過(guò)濾、排序等環(huán)節(jié),重點(diǎn)是學(xué)習(xí)用戶行為?;谟脩粜袨榈耐扑]方法包含多種技術(shù)模型,如協(xié)同過(guò)濾、雙塔召回、Wide&Deep(深寬)模型等。在召回階段,雙塔召回模型將用戶特征與內(nèi)容特征轉(zhuǎn)化為數(shù)學(xué)向量,通過(guò)計(jì)算向量間的空間距離,從海量?jī)?nèi)容中快速篩選出用戶潛在感興趣的內(nèi)容。算法可以在完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶,并把其他人感興趣的內(nèi)容推薦給該用戶。
目前,抖音算法幾乎不依賴對(duì)內(nèi)容和用戶打標(biāo)簽,而是應(yīng)用基于用戶行為的推薦方法——排序算法,通過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算預(yù)估用戶行為,計(jì)算用戶觀看這條內(nèi)容獲得的價(jià)值總和,并把排名靠前的內(nèi)容推給用戶。
排序算法基于用戶行為推薦,對(duì)可能發(fā)生的用戶行為預(yù)測(cè)打分。
抖音通過(guò)產(chǎn)品功能創(chuàng)新,將透明度提升與用戶賦權(quán)有機(jī)結(jié)合。開設(shè)抖音安全與信任中心網(wǎng)站,舉辦開放日活動(dòng),以通俗易懂的圖文、視頻向公眾闡釋推薦邏輯、干預(yù)機(jī)制以及治理成效,讓用戶能夠更好地了解平臺(tái)算法的運(yùn)行機(jī)制,保障用戶知情權(quán)。
打破“信息繭房”:多目標(biāo)算法拓寬興趣邊界
從平臺(tái)運(yùn)營(yíng)視角看,單一內(nèi)容推薦會(huì)導(dǎo)致用戶體驗(yàn)下降與活躍度流失,這種視角與用戶規(guī)避“信息繭房”的需求相同,“破繭”也是算法平臺(tái)的內(nèi)生動(dòng)力。
抖音算法以“用戶長(zhǎng)期價(jià)值”為核心目標(biāo),通過(guò)對(duì)用戶行為數(shù)據(jù)的深度學(xué)習(xí)來(lái)預(yù)測(cè)互動(dòng)概率。其核心邏輯可簡(jiǎn)化為一個(gè)公式:綜合預(yù)測(cè)用戶行為概率×行為價(jià)值權(quán)重=視頻推薦優(yōu)先級(jí)。算法會(huì)對(duì)點(diǎn)贊、評(píng)論、收藏、分享、播放時(shí)長(zhǎng)等十余種行為進(jìn)行概率預(yù)估。
早期推薦算法多以單一目標(biāo)(如完播率)為導(dǎo)向,而抖音算法已進(jìn)化到復(fù)雜的多目標(biāo)體系。該體系涵蓋用戶體驗(yàn)、內(nèi)容質(zhì)量、創(chuàng)作者收益等多元維度。在推薦中長(zhǎng)視頻時(shí),即便完播率指標(biāo)可能不占優(yōu)勢(shì),但只要視頻在分享、收藏、評(píng)論等指標(biāo)上表現(xiàn)突出,算法依然會(huì)為其分配流量。例如,視頻《450分鐘深度解讀〈紅樓夢(mèng)〉》憑借較高的分享率、收藏率等多目標(biāo)優(yōu)勢(shì),突破短視頻流量對(duì)完播率的依賴,獲得超3億播放量。
為打破“信息繭房”,抖音在算法目標(biāo)中設(shè)置“探索類指標(biāo)”。一方面,對(duì)用戶表現(xiàn)出的興趣進(jìn)行多樣性打散處理,嚴(yán)格控制相似內(nèi)容的出現(xiàn)頻次。假設(shè)用戶連續(xù)觀看3條寵物視頻,算法會(huì)主動(dòng)插入科普、美食等非同類內(nèi)容,避免用戶陷入單一興趣的循環(huán)。另一方面,通過(guò)隨機(jī)推薦、社交關(guān)系拓展、搜索聯(lián)動(dòng)等多種方式,幫助用戶發(fā)現(xiàn)新興趣。當(dāng)用戶搜索“攝影技巧”后,算法不僅會(huì)推薦相關(guān)教程,還會(huì)推薦“旅行攝影”“手機(jī)修圖”等拓展內(nèi)容,拓寬用戶的興趣邊界。
“收藏+復(fù)訪”“關(guān)注+追更”等組合目標(biāo)的應(yīng)用,進(jìn)一步增強(qiáng)了算法對(duì)用戶長(zhǎng)期需求的挖掘能力。當(dāng)用戶收藏健身教程并在一周內(nèi)多次觀看時(shí),算法會(huì)判定該內(nèi)容對(duì)用戶具有長(zhǎng)期價(jià)值,進(jìn)而增加健身知識(shí)、運(yùn)動(dòng)裝備等相關(guān)內(nèi)容的推薦;若用戶收藏后僅觀看一次,則視為短期興趣,減少后續(xù)推送頻率。這種機(jī)制既避免了單一興趣的過(guò)度強(qiáng)化,又提升了內(nèi)容與用戶長(zhǎng)期需求的匹配度。
同時(shí),升級(jí)“使用管理助手”,創(chuàng)新推出內(nèi)容偏好評(píng)估功能,以可視化圖表清晰呈現(xiàn)用戶近期瀏覽內(nèi)容的興趣分布,用戶可以據(jù)此直觀了解自己的興趣偏好分布,從而更有針對(duì)性地調(diào)整內(nèi)容獲取方向;“探索更多”功能則一鍵拓展推薦內(nèi)容的多樣性,為用戶帶來(lái)更豐富多元的內(nèi)容體驗(yàn)。
完善推薦內(nèi)容審核:人工運(yùn)營(yíng)為算法保駕護(hù)航
抖音構(gòu)建“人工+機(jī)器”協(xié)同治理體系,涵蓋異常感知、標(biāo)準(zhǔn)定義、機(jī)器識(shí)別、人工研判、風(fēng)險(xiǎn)處置等全流程,持續(xù)優(yōu)化熱點(diǎn)當(dāng)事人核實(shí)機(jī)制,防止擺拍造假、仿冒蹭熱、拼湊剪接等惡意傳播行為。用戶上傳內(nèi)容后,首先進(jìn)入機(jī)器識(shí)別環(huán)節(jié),若被檢測(cè)出含有血腥、低俗等高危特征,將被直接攔截。未命中高危特征但模型判斷存在潛在問(wèn)題的內(nèi)容,就會(huì)流轉(zhuǎn)至人工審核。人工審核團(tuán)隊(duì)由專業(yè)人員組成,針對(duì)機(jī)器識(shí)別的疑難點(diǎn)進(jìn)行研判,例如,對(duì)于爭(zhēng)議性劇情類視頻,人工審核從更復(fù)雜的角度進(jìn)行價(jià)值觀判斷,確保內(nèi)容符合平臺(tái)規(guī)范。
協(xié)同治理體系遵循兩大準(zhǔn)則:一是流量越高的內(nèi)容評(píng)估次數(shù)越多、標(biāo)準(zhǔn)越嚴(yán)格,一條熱門視頻可能經(jīng)歷初審、復(fù)審、三審及運(yùn)營(yíng)介入的多層審核,確保高流量?jī)?nèi)容的質(zhì)量與合規(guī)性;二是“機(jī)器負(fù)責(zé)寬度、人工負(fù)責(zé)深度”,機(jī)器每天對(duì)內(nèi)容進(jìn)行批量風(fēng)險(xiǎn)過(guò)濾,人工則聚焦對(duì)高流量、高風(fēng)險(xiǎn)內(nèi)容的精準(zhǔn)研判。
抖音設(shè)立專門的標(biāo)準(zhǔn)管理團(tuán)隊(duì),對(duì)違法違規(guī)、色情低俗、公序良俗等十幾類、數(shù)百種風(fēng)險(xiǎn)制定細(xì)化標(biāo)準(zhǔn),每條標(biāo)準(zhǔn)均匹配典型案例與執(zhí)行手冊(cè)。例如,針對(duì)虛假擺拍問(wèn)題,標(biāo)準(zhǔn)明確界定“刻意編造劇情誤導(dǎo)觀眾”的具體情形,包括模仿突發(fā)事件、虛構(gòu)身份經(jīng)歷等。標(biāo)準(zhǔn)管理團(tuán)隊(duì)根據(jù)法律法規(guī)調(diào)整、社會(huì)熱點(diǎn)變化定期迭代內(nèi)容,確保平臺(tái)治理標(biāo)準(zhǔn)與時(shí)俱進(jìn)。
治理流程上,內(nèi)容審核采用“三審三?!睓C(jī)制:初審識(shí)別底線風(fēng)險(xiǎn),復(fù)審判斷非底線問(wèn)題是否適合廣泛傳播,三審對(duì)高熱內(nèi)容進(jìn)行綜合質(zhì)量評(píng)估。此外,視頻被舉報(bào)、評(píng)論區(qū)出現(xiàn)集中質(zhì)疑等異常信號(hào),也會(huì)觸發(fā)額外審核。
針對(duì)網(wǎng)絡(luò)暴力、未成年人保護(hù)、生成式人工智能技術(shù)濫用等焦點(diǎn)問(wèn)題,抖音成立專項(xiàng)治理團(tuán)隊(duì)。以網(wǎng)絡(luò)暴力專項(xiàng)治理團(tuán)隊(duì)為例,網(wǎng)絡(luò)暴力治理面臨以下難題:施暴者、受害者、旁觀者等角色難區(qū)分;場(chǎng)景廣泛,涵蓋短視頻、直播間、評(píng)論區(qū)、賬號(hào)主頁(yè)等;傳播方面具有突發(fā)性、密集性和破壞性等特征;此外,還存在概念難界定、時(shí)效難保證、單個(gè)平臺(tái)難根治等問(wèn)題。針對(duì)上述問(wèn)題,網(wǎng)絡(luò)暴力專項(xiàng)治理團(tuán)隊(duì)以“防護(hù)、打擊、教育”為關(guān)鍵詞,通過(guò)主動(dòng)識(shí)別潛在網(wǎng)絡(luò)暴力受害者并推送預(yù)警、分級(jí)干預(yù)風(fēng)險(xiǎn)賬號(hào)、設(shè)置防網(wǎng)絡(luò)暴力專區(qū),為其提供工具進(jìn)行防護(hù);通過(guò)重點(diǎn)打擊侮辱威脅、煽動(dòng)圍攻及侵犯隱私等三類施暴者,結(jié)合人工智能與人工治理,持續(xù)打擊施暴行為;通過(guò)發(fā)布治理規(guī)范、發(fā)起反網(wǎng)絡(luò)暴力倡議及案例宣傳提升公眾關(guān)于網(wǎng)絡(luò)暴力的認(rèn)知。另外,針對(duì)重點(diǎn)場(chǎng)景和人群,打造專屬功能,為受害者提供心理關(guān)懷、法律咨詢?cè)葞椭?/p>
綜上,算法推薦系統(tǒng)的良好運(yùn)轉(zhuǎn)離不開人工運(yùn)營(yíng)的參與。從算法原理的公開,到多樣化機(jī)制的探索,再到平臺(tái)治理的全方位護(hù)航,一系列算法治理舉措不僅提升了用戶體驗(yàn),助力破解“信息繭房”困局,也保障了內(nèi)容的真實(shí)可靠與健康向上。未來(lái),隨著技術(shù)的不斷進(jìn)步與網(wǎng)絡(luò)環(huán)境的持續(xù)變化,共建清朗網(wǎng)絡(luò)空間需要更多平臺(tái)與網(wǎng)友的積極參與,各方攜手推動(dòng)互聯(lián)網(wǎng)行業(yè)高質(zhì)量發(fā)展,為營(yíng)造風(fēng)清氣正的網(wǎng)絡(luò)空間持續(xù)貢獻(xiàn)力量。
