直通屏山|福建|時(shí)評(píng)|大學(xué)城|臺(tái)海|娛樂(lè)|體育|國(guó)內(nèi)|國(guó)際|專(zhuān)題|網(wǎng)事|福州|廈門(mén)|莆田|泉州|漳州|龍巖|寧德|南平|三明
您所在的位置:: 東南網(wǎng) > 首頁(yè)> 黨政網(wǎng)群> 福建記協(xié) > 正文

面對(duì)海量信息 如何實(shí)現(xiàn)內(nèi)容識(shí)別

2019-08-13 15:54:33??來(lái)源:人民網(wǎng)-傳媒頻道  責(zé)任編輯:肖月青 肖月青  

互聯(lián)網(wǎng)平臺(tái)的出現(xiàn)以及移動(dòng)傳播體系的形成,改變了人類(lèi)內(nèi)容生產(chǎn)和分發(fā)的方式。從形態(tài)上,互聯(lián)網(wǎng)平臺(tái)代替?zhèn)鹘y(tǒng)媒體成為了信息聚合和分發(fā)的樞紐;從傳播關(guān)系看,社會(huì)成員個(gè)體的參與愿望及信息需求,形成了當(dāng)代社會(huì)信息交互的雙輪驅(qū)動(dòng)。反映在內(nèi)容生產(chǎn)與分發(fā)過(guò)程中,現(xiàn)象之一就是互聯(lián)網(wǎng)用戶個(gè)人上傳的各類(lèi)內(nèi)容成為了網(wǎng)絡(luò)空間里一個(gè)海量的存在,以當(dāng)前發(fā)展迅速的短視頻平臺(tái)為例,它們每天都有數(shù)以千萬(wàn)條計(jì)的短視頻內(nèi)容上傳;現(xiàn)象之二是,這樣海量的內(nèi)容只有通過(guò)移動(dòng)終端,面向用戶個(gè)人的差異化信息需求,通過(guò)推送式的精準(zhǔn)分發(fā),才能使人們所生產(chǎn)的信息“各得其所”、“各盡其用”,以充分發(fā)揮不同內(nèi)容的效能。

這一切的前提是內(nèi)容本身是真實(shí)的,健康的。而面對(duì)每天上傳到互聯(lián)網(wǎng)平臺(tái)上數(shù)以十萬(wàn)篇計(jì)的文章、千萬(wàn)條計(jì)的短視頻、十億張計(jì)的照片這樣級(jí)別的海量信息,想要鑒別它們的“成色”并實(shí)現(xiàn)推送式的精準(zhǔn)分發(fā),必須充分運(yùn)用人工智能技術(shù)。這也就是為什么習(xí)近平同志在2019年1月25日的中央政治局集體學(xué)習(xí)時(shí)講話中,要求“探索將人工智能運(yùn)用在新聞采集、生產(chǎn)、分發(fā)、接收、反饋中” 。通俗地說(shuō),就是要“互聯(lián)網(wǎng)技術(shù)產(chǎn)生的問(wèn)題,用互聯(lián)網(wǎng)技術(shù)來(lái)解決”。

維護(hù)互聯(lián)網(wǎng)平臺(tái)上內(nèi)容的真實(shí)性和健康性是一個(gè)國(guó)際性課題。前不久,在美國(guó)參與的“數(shù)字時(shí)代的美國(guó)新舊媒體”考察活動(dòng)給了我切身體驗(yàn)。中國(guó)和美國(guó)這兩個(gè)不同社會(huì)制度的國(guó)家,都面臨著互聯(lián)網(wǎng)平臺(tái)帶來(lái)的各種挑戰(zhàn),其中互聯(lián)網(wǎng)內(nèi)容的真實(shí)、健康和安全是最為人們關(guān)注的。在各自國(guó)家政府和社會(huì)公眾的壓力之下,兩個(gè)國(guó)家的互聯(lián)網(wǎng)平臺(tái)都在做出努力來(lái)解決上述問(wèn)題。這些努力的主要方面,就是積極利用人工智能技術(shù),開(kāi)發(fā)對(duì)互聯(lián)網(wǎng)內(nèi)容進(jìn)行審核的應(yīng)用。比較分析的結(jié)果是,中國(guó)的互聯(lián)網(wǎng)平臺(tái)在這一領(lǐng)域居于領(lǐng)先地位。

以國(guó)內(nèi)最大的資訊分發(fā)平臺(tái)今日頭條及其系列產(chǎn)品為例,其反低俗的軟件“靈犬”,經(jīng)過(guò)三次迭代升級(jí),最新版本包括識(shí)別類(lèi)型和模型能力的重要升級(jí),同時(shí)應(yīng)用了“Bert” 和半監(jiān)督技術(shù) ,并在此基礎(chǔ)上使用了專(zhuān)門(mén)的中文語(yǔ)料,使對(duì)存在色情低俗、暴力謾罵、標(biāo)題黨類(lèi)問(wèn)題內(nèi)容的文本識(shí)別準(zhǔn)確率提升至91%,還能支持對(duì)含有色情低俗、血腥暴力成分的圖片的識(shí)別。比較而言,谷歌和臉書(shū)等平臺(tái)對(duì)虛假、低俗類(lèi)信息識(shí)別的技術(shù)路線更多是“重點(diǎn)對(duì)用戶特征(包括個(gè)人級(jí)別特征和組織級(jí)別特征)、新聞特征(包括文本特征和傳播特征)和網(wǎng)絡(luò)關(guān)系(包括用戶關(guān)系網(wǎng)、事件關(guān)系網(wǎng)和傳播路徑網(wǎng))這三個(gè)要素進(jìn)行自動(dòng)查驗(yàn)” ,具體而言,更多依靠用戶的反饋和標(biāo)注,以及對(duì)相關(guān)因素的一致性檢驗(yàn),在借助人工智能和大數(shù)據(jù)對(duì)文本本身進(jìn)行更加全面的識(shí)別方面投入不足,從而導(dǎo)致相應(yīng)的技術(shù)能力無(wú)法應(yīng)對(duì)以“深偽(Deepfake)”為代表的偽造信息技術(shù)的發(fā)展。有研究者指出,“瑞士科學(xué)家在一篇論文中就首次對(duì)人臉識(shí)別方法檢測(cè)Deepfake的效果進(jìn)行了較為全面的測(cè)評(píng),嘗試用最前沿的人臉識(shí)別系統(tǒng)去識(shí)別假視頻,結(jié)果錯(cuò)誤率高達(dá)95%。所以當(dāng)前如果要求平臺(tái)對(duì)深度偽造等合成媒體內(nèi)容進(jìn)行識(shí)別和標(biāo)注,在技術(shù)上幾乎是不可能實(shí)現(xiàn)的” 。這一事實(shí)告訴我們,在網(wǎng)絡(luò)傳播中反虛假、反低俗,還是要更多依靠更加先進(jìn)的人工智能應(yīng)用,通過(guò)大數(shù)據(jù)與算法的結(jié)合,提升對(duì)各類(lèi)內(nèi)容(文字、圖片、視頻等)的識(shí)別能力。

當(dāng)前的人工智能,實(shí)質(zhì)上是基于對(duì)人類(lèi)處理各種事務(wù)規(guī)則的算法化,并基于大數(shù)據(jù)提供的深度學(xué)習(xí)資源而實(shí)現(xiàn)的。具體地說(shuō),就是人們根據(jù)對(duì)于客觀事物的認(rèn)識(shí),制定處理相關(guān)事務(wù)的規(guī)則和標(biāo)準(zhǔn),然后找到一組數(shù)學(xué)公式來(lái)模擬這個(gè)過(guò)程,也就是形成算法,再把算法開(kāi)發(fā)成為軟件,就可以用大數(shù)據(jù)來(lái)訓(xùn)練這個(gè)軟件學(xué)會(huì)識(shí)別不同狀態(tài)和情況,達(dá)到比較成熟的水平就可以上線運(yùn)營(yíng),代替人類(lèi)來(lái)工作了。客觀上,在這個(gè)過(guò)程中,關(guān)鍵性的難點(diǎn)在各個(gè)環(huán)節(jié)都存在。如人們制定的標(biāo)準(zhǔn)和規(guī)則是否科學(xué),取決于人們對(duì)相關(guān)事物本身發(fā)展規(guī)律的認(rèn)識(shí)水平。按照馬克思的論斷,“一種科學(xué)只有在成功地運(yùn)用數(shù)學(xué)時(shí),才算達(dá)到了真正完善的地步”。 這需要人們對(duì)客觀規(guī)律有深刻的認(rèn)識(shí),目前在社會(huì)科學(xué)領(lǐng)域這顯然是研究的短板。以筆者本人近年來(lái)對(duì)主流價(jià)值觀如何體現(xiàn)為算法的研究為例,旨在面向個(gè)人推送信息以提高傳播效率的算法,如何在社會(huì)成員個(gè)人對(duì)事件重要性的判斷與社會(huì)主體對(duì)事件重要性的判斷之間建立一致性就是一個(gè)難題。在內(nèi)容審核方面,也存在標(biāo)準(zhǔn)和規(guī)則隨具體場(chǎng)景而變化的情況,如越南戰(zhàn)爭(zhēng)期間著名的反戰(zhàn)新聞?wù)掌掌黧w是一位越南小女孩衣服被汽油彈引燃而渾身赤裸奔跑,就曾經(jīng)因?yàn)椤奥懵丁保?被Facebook誤刪。實(shí)踐中,即使實(shí)現(xiàn)了規(guī)則和標(biāo)準(zhǔn)清晰且正確,還要能夠找到可行的算法,建立較大規(guī)模的數(shù)據(jù)庫(kù),還要有算力的支持。如靈犬3.0,就投入了更大的算力。從上述過(guò)程看,利用人工智能的深度學(xué)習(xí)來(lái)解決虛假、低俗內(nèi)容充斥網(wǎng)絡(luò)空間的問(wèn)題,是一個(gè)具有相當(dāng)技術(shù)難度的系統(tǒng)工程,需要假以時(shí)日,需要付出更大的努力。

用技術(shù)識(shí)別內(nèi)容如此之難,是不是我們就不要走這條路,靠人工去完成這個(gè)工作呢?很顯然,在互聯(lián)網(wǎng)傳播環(huán)境下,這是不現(xiàn)實(shí)的。當(dāng)前,互聯(lián)網(wǎng)技術(shù)的應(yīng)用,已經(jīng)實(shí)現(xiàn)了在傳播的技術(shù)條件方面對(duì)用戶的普遍賦權(quán),在中國(guó),每天都有數(shù)以億計(jì)的互聯(lián)網(wǎng)用戶活躍在各個(gè)網(wǎng)絡(luò)平臺(tái)上,以短視頻為例,抖音等平臺(tái),每天都有千萬(wàn)條級(jí)別的內(nèi)容上傳,今日頭條平臺(tái)每天經(jīng)審核后發(fā)布的內(nèi)容就超過(guò)60萬(wàn)條。這是無(wú)法完全用人工去處理的。與人工審核相比,機(jī)器審核的優(yōu)勢(shì)在于,機(jī)器一是計(jì)算快,一秒鐘能執(zhí)行百億次計(jì)算;二是存儲(chǔ)大,可以輕松存儲(chǔ)千億以上漢字;三是運(yùn)行穩(wěn)定,不會(huì)因心情、狀態(tài)、對(duì)標(biāo)準(zhǔn)的理解等因素影響處理結(jié)果。據(jù)了解,由于強(qiáng)化內(nèi)容標(biāo)注和審核的需要,今日頭條的母公司“字節(jié)跳動(dòng)”已經(jīng)建立了近萬(wàn)人的審核團(tuán)隊(duì)。在“機(jī)器+人工”審核模式下,我國(guó)主要的互聯(lián)網(wǎng)信息分發(fā)平臺(tái)的內(nèi)容安全得到了較大程度的提升,未來(lái)隨著研究的深入、技術(shù)的進(jìn)步,內(nèi)容審核的水平還會(huì)持續(xù)提升。

?

打印 | 收藏 | 發(fā)給好友 【字號(hào)
今日熱詞
更多>>福建今日重點(diǎn)
更多>>國(guó)際國(guó)內(nèi)熱點(diǎn)
更多>>新聞圖片
關(guān)于我們 | 廣告服務(wù) | 網(wǎng)站地圖 | 網(wǎng)站公告 |
國(guó)新辦發(fā)函[2001]232號(hào) 閩ICP備案號(hào)(閩ICP備05022042號(hào)) 互聯(lián)網(wǎng)新聞信息服務(wù)許可證 編號(hào):35120170001 網(wǎng)絡(luò)文化經(jīng)營(yíng)許可證 閩網(wǎng)文〔2019〕3630-217號(hào)
信息網(wǎng)絡(luò)傳播視聽(tīng)節(jié)目許可(互聯(lián)網(wǎng)視聽(tīng)節(jié)目服務(wù)/移動(dòng)互聯(lián)網(wǎng)視聽(tīng)節(jié)目服務(wù))證號(hào):1310572 廣播電視節(jié)目制作經(jīng)營(yíng)許可證(閩)字第085號(hào)
網(wǎng)絡(luò)出版服務(wù)許可證 (署)網(wǎng)出證(閩)字第018號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 閩B2-20100029 互聯(lián)網(wǎng)藥品信息服務(wù)(閩)-經(jīng)營(yíng)性-2015-0001
福建日?qǐng)?bào)報(bào)業(yè)集團(tuán)擁有東南網(wǎng)采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報(bào)業(yè)集團(tuán)書(shū)面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播
職業(yè)道德監(jiān)督、違法和不良信息舉報(bào)電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報(bào)郵箱:jubao@fjsen.com 福建省新聞道德委舉報(bào)電話:0591-87275327

玖玖资源中文字幕一区二区,久拍国产在线观看,美利坚合众国久久一区,免费中文字幕午夜福利片
日本特黄特色特爽特刺激大片 | 亚洲国产精品不卡Av在线 | 正在播放酒店精品少妇约 | 日韩精品少妇一区二区三区 | 亚洲五月天制服丝袜在线 | 午夜福利小草久久99 |