如今,隨著人工智能、大數據等新一代信息技術的發展,消費、娛樂、教育、醫療等越來越多的傳統行業紛紛搭上了“互聯網+”的快車,文字、圖片、音頻、視頻等內容產業也呈現出“井噴”的態勢。
進入5G時代,互聯網的入口將呈現指數級的增長,意味著將來內容分發的場景會變得無比豐富,對內容需求量也會越來越大,而內容創作的門檻在不斷降低,如何把控內容的風險,既是一個挑戰,也是一個巨大的商機。
內容風控產業正成為一種“基礎實施需求”
“當越來越多高價值的業務放到網上,在線化去執行的時候,產生的內容非常巨大,而黑產也就越來越多。所以對於內容風控來說,就像買雲服務或者買水、買電一樣,變成類似基礎設施服務一樣的需求。”
數美科技CTO梁堃認為,傳統意義上的內容生產通常都集中在一些媒體或者創作平台,而如今幾乎每一個有手機的人都是內容的生產者,將產生海量的內容。這種情況下,內容是否合規、是否足夠安全,這些問題就變得非常凸顯。
公開報道顯示,今年以來,國家網信辦先后開展了網絡惡意營銷賬號集中整治、涉未成年人網課平台及網絡環境治理、遏阻“祖安文化”、整治網絡“有償刪帖”“軟色情”傳播等一系列專項行動。事實上,國內各大主流的網絡平台,都曾因為內容風控問題而被約談、被下架、被大量封號,甚至面臨生死考驗。
梁堃說,政府在推動“互聯網+”和科技創新發展的過程中,像衣食住行,教育、金融、醫療等這些傳統行業,都在做自己的業務的在線化,都在用這種新的互聯網的形式來提供自己的服務。“包括做直播、做APP,這些都是跟互聯網公司一模一樣的。所以我們判斷,未來這些基於互聯網的傳統業務將會產生海量的內容。這裡面就存在一個很大的痛點,就是如何保証內容的合規和安全。”
梁堃表示,目前行業已經意識到,內容風控對業務而言正在成為一種基礎設施,后面的投入和需求會持續地變大,會持續地變成每一個行業的剛需。
“內容科技”賦能內容風控行業
“內容科技”主要是指對內容產品的供給與消費鏈條、內容產業的組織與分工模式,產生重大影響的人工智能、大數據、區塊鏈、雲計算、物聯網等各種新興技術,以及由這些技術所催生的新業態、新應用、新服務。
梁堃認為,“內容科技”在內容風控領域以及數據安全、隱私問題等方面的應用會越來越廣泛。
在2020年第二屆中國內容科技創業大賽上,來自數美科技的“天淨——全棧式智能內容識別系統”能夠做到對色情、涉政、毒品、辱罵、暴力等300多個違規標簽的抓取和分級,通過語義分析判別同一信息在不同語境中是否違規,甚至對經過處理后的變聲進行識別,排除音頻中的噪音,提高內容識別的准確率,其中語音識別正確率可高達90%以上。
“比如要識別一張照片是不是暴恐圖片,會同時並行四種模型。首先是圖像場景的分類模型,識別有沒有血腥或者行刑這樣的暴恐元素﹔第二種就是對暴恐敏感人物的人臉檢測模型﹔第三組模型是標志的識別,比如國外的藍鯨游戲標志就會在這個模型中被捕捉到﹔最后會通過第四組模型對文本中的違規信息進行檢測與識別。”
“內容科技”在內容風控行業的應用,能從內容識別到行為識別的全流程違規審查,為客戶提供全棧式的智能內容安全解決方案。比如說網絡廣告黑產,不僅僅從內容層面去識別它的風險,同時也會從賬號的行為層面去識別它是不是一個黑產團伙裡面的成員,去輔助甄別涉黃、涉賭等違規內容。
內容與科技互相促進、相互賦能
“內容和科技永遠是相互促進的過程。”
梁堃認為,從技術層面來說,正是內容理解動機的存在助推著科技的進步。“海量的內容信息下,人工檢索的成本巨大,使用技術以更好的理解內容是現階段我們在做的事。通過技術輔助內容生成甚至創作內容,是下階段科技發展的目標。”
在他看來,但僅靠科技生成的內容一定是冷冰冰的,所以需要內容行業從業者們把科技作為一種工具大膽的使用。簡單模版化內容的生成可以靠技術手段來做,情感、藝術類等創造性的內容仍需要人工完成。
“未來有多少內容,決定了內容科技的市場和前景﹔生成的內容質量,也會決定內容科技企業在市場的位置。”梁堃表示,目前科技對內容產業的理解深度還不夠,同時還存在內容的隱私及版權問題,“這是內容科技行業的兩大挑戰,但機會也跟著挑戰”。
一種更好的內容理解方案,就意味著一種巨大的競爭優勢。梁堃認為,中國內容科技創業大賽是內容科技企業展示自身技術和創新能力的一個舞台,也是給創業者提供了一個競技交流的機會,能夠讓創業者去發現新的技術,發現新的機遇。