IJCAI 2018 現場,阿里媽媽以 Ad Tech 為主題舉辦了 Workshop,阿里媽媽資深算法專家朱小強、高級算法專家林偉,分享了將深度學習引入工業級展示廣告和搜索廣告領域的創新與探索。
隨著人工智能產學研的不斷融合,企業與學術會議之間的合作也更加頻繁和多樣。此前,新智元曾經報道過,IJCAI國際廣告算法大賽,中國團隊包攬冠亞季軍。這個競賽實際上就是阿里集團與IJCAI的一個合作項目,阿里通過IJCAI的平臺吸引更多人關注阿里,IJCAI則通過阿里的大賽吸引更多人關注和支持IJCAI。
IJCAI(International Joint Conference on Artificial Intelligence)被認為是人工智能領域最頂級的學術會議之一,涵蓋機器學習、計算可持續性、圖像識別、語音技術、視頻技術等,對全球人工智能行業具有巨大影響力。
今年的合作競賽由阿里媽媽承辦。作為阿里巴巴旗下大數據營銷平臺,阿里媽媽身處于阿里巴巴龐大的交易場景之中,在人工智能領域也早有布局,構建了超大規模的學習模型,每天訓練近100T的數據,有上千億的樣本。
IJCAI 2018 現場,阿里媽媽以 Ad Tech 為主題開展了workshop。阿里媽媽資深算法專家朱小強、高級算法專家林偉,以展示廣告技術的兩個最重要技術模塊——Matching和Ranking為例,分享了他們在將深度學習引入工業級展示廣告和搜索廣告領域所做的創新與探索。
深度學習將業界技術迭代提升10~100倍
朱小強在演講中表示,展示廣告是互聯網行業的主要營銷模式之一。阿里巴巴有各種不同的展示廣告形式,比如橫幅、單品、信息流帖子等等。每天有數億的用戶訪問阿里的系統,團隊需要針對每位用戶的個性化興趣偏好,在幾十毫秒內,從數千萬廣告集合中,尋找最優匹配結果進行展示。
超大規模的數據以及問題的高度非線性,對展示廣告技術構成了巨大的挑戰。過去兩年里,阿里媽媽團隊創造性地將深度學習引入到展示廣告技術中,自主研發了一系列面向工業級尺度的端到端深度模型,推動了展示廣告技術的全面革新,達到了世界領先的水平。
朱小強認為,深度學習給工業界掀起了一場生產力革命。在深度學習時代,模型的設計變成組件化,優化的方法變成標準化,而且設計和優化是解耦的。這些特點驅動了以深度學習為代表的AI技術迅速普及,而且將整個業界的技術迭代速度提升了1-2個數量級。
“過去兩三年,深度學習在廣告、搜索和推薦等核心工業界場景中野蠻生長,掀起了一股1.0的掘金浪潮;未來,我們判斷深度學習將進一步完善為工業級基礎設施,邁入2.0的工匠時代,技術的發展將由粗獷顛覆轉變為精細化打磨。”
朱小強說:“10多年前,機器學習大規模地被引入到核心工業領域,由此開創了一個技術的黃金發展周期,我們預期深度學習技術會繼續引領新的一輪技術增長。”
基于圖的深度學習方法有廣闊的應用空間
林偉在演講中表示,搜索廣告場景下,傳統的觀點一直認為匹配(Matching)的主要優化目標是尋找最相關的候選廣告集。他們團隊重新定義了這個目標,認為在電商場景下,Matching的主要優化目標是尋找相關性滿足約束下,最符合業務目標(例如期望收益等)的候選廣告集。基于對目標的重新認識,最近幾年Matching算法的改進,大幅提升了直通車的營收。
林偉介紹,Matching主要問題可抽象為:1)對用戶意圖和候選廣告之間是否可以建立鏈接的識別,以及2)對鏈接強度的預測。
圖(Graph)是一種非常適合用來刻畫這個問題的結構,基于圖的深度學習方法在Matching上擁有廣闊的應用空間。
目前,阿里媽媽已經構建了一套支持超大規模異構圖表征學習的算法,并在Matching上成功落地。未來,他們將進一步深耕圖深度學習(Graph-based Deep Learning)的方法及應用。
如今在淘寶場景中,圖像因素越來越重要,用戶的行為模式也越來越復雜。對于排序問題(Ranking),傳統的一些模型在識別用戶意圖上存在諸多限制,需要更精巧和更強大的模型來更好地理解用戶。阿里媽媽團隊分別提出了很好的圖像網絡和記憶網絡設計方法,增加Ranking模型識別用戶意圖的能力,經過實際測試都取得了不錯的效果。
同時,此前在戛納國際創意節首發的AI智能文案,在IJCAI也再度引發關注。這個產品基于深度神經網絡的Sequence2Sequence模型,融合了注意力機制、位置編碼、copy機制等,讓機器模仿人寫文案。
朱小強認為,“技術本身并不復雜和高深,但因為做到了從場景的實際需求出發,用技術和算法來驅動優化,也讓技術和算法施展出最大的空間。”
本屆 IJCAI 大會首席贊助官、悉尼科技大學杰出教授張成奇,阿里巴巴人工智能實驗室研究員聶再清也到場做了分享。