2017年5月18日 星期四

雙 11 期間的 1.7 億個 BANNER,都出自阿里的設計人工智慧「魯班」

隨著人工智能時代的到來,設計與人工智能的糾葛,藝術與科技的博弈,越來越頻繁地現身熱門話題榜。而在設計人工智能領域,阿里巴巴已經開始加速探索。
就像那句廣為流傳的「Talk is cheap, show me the code」,他們也真的在去年「雙 11」期間,show 出了 1.7 億由阿里的設計人工智能產品「魯班」設計的 banner(廣告橫幅)。所以,懷著對科技既畏又愛的心,我們找「魯班」的產品設計負責人樂(yue)乘聊了聊。
阿里巴巴 AI 設計專案負責人樂乘(吳春松)
Q= 特贊 Tezign
A= 樂乘

Q: 請您先自我介紹一下吧?

A: 我在阿里花名樂乘,是淘寶 UED 的產品設計師,也是阿里人工智能設計產品「魯班」的負責人,我們做的事情是 人工智能技術與商業設計結合,並且落地成商業產品。

Q: 您之前的專業就是設計嗎?在阿里多久了?

A: 不是的,我大學是學建築環境,07 年畢業後「不務正業」進入體驗設計行業。我們這一批做交互的人很多不是科班出身,有很多心理學、工業設計背景的。我大學時開始接觸互聯網,自己設計網頁,也做過站長。畢業後,我先在一個媒體網站做了兩年交互,09 年加入淘寶,也就是阿里開始實施「大淘寶」戰略的時候。那會兒體驗設計在國內剛剛興起,騰訊和淘寶兩個 UED 團隊在圈內影響力很大,專業度很高,機緣巧合,最後選擇了淘寶。

Q: 加入阿里之後的經歷是怎樣的?

A: 我已經在阿里工作 8 年了,前幾年主要做搜索,後來開始做手淘。2015 年「雙 11」後,我們在內部發起了一個人工智能設計的項目,主要開發的產品就是「魯班」。我們是大公司內部創業加研究新技術的團隊,隨著產品和團隊逐漸壯大,現在團隊演進為「阿里智能設計實驗室」。
阿里智能設計實驗室 Logo

Q: 這個團隊成立的契機是什麼?

A: 團隊其實是自下而上發起的,在 15 年的「雙 11」我是會場項目負責人,跟工程和算法兩個團隊有很密切的合作,也在「雙 11」期間建立了深厚的「戰鬥感情」。
在 15 年之前的「雙 11」,商品推薦都是人來控制的,由運營決定給用戶推薦什麼產品,而 15 年那次「雙 11」,是阿里第一次基於算法和大數據,為用戶做大規模的、個性化的商品推薦 ,叫做「千人千面」,是阿里流量分發模式很大的升級和轉型。
「雙 11」結束後,我們(設計、工程和算法團隊)就聚在一起,商量下一年要做些什麼。我們當時想,我們已經做到的個性化推薦,但都是基於白底圖商品推薦,能不能往前邁一步,讓強營銷導向的廣告資源位的設計也「千人千面」呢?
從純商品個性化跨到廣告資源位個性化,中間幾個關鍵的技術點打通之後,我們就著手做了。
「魯班」做出來的 banner

Q: 都是哪幾個關鍵技術點?

A: 一是圖像算法「摳圖」。因為高質量的廣告設計需要把商品圖片摳出來,放到精美的設計主題裡。以前都是設計師給商品摳圖後再做設計,現在我們用機器做海量設計,就得讓機器來做這個事情。我們跟阿里搜索部門做圖像切割的算法團隊合作,處理海量的商品自動摳圖。
第二點是把設計變成「數據」。一張廣告設計圖片是像素組成的「信息」,不是「數據」。我們利用機器把商品、文字和設計主題進行在線合成,這樣 每張廣告圖片就帶上了商品信息,可以根據消費者偏好進行個性化投放 。所以魯班產品上線初期,我們請設計師根據活動主題做了大批量風格確定的模板,證明了這種模式投放效果可以大幅提升點擊率。
第三點就是讓機器學習設計。靠「人肉設計模板」度過了第一個階段,但長遠發展角度我們必須讓機器來做設計。大概是 16 年 8 月份開始的,有一位之前負責淘寶「拍立淘」(在淘寶內通過圖片搜索找同款,隨拍隨找)產品開發的圖像算法專家加入進來,主導整個智能設計的算法框架。
設計數據化

Q: 中間有踩坑嗎?

A: 有的,因為我們在做一件很新的事情,行業裡沒有什麼參考對象,只能不斷試錯。剛開始的時候,我們的數據不太夠,就制定了很強的設計規則去控制,結果就是機器要么跑不出設計結果,要么設計出來的結果很失控。設計是有無窮可能性的,靠弱數據強規則必然走不通。意識到這一點以後,我們就集中精力去解決數據問題,把內部設計師電腦裡的設計圖和供應商的設計圖都收集過來。

Q: 這麼多圖片散落在這麼多電腦裡,怎麼收集和整理啊?

A: 我們有自己開發的設計協同工具「設計板」,有點類似 Slack(一款協作辦公應用),但是是專門用於設計協同的。這樣才能方便我們大批量、規模化的找到這些數據。
Q: 收集起來也還是很亂啊。
A: 是的,所以就遇到了第二個挑戰,就是數據清洗和輸入機器,因為收集過來的數據是很雜亂的。比如「雙 11」期間「魔性」的設計風格跟無印良品這種「性冷淡」風格差異很大,這是完全不一樣的品牌調性和設計需求。我們花了很大的力氣去整理和建立了一套數據體系去管理設計數據,讓機器生產出更匹配的結果。
設計智能化

Q: 有人說「魯班」沒有達到設計人工智能的階段,只是「大數據生產」,您如何看待這個說法?

A: 現在講 AI ,外界很難感受到機器的智能含量多高、體現在什麼地方,但我也不太同意「大數據生產」這一說,我覺得這個疑問涉及兩個核心的,也是最基本的問題:一是什麼叫設計智能,二是怎麼評價機器是否具備了設計智能 。
AI 目前有幾個主要方向,一個是「識別」,像語音識別、圖像識別;另一個是「生成」,也就是我們在做的,從無到有創造東西,讓機器能根據請求生成符合特定要求的結果。我們把我們的智能設計定位為:可控的圖像生成技術。我們可以結合技術框架和原理來理解,我會在 UCAN 大會上詳細講。

Q: 那在這裡先給我們簡單講講?

A: 也可以。在整個生成過程中,有 4 個核心步驟。
第一步,讓機器理解設計是什麼構成的 :我們通過人工數據標註,對設計的原始文件中的圖層做分類,對元素做標註。設計專家團隊也會提煉設計手法和風格。通過數據的方式告訴機器這些元素為什麼可以放在一起,我們把專家的經驗和知識通過數據輸入。這部分核心是深度序列學習的算法模型。
第二步,建立元素中心 :當機器學習到設計框架後,需要大量的生產資料。我們會建立元素庫,通過機器做圖像特徵提取,然後分類,再通過人工控製圖像質量以及版權問題,我們買了有版權的圖庫,也是希望從一開始就避免版權方面的糾紛。
第三步,生成的系統 :原理有點像 Alpha Go 下圍棋。我們在設計框架上構建起虛擬畫布,類似棋盤,生成的系統把元素中心的元素往棋盤放,在這裡我們採用了「強化學習」,就好像你在家裡放一台掃地機器人,讓它自己跑,跑個幾圈,它自己會知道哪裡有障礙要避開。在強化學習的過程中,機器參考原始樣本,通過不斷嘗試,得到一些反饋,然後從中學習到什麼樣的設計是對的、好的。
第四步,評估的系統 :我們會抓取大量設計的成品,從「美學」和「商業」兩個方面進行評估。美學上的評估由人來進行,這方面有專業眾包公司;商業上的評估就是看投放出去的點擊率瀏覽量等等。












4 個核心步驟

Q: 明白了,所以您覺得「魯班」的最大優勢是什麼?

A: 我覺得 「魯班」是商業和技術兩方面的比較好的結合產物 。首先在技術深度方面,它有門檻很高的一套系統,另外在商業方面,它的確能通過「智能化」和「個性化」,實現商業價值最大化,顛覆傳統方式。

Q: 聽說去年「雙 11」,「魯班」設計了 1.7 億個 banner,你怎麼看這個「歷史事件」?

A: 其實這 1.7 億個 banner 是有設計強干預的,因為「雙 11」的風格是比較確定而且需要嚴格執行,所以設計師製作了很多「雙 11」特定風格的固定模板。機器在這個基礎上,把調整尺寸這些行為進行優化,節省了尺寸拓版的人力。用機器生成億級設計從而帶來商業效果提升,總體來說也是一次非常成功的應用實踐。我想未來的「雙 11」仍然會是設計師帶著機器做設計的模式,重大活動中 設計機器是提升效率的助理角色。

Q: 取得了這麼大的成功,阿里內部如何評價「魯班」呢?另外,「魯班」把 banner 都「擼」完了,原來做 banner 的人怎麼辦?

A: 引用阿里 CEO 的話——「魯班是數據業務化的代表」,之前我們有很多數據,但都是閒置的或者利用效率不高的,比如海量的商品圖,而「魯班」把數據變成了業務,通過大規模設計加精準投放,提高每個廣告位的資源效率,帶動了流量的效率和業務價值,點擊率是翻倍的,收益也接近翻倍。人員倒沒有出現縮減,只是做的事情有調整了,要 學習這套系統,學習如何訓練機器,同時在美學方面做把控 。
從「設計思維」到「數據思維」

Q: 說到這裡,好像漏了一個很重要的問題,為什麼這個產品要叫「魯班」?聽說是「擼一個 banner」的諧音?

A:(笑)當時我們開玩笑說要「讓天下沒有難擼的 banner」,諧音就是「魯班」,後來發現簡直太合適了,魯班不僅本身是個偉大的工匠,也是很多工具的發明人,所以他的理念跟我們做的事情是不謀而合的,我們也希望發明工具,讓設計師更好地工作。
「魯班」的 Logo

Q: 感覺你們也是一群大神,你們團隊現在有多大?

A: 我們現在有十幾個人。

Q: 只有十幾個?!

A: 對,有設計、算法和工程三個部分,成員大部分是 80 後,現在也有 90 後加入了,我們對計算機視覺領域的人一直是求賢若渴的(歡迎大家投簡歷)。因為是在阿里內部獨立做研究,所以團隊氛圍跟很多小型創業公司很像,大家都很有熱情、很果斷、行動力很強。

Q: 現在看來,你們的方向已經很清晰,那下個階段要攻克的挑戰是什麼?

A: 主要有兩個吧,一是要 讓智能設計去影響阿里設計生態 ,讓「魯班」能服務百萬量級的商家和設計師。一開始在內部推進「魯班」的時候,我們也面臨過阻力。傳統的方式就是,設計一個 banner,放很多商品,顯得很熱鬧,而「魯班」做出來的 banner 上就是單件商品,但與消費者是相關的,因為是基於算法精準推薦的,是你會感興趣的,只是這樣就要把商品放大、顯眼,可能在設計上就不夠美。但最後,我們讓數據說話,確實後者給業務帶來了很好的增長。這個教育過程是比較長的,在內部我們可以做,但面對百萬商家和設計師如何去做?這是我們的挑戰。
第二個挑戰是數據算法本身的持續升級。AI 行業每年都會有很大的變化,新的技術不斷湧現出來,如何跟上最新的技術?這也是我們始終不能鬆懈的點。





參考連結:

1. https://buzzorange.com/techorange/2017/04/28/alibaba-ai/


沒有留言:

張貼留言